25. diel - PostgreSQL - Fulltextové vyhľadávanie - Fulltextový index
V predchádzajúcej lekcii, PostgreSQL - Fulltextové vyhľadávanie , sme si predstavili fulltextové vyhľadávanie v PostgreSQL databázach a pozreli sa na jeho výhody oproti klasickému hľadaniu.
V dnešnom PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania, čím si zlepšíme možnosti vyhľadávania v slovenskom jazyku. A tiež našu databázu rozšírime o fulltextový index.
Všetko si ukážeme na databáze databaze_pro_web
.
Ak už túto databázu nemáte, tak si jej aktuálnu verziu môžete stiahnuť
pod článkom a naimportovať.
Konfigurácia textového vyhľadávania
Konfigurácia textového vyhľadávania riadi mieru a spôsob redukcie dokumentov a vyhľadávaných výrazov natsvector
a tsquery
. Každá takáto konfigurácia je
definovaná týmito zložkami:
- Slovníky - používajú sa na odobratie slov, ktoré by sa nemali uvažovať pri hľadaní (tzv. stop slova). A ďalej k normalizácii slov, aby sa rôzne odvodené formy rovnakého slova zhodovali. Úspešne normalizované slovo sa nazýva lexém. Jedna konfigurácia môže obsahovať pokojne aj viac slovníkov.
- Parser (analyzátor) - slúži na rozdelenie textu na tzv.
tokeny, teda jednotlivé slová alebo frázy. Tieto tokeny
nadobúdajú rôzne dátové typy, podľa toho v akom formáte sú dané slová
alebo frázy, napr. máme typy
asciiword
,word
,hword
,hword_part
,email
,url
,int
a ďalšie.
Tvorba slovníka
Slovníky sa v PostgreSQL tvoria podľa šablón.Šablóny poskytujú funkcie, pomocou ktorých sa slovníky vytvárajú z odovzdaných súborov s požadovanými dátami. Ide napr. o súbory so stop slovami, predponami, príponami, synonymami, atď.
Šablóny si môžeme sami vytvoriť alebo využiť už predpripravené od PostgreSQL:
...koniec náhľadu článku...
Pokračuj ďalej
Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Obmedzená ponuka: Nauč sa všetko a ušetri
Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Neobmedzený a trvalý prístup k jednotlivým lekciím.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania a fulltextový index.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.