IT rekvalifikácia. Seniorní programátori zarábajú až 6 000 €/mesiac a rekvalifikácia je prvým krokom. Zisti, ako na to!

25. diel - PostgreSQL - Fulltextové vyhľadávanie - Fulltextový index

V predchádzajúcej lekcii, PostgreSQL - Fulltextové vyhľadávanie , sme si predstavili fulltextové vyhľadávanie v PostgreSQL databázach a pozreli sa na jeho výhody oproti klasickému hľadaniu.

V dnešnom PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania, čím si zlepšíme možnosti vyhľadávania v slovenskom jazyku. A tiež našu databázu rozšírime o fulltextový index.

Všetko si ukážeme na databáze databaze_pro_web. Ak už túto databázu nemáte, tak si jej aktuálnu verziu môžete stiahnuť pod článkom a naimportovať.

Konfigurácia textového vyhľadávania

Konfigurácia textového vyhľadávania riadi mieru a spôsob redukcie dokumentov a vyhľadávaných výrazov na tsvector a tsquery. Každá takáto konfigurácia je definovaná týmito zložkami:
  • Slovníky - používajú sa na odobratie slov, ktoré by sa nemali uvažovať pri hľadaní (tzv. stop slova). A ďalej k normalizácii slov, aby sa rôzne odvodené formy rovnakého slova zhodovali. Úspešne normalizované slovo sa nazýva lexém. Jedna konfigurácia môže obsahovať pokojne aj viac slovníkov.
  • Parser (analyzátor) - slúži na rozdelenie textu na tzv. tokeny, teda jednotlivé slová alebo frázy. Tieto tokeny nadobúdajú rôzne dátové typy, podľa toho v akom formáte sú dané slová alebo frázy, napr. máme typy asciiword, word, hword, hword_part, email, url, int a ďalšie.

Tvorba slovníka

Slovníky sa v PostgreSQL tvoria podľa šablón.

Šablóny poskytujú funkcie, pomocou ktorých sa slovníky vytvárajú z odovzdaných súborov s požadovanými dátami. Ide napr. o súbory so stop slovami, predponami, príponami, synonymami, atď.

Šablóny si môžeme sami vytvoriť alebo využiť už predpripravené od PostgreSQL:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom za exkluzívnu cenu 1 007,50 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 47 článkom (28 lekcií, 10 testov, 9 praktických cvičení) s kontrolou a certifikáciou a ešte naviac ušetríš 543 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 35% zľavu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania a fulltextový index.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Radek Vymětalík
Avatar
...
Aktivity