Algoritmus internetového vyhľadávača - Indexácia a kanonizácie

V minulom článku o princípe internetových vyhľadávačov sme sa venovali dátovým barelom, ich štruktúre, StopSlovům a nakoniec si popísali Crawler. Dnešný diel je venovaný indexáciu a kanonizáciu dokumentov na internete.

Indexácia

Proces indexácia vykonáva komponenta zvaná Indexer. Jedná sa o špeciálne navrhnutý program, ktorý zo stiahnutých dát (tie dáta, ktoré stiahol Crawler) urobí špeciálny dátový typ určený na vyhľadávanie - barely.

Problém indexácia je v tom, že nemožno dokumenty "chytro" prechádzať, ale je nevyhnutné

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?

Neobmedzený a trvalý prístup k jednotlivým lekciím.
Kvalitné znalosti v oblasti IT.
Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

Článok popisuje proces indexácie dokumente pavúkom a jeho vysporiadanie s duplikácie a plagiáty. Pokračujeme v popise algoritmu fulltextového vyhľadávača.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jan Barášek

Autor článku podniká jako fullstack senior developer v Praze. Za svůj život napsal stovky středních i velkých webů, fungujících dodnes. Během spolupráce nabral hluboké zkušenosti, které na tomto webu předává dál.

Aktivity

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh za exkluzívnu cenu	75 kreditov
Aktuálny stav konta	0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 15 článkom s kontrolou a certifikáciou a ešte naviac ušetríš 51 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 41% zľavu.

Najčastejšie vyhľadávané

Algoritmus internetového vyhľadávača - Indexácia a kanonizácie

Indexácia

Obmedzená ponuka: Nauč sa všetko a ušetri

Popis článku