IT rekvalifikácia. Seniorní programátori zarábajú až 6 000 €/mesiac a rekvalifikácia je prvým krokom. Zisti, ako na to!

10. diel - Shlukovací algoritmus K-Means v Pythone

V minulej lekcii, Les rozhodovacích stromov v Pythone , sme sa v našom kurze venovali lesu rozhodovacích stromov. V tomto tutoriále o strojovom učení sa pozrieme na algoritmus z rodiny algoritmov "učenie bez dohľadu" a tým je K-Means. Tento algoritmus nepotrebuje poznať náš požadovaný výstup, ale postupným iterováním rozdelí dáta do K skupín, čo je parameter, ktorý definujeme. Týmto spôsobom môže algoritmus nájsť ďalšie vzory alebo vzťahy v dátach, ktorých si nemusíme ani všimnúť.

K-Means môžeme využiť v reálnom svete napríklad k rozdeleniu zákazníkov do K skupín, kde každá skupina bude mať vždy niečo spoločné (napr. Tí, čo nakupujú topánky, čo nakupujú pravidelne, sviatočné nakupovacích, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže len kto do akej skupiny patria, ale nie čo majú za unikátnu vlastnosť / čo majú spoločné. To tiež uvidíme v praktickej ukážke v Pythone.

Ako funguje shlukovací algoritmus K-Means

Povedzme, že máme nasledujúce body a chceme ich rozdeliť do K skupín. Metódou KV (pozriem a vidím) si môžeme všimnú, že sú tu 2 skupiny bodov a môžeme ich jednoducho rozdeliť:

Skupiny vyzerajú takto:

Centroid

Algoritmus K-Means ale nevie, koľko je tu potenciálnych skupín ani kde každá z nich leží. Každá skupina (ich počet definuje parameter K) má svoj Centroid, čo je


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 675 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 22 článkom (18 lekcií, 4 testy) tohoto kurzu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V Python tutoriále si predstavíme algoritmus K-Means z rodiny algoritmov Učenie bez dohľadu. Rozdelíme si pomocou neho Iris dataset a otestujeme jeho presnosť.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity