Vianoce v ITnetwork sú tu! Dobí si teraz kredity a získaj až 80 % extra kreditov na e-learningové kurzy ZADARMO. Zisti viac.
Hľadáme nové posily do ITnetwork tímu. Pozri sa na voľné pozície a pridaj sa k najagilnejšej firme na trhu - Viac informácií.

7. diel - Data Mining - Vyhodnotenie produkcie odpadu - Príprava dát

V minulej lekcii, Data Mining - Systémy na dobývanie znalostí z databáz , sme sa zoznámili so systémami na dobývanie znalostí z databáz.

V tomto tutoriále Data Miningu začneme pracovať na reálnej úlohe, na ktorej si vyskúšame teoretické základy z predchádzajúcich lekcií. V tejto úlohe budeme vyhodnocovať dáta o produkcii odpadov v dvoch rozdielnych regiónoch. Naše znalosti si vyskúšame na skutočných dátach, ktoré publikovali Ministerstvo životného prostredia SR a Český štatistický úrad. Dáta štatisticky vyhodnotíme pomocou jazyka Python, resp. jeho knižnice Pandas.

Data Mining - Vyhodnotenie produkcie odpadu

V rámci tejto úlohy teda využijeme techniky Data Miningu na určenie existencie štatisticky preukázateľného rozdielu v produkcii odpadu medzi spomínanými regiónmi. Ako sme si už povedali v tejto lekcii, v rámci úlohy typu deskripcie je všeobecne zisťovaná dominantná štruktúra skrytá v dátach. Na výstupe sú požadované zrozumiteľné znalosti, pokrývajúce daný koncept. Inými slovami tak získavame povedomie o dátach ako celku. Postupovať budeme po krokoch podľa metodiky CRISP-DM. Reálne a aktuálne dáta získame z otvorených zdrojov, z ktorých vytvoríme dataset na testovanie v Pythone. Poďme na to.


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom iba za 490 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 16 článkom (13 lekcií, 3 testy) tohoto kurzu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tomto tutoriále si pripravíme podklady pre reálnu úlohu o štatistickom vyhodnotení dát produkcie odpadu.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísala Aneta Siobos
Avatar
Autor se věnuje datové analýze.
Aktivity