Zarábaj až 6 000 € mesačne! Akreditované rekvalifikačné kurzy od 0 €. Viac informácií.

18. diel - Práce se soubory DocX v Pythonu - Čtení a struktura

V následujícím tutoriálu práce se soubory v Pythonu se zaměříme na čtení souborů formátu .docx. Využijeme k tomu opět knihovnu python-docx.

Čtení již existujících DocX dokumentů

Dosud jsme vytvářeli zcela nové dokumenty. Teď jsi ukážeme, jak můžeme přečíst obsah již existujících dokumentů. Našim cílem bude vytvořit kód, který nám poskytne základní přehled o požadovaném dokumentu. Konkrétně nás budou zajímat následující informace:

  • text obsažený v dokumentu,
  • unformace o jednotlivých obrázcích,
  • informace obsažené v tabulkách.

Připomeňme si, že informace v .docx souboru jsou uložené ve formátu XML. My tedy potřebujeme vytvořit kód, který nám tyto informace extrahuje. Proto je nezbytné mít základní povědomí o tom, jak vypadá struktura XML souboru, jak jej používá MS Word. Využijeme k tomu znalosti z lekce Úvod do formátu XML v Pythonu.

Struktura a hierarchie XML souboru formátu .docx


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom za exkluzívnu cenu 110 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 25 článkom (22 lekcií, 2 praktické cvičenia, test) s kontrolou a certifikáciou a ešte naviac ušetríš 441 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 80% zľavu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tomto tutoriálu práce se soubory DocX v Pythonu si ukážeme, jako pomocí knihovny python-docx číst dokumenty. Ukážeme si taky základy XML struktury.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jakub Jakubec
Avatar
Aktivity