IT rekvalifikácia. Seniorní programátori zarábajú až 6 000 €/mesiac a rekvalifikácia je prvým krokom. Zisti, ako na to!

14. diel - DocX - Práca s dokumentmi MS Word v C# .NET

V predchádzajúcom cvičení, Riešené úlohy k 11.-13. lekciu práce so súbormi v C# .NET, sme si precvičili získané skúsenosti z predchádzajúcich lekcií.

V dnešnom C# .NET tutoriále si uvedieme formát docx a rozpracujeme jednoduchý editor Microsoft Word súborov.

Formát DocX

DocX je formát používaný editorom MS Word z populárneho kancelárskeho balíka MS Office. Na rozdiel od čisto textových dokumentov ukladá nielen text, ale aj jeho formátovanie ako veľkosť, font, farbu a tak ďalej. Môžeme doň vkladať aj obrázky, tabuľky a ďalšie položky. Tento formát je definovaný špecifikáciou Office Open XML.

Špecifikácia Office Open XML

Táto špecifikácia definuje súborové formáty na ukladanie textových dokumentov, tabuliek či prezentácií používaných nielen v aplikáciách Office od Microsoftu. Tieto formáty sú v podstate súbory ZIP s XML dokumentmi vo vnútri, ktoré nesú samotné dáta. Táto špecifikácia je rozdelená do niekoľkých častí. Spomeňme si tie najdôležitejšie:

  • WordProcessingML - XML pre textové dokumenty, vytvárané napríklad v aplikácii MS Word. Ukladá sa do súboru s príponou docx.
  • SpreadsheetML - XML pre tabuľky, vytvárané napríklad v aplikácii MS Excel. Ukladá sa do súboru s príponou xlsx.
  • PresentationML - XML pre prezentácie, vytvárané napríklad v aplikácii MS PowerPoint. Ukladá sa do súboru s príponou pptx.

WordProcessingML

Ako už bolo povedané, tak každý docx súbor je ZIP so XML (WordProcessingML) súbormi vo vnútri, preto ich môžeme rovnako ako každý ZIP extrahovať. Skúsme si schválne vytvoriť nejaký dokument v MS Word a potom ho extrahovať napríklad zmenou prípony z .docx na .zip.

V novo vzniknutom priečinku sa okrem ďalších nachádza zložka word\ s XML dokumentom document.xml. Keď si ho otvoríme, uvidíme približne takúto štruktúru:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom za exkluzívnu cenu 547,50 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 26 článkom (18 lekcií, 4 testy, 4 praktické cvičenia) s kontrolou a certifikáciou a ešte naviac ušetríš 173 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 24% zľavu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V C# .NET tutoriále sa naučíme pracovať so súbormi aplikácie MS Word a rozpracujeme jednoduchý editor docx súborov.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Lukáš Michalik
Avatar
jako Autor se věnuje C#, tvorbě her v C++ a JavaScriptu
Aktivity