14. diel - DocX - Práca s dokumentmi MS Word v C# .NET
V predchádzajúcom cvičení, Riešené úlohy k 11.-13. lekciu práce so súbormi v C# .NET, sme si precvičili získané skúsenosti z predchádzajúcich lekcií.
V dnešnom C# .NET tutoriále si uvedieme formát
docx
a rozpracujeme jednoduchý editor Microsoft Word súborov.
Formát DocX
DocX
je formát používaný editorom MS Word z populárneho
kancelárskeho balíka MS Office. Na rozdiel od čisto
textových dokumentov ukladá nielen text, ale aj jeho
formátovanie ako veľkosť, font, farbu a tak ďalej. Môžeme
doň vkladať aj obrázky, tabuľky a ďalšie položky. Tento formát je
definovaný špecifikáciou Office Open XML.
Špecifikácia Office Open XML
Táto špecifikácia definuje súborové formáty na ukladanie textových dokumentov, tabuliek či prezentácií používaných nielen v aplikáciách Office od Microsoftu. Tieto formáty sú v podstate súbory ZIP s XML dokumentmi vo vnútri, ktoré nesú samotné dáta. Táto špecifikácia je rozdelená do niekoľkých častí. Spomeňme si tie najdôležitejšie:
- WordProcessingML - XML pre textové dokumenty, vytvárané
napríklad v aplikácii MS Word. Ukladá sa do súboru s príponou
docx
. - SpreadsheetML - XML pre tabuľky, vytvárané napríklad v
aplikácii MS Excel. Ukladá sa do súboru s
príponou
xlsx
. - PresentationML - XML pre prezentácie, vytvárané
napríklad v aplikácii MS PowerPoint.
Ukladá sa do súboru s príponou
pptx
.
WordProcessingML
Ako už bolo povedané, tak každý docx
súbor je ZIP so XML
(WordProcessingML) súbormi vo vnútri, preto ich môžeme rovnako ako každý
ZIP extrahovať. Skúsme si schválne vytvoriť nejaký dokument v MS Word a
potom ho extrahovať napríklad zmenou prípony z .docx
na
.zip
.
V novo vzniknutom priečinku sa okrem ďalších nachádza zložka
word\
s XML dokumentom document.xml
. Keď si ho
otvoríme, uvidíme približne takúto štruktúru:
...koniec náhľadu článku...
Pokračuj ďalej
Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Obmedzená ponuka: Nauč sa všetko a ušetri
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Neobmedzený a trvalý prístup k jednotlivým lekciím.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V C# .NET tutoriále sa naučíme pracovať so súbormi aplikácie MS Word a rozpracujeme jednoduchý editor docx súborov.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.