4. diel - InfoPackage, nahranie dát do PSA
V minulej lekcii, Aplikačné komponenta a DataSource v SAP , sme si vysvetlili, že dátové zdroje v SAP BW vkladáme do aplikačných komponentov a vytvorili si prázdnu PSA. Dnes sa pozrieme na ďalší SAP objekty, ktorými sú InfoPackage, a ako sa pomocou nich dajú do PSA dáta nahrať.
Založenie InfoPackage
PSA (Persistent Staging Area) je prvá vrstva dátového
skladu, to sme si už vysvätili v minulej lekcii. Tu sú dáta uložené bez
zmeny, ako prišla zo zdroja. Pre predstavu PSA je len a len miesto na uloženie
(prázdna databázová tabuľka), laicky ho môžeme označiť ako
KAM dáta budú uložené. Infopackage potom
predstavuje odpoveď na otázku AKO?. Áno, pomocou Infopackage
sa definuje, ako sa dáta prenesú do PSA z Datasource (dátového zdroja).
Menná konvencie je totožná ako u ostatných SAP objektov,
začiatočné písmeno pri založení by malo byť
Z
, Y
či X
.
Infopackage sa vždy viaže na konkrétny dátový
zdroj, preto v stromovom zobrazení stačí vyvolať pomocou pravého
tlačidla myši menu a vybrať Create InfoPackage
.
Je nutné vyplniť popisok a nový objekt pomocou ikony (SAVE) uložiť.
Ak sa pri uložení ukáže podobné okno ako na obrázku nižšie (žiadosť
o založenie transportu), je všetko v poriadku. Každý nový objekt v SAPu
chce pri založení nejaký transport, aby bolo možné potom objekty z
vývojovej verzie systému protransportovat do produkčného systému. Ale o
tomto si povieme neskôr. Teraz stačí len dole vybrať možnosť
Local Object
. Tým pádom sa objekt nevložia do transportu a
zostáva len a len v danom systéme, na ktorom je používateľ
prihlásený.
)
Nastavenie InfoPackage
Infopackage je teraz možné ešte ďalej nastaviť, prejdeme si jednotlivé záložky:
Dáta Selection
Tu už môžeme pomocou filtrov obmedziť, aké dáta budú nahrané do PSA. Spravidla sa to ale nerobí. Už vieme, že best practice je, že by v PSA mala byť všetky dáta, bez jediného zásahu. Proste a jednoducho surová, ako prišla.
Extraction
V tejto záložke sa už definuje, čo bude zdrojom, či lokálne stanice a nejaký CSV či Excel file, či vzdialený server. Ďalej aké kódovanie bude použité pre preloženie dát, či vstupné dáta obsahujú hlavičku alebo nie a či sa má hlavička ignorovať. Pre naše účely vyberieme najjednoduchší variant - nahranie dát z CVS súboru.
Budú pre nás dôležité údaje:
- Adapter - definuje typ spôsobu nahranie dát (buď z lokálneho súboru či SAP file systému)
- File Name - fyzická cesta k súboru, ale môže byť aj logická (viac na https://wiki.scn.sap.com/...or+Archiving)
- Header Rows to be ignored - riadok, ktorý obsahuje
hlavičku, môže byť preskočí vo vstupných dátach, najčastejšie to je
prvý riadok (
1
). - Character Set String - tu je buď predvolená možnosť
Default Setting
, alebo je možné vybrať druhú možnosťDirect Input
a vybrať aké kódovanie sa použije pre nahranie dát (napr. UTF-8) - Data Format - udáva, ako sa zo súboru získajú dáta. Buď nastavíme, že dáta sú vždy na fixných pozíciách (viac na https://www.ibm.com/...t_about.html), alebo ich získame pomocou oddeľovača (prípad pre CSV súbory), potom sa tu definuje, aký znak (Data separator) je oddeľovač.
Processing
V tejto záložke sa dá nastaviť až kam sa dáta majú nahrať a ako (spravidla len do PSA) a ďalej môžu byť sprocesovanie cez DPT (Data Prozess Transfer) do DSO či do Inprovideru. Záleží, ako je daný dátový model postavený.
Čo je tu zaujímavé, tak štandardne beží nahrávanie paralelne (3 vlákna):
Update
Táto záložka obsahuje nastavenia, koľko dát sa zo zdrojového systému či súboru nahrá. Prakticky sú k dispozícii dve možnosti:
- DELTA update - vždy sa nahrá len časť dát, kde sa podľa nejakých pravidiel určí (záleží, ako je dátový zdroj nastavený), čo už nahrané bolo a donahraje sa iba rozdiel. Príkladom môže byť časová známka u záznamov.
- FULL update - táto voľba znamená, že sa nahrá vždy všetko (Pozor: ak takto nastavený update spustíte 2x za sebou, môžu potom vzniknúť duplicity v PSA a problémy v spracovaní dát ďalej).
Schedule
Ak sme všetko naklikali správne a nový Infoobjekt uložili, tak tu sa
pomocou tlačidla START
ručne spustí nahrania
dát.
Už nevyskočí žiadne nové okno, len malá hláška v info oblasti:
Overenie nahraných dát v PSA
Teraz sa pozrieme, či sa dáta nahrala a hlavne ako. Otvoríme si (dvojklikom) PSA a hore sa aktualizuje menu:
1. možnosť
Každý objekt v SAPu je vo finále uložený v tabuľke a alebo ich priamo
tabuľkou. To platí aj v prípade PSA. SAP vygeneroval pre náš dátový zdroj
Z_ITNETWORK
tabuľku /BIC/B0006288000
, do ktorej sa
dá prekliknúť a zobraziť obsah (Pozn .: toto je rýchlejšia cesta, ako si
zobraziť obsah, ale štandardné je postup, ktorý bude nasledovať). Otvoríme
technické atribúty objektu a preklikne sa ďalej:
Klikneme na obsah tabuľky:
V novom okne sa už zobrazí všetky polia tabuľky (PSA), je tu možné filtrovať výsledný obsah. Po kliknutí na hodiny sa zobrazí už obsah PSA:
Obsah PSA
Ako je vidieť, prvá 4 modré stĺpce si SAP vytvoril sám, ide o primárne kľúče tabuľky a užívateľ na ne nemá žiadny vplyv. Preto je akékoľvek hľadanie v PSA veľmi pomalé, neexistuje totiž žiadny index (užívateľský), vďaka ktorému by hľadanie šlo urýchliť.
Nákupný CSV filu a nahraných dát
Navrchu je obsah PSA a dole obsah CSV. Je vidieť, že sa nahranie podarilo, v zdroji aj v cieli máme 4 riadky:
2. možnosť
Druhou možnosťou je zobraziť si dáta cez štandardné údržbu PSA vrstvy. Klikneme na ikonu a zobrazí sa nové okno, kde je zoznam všetkých Request (nahranie) do PSA. Pomocou bočného tlačidla vyberieme request, ktorý chceme zobraziť, a opäť rovnakú ikonou, teraz dole v okne, potvrdíme.
Pri nahrávaní do PSA ešte systém rozdeľuje dáta do tzv.
package
, čiže pakety
. Preto je nutné opäť pomocou
bočného tlačidla vybrať pakety, ktoré majú byť zobrazené. V ponuke
nižšie, ak je počet dát veľký, je potrebné zmeniť z defaultný hodnoty
1000
na väčší počet, aby výsledok nebol orezaný. Nakoniec
stačí potvrdiť háčikom:
Nákupný CSV filu a nahraných dát
Navrchu máme obsah PSA a dole obsah CSV. Je vidieť, že sa nahranie podarilo, máme v zdroji aj v cieli 4 riadky.
Ako vidíte, prvá možnosť ponúka:
- filtrovať všetky polia a analyzovať obsah PSA pomocou štandardných utilít tabuliek
- rýchlejší prístup k obsahu
Druhá možnosť potom umožňuje:
- spravovať request nahranie dát
- odmazávať nahrané request
- filtrovať podľa paketov
- zdĺhavejšie zobrazenie obsahu
Týmto sme si ukázali a vysvetlili čo je Infopackage a ako sa nahrávajú dáta do PSA. Nabudúce sa pozrieme na Dáta Store Object (DSO) v SAP .