Kakšna je razlika med integracijo podatkov in ETL - Razlika Med

Kakšna je razlika med integracijo podatkov in ETL

The glavna razlika med integracijo podatkov in ETL je, da Integracija podatkov je proces združevanja podatkov v različnih virih za zagotavljanje enotnega pogleda na uporabnike, medtem ko je ETL proces pridobivanja, preoblikovanja in nalaganja podatkov v okolju podatkovnega skladišča.

Integracija podatkov se nanaša na združevanje podatkov iz različnih virov v pomembne in dragocene informacije. Zato popolna rešitev za integracijo podatkov zagotavlja zaupanja vredne podatke iz različnih virov. To je pomemben proces pri združevanju več sistemov in konsolidiranju aplikacij, da se zagotovi enoten pogled na podatke. Po drugi strani pa je ETL proces, ki sledi pred shranjevanjem podatkov v podatkovno skladišče. Vključuje pridobivanje, preoblikovanje in nalaganje podatkov.

Pokrita ključna območja

1. Kaj je integracija podatkov
- Opredelitev, funkcionalnost
2. Kaj je ETL
- Opredelitev, funkcionalnost
3. Kakšna je razlika med integracijo podatkov in ETL
- Primerjava ključnih razlik

Ključni pogoji

Veliki podatki, integracija podatkov, skladišče podatkov, ETL


Kaj je integracija podatkov

Integracija podatkov je proces združevanja podatkov, ki se nahajajo v različnih virih, da se uporabnikom omogoči enoten pogled. Vendar pa se integracija podatkov razlikuje od aplikacije do aplikacije. V komercialni aplikaciji lahko dve organizaciji združita svoje podatkovne baze. V znanstveni aplikaciji, kot je projekt bioinformatike, je mogoče rezultate raziskav iz različnih skladišč združiti v eno samo enoto.


Slika 1: Integracija podatkov

Običajna uporaba integracije podatkov je tudi analiza velikih podatkov, ki zahtevajo souporabo velikih podatkovnih zbirk v podatkovnih skladiščih. Na splošno je integracija podatkov težaven proces. Poleg tega zahteva dovolj splošnosti, da se prilagodi različnim integracijskim sistemom, kot so relacijske baze podatkov, baze podatkov XML itd.

Kaj je ETL

Podatkovno skladišče je sistem, ki pomaga analizirati podatke, ustvarjati poročila in jih vizualizirati. Upravljavci, analitiki podatkov, poslovni analitiki lahko te podatke analizirajo za sprejemanje poslovnih odločitev. Pred shranjevanjem podatkov v podatkovnem skladišču je treba upoštevati tri korake. Imenuje se ETL. Vključuje ekstrakcijo podatkov, transformacijo in nalaganje v podatkovno skladišče.


V organizaciji obstajajo različni viri podatkov. Prvi korak je pridobivanje podatkov iz teh različnih virov. Vendar pa ekstrakcija podatkov ne bi smela vplivati ​​na zmogljivost ali odzivni čas izvirnega podatkovnega vira. Popolna ekstrakcija in delna ekstrakcija sta dva načina za pridobivanje podatkov.

Drugi korak je preoblikovanje. Tukaj pridobljeni podatki se očistijo, preslikajo in pretvorijo na uporaben način. Izbira podatkov, kartiranje in čiščenje podatkov so nekatere osnovne tehnike preoblikovanja. Poleg tega obstajajo tudi nekatere napredne tehnike preoblikovanja podatkov. Gre za standardizacijo, pretvorbo nabora znakov in obdelavo kodiranja, delitev in združevanje polj, povzetek in de-podvajanje.

Zadnji korak je pridobivanje pripravljenih podatkov in njihovo shranjevanje v podatkovnem skladišču. Imenuje se nalaganje. Tu lahko nalaganje pomeni začetno obremenitev, inkrementalno obremenitev ali popolno osvežitev. Začetna obremenitev je prvič nalaganje baze podatkov. Inkrementalno nalaganje je periodično uporabiti spremembe, kot je potrebno, medtem ko je popolno osveževanje izbrisati podatke v eni ali več tabelah in ponovno naložiti sveže podatke.

Razlika med integracijo podatkov in ETL

Opredelitev

Integracija podatkov je proces združevanja podatkov, ki se nahajajo v različnih virih in uporabnikom zagotavlja enoten pogled na njih. ETL je tristopenjska funkcija za pridobivanje, preoblikovanje in nalaganje, ki nastopi pred shranjevanjem podatkov v podatkovno skladišče. zato je to glavna razlika med integracijo podatkov in ETL.

Uporaba

Uporaba znanstvenih in komercialnih aplikacij Integracija podatkov med shranjevanjem podatkov je aplikacija, ki uporablja ETL. To je še ena razlika med integracijo podatkov in ETL.

Zaključek

Razlika med integracijo podatkov in ETL je v tem, da je integracija podatkov proces združevanja podatkov v različnih virih za zagotavljanje enotnega pogleda na uporabnike, medtem ko je ETL proces pridobivanja, preoblikovanja in nalaganja podatkov v okolju podatkovnega skladišča.

Sklic:

1. „Integracija podatkov“. Wikipedija, Wikimedia Foundation, 4. oktober 2018,