Ťažba dát verzus skladovanie dát
Proces získavania údajov sa týka odvetvia informatiky, ktoré sa zaoberá extrakciou vzorov z veľkých súborov údajov. Tieto súbory sa potom kombinujú pomocou štatistických metód a pomocou umelej inteligencie. Dolovanie údajov v modernom podnikaní je zodpovedné za transformáciu prvotných údajov na zdroje umelej inteligencie. S údajmi sa manipuluje, a preto sú schopné vydávať spoľahlivé rozhodnutia, ktoré sa môžu použiť pri rozhodovaní. Podnikom to poskytuje výhodu oproti konkurencii v tom, že majú súbory údajov, na ktoré sa možno spoľahnúť pri poskytovaní informácií. Dolovanie údajov využívajú aj organizácie pri profilovacích postupoch vrátane marketingu, vedeckého objavovania a odhaľovania podvodov.
S ťažbou údajov môžu súvisieť aj ďalšie bežné pojmy, ako napríklad rybolov údajov, bagrovanie údajov alebo dokonca snooping údajov. Všetky tieto skutočnosti poukazujú na rôzne variácie dolovania údajov, ktoré sa používajú pri vzorkovaní malých súborov údajov, ktoré môžu byť príliš malé na to, aby sa získali štatistické závery. Tieto sú však rozhodujúce pri načrtnutí platnosti používaných údajov a môžu sa použiť pri vytváraní hypotézy pri očakávaní dosiahnutia danej populácie údajov..
Na druhej strane dátový sklad je pojem, ktorý opisuje systém v organizácii, ktorý sa používa pri zbere údajov. Tieto údaje zozbierané v dátovom sklade sú údaje poskytované transakčnými systémami, ako sú faktúry, záznamy o nákupe alebo dokonca záznamy o pôžičke. Dátové záznamy sú prevzaté z jednotlivých miest vytvorenia a sú spojené pod jednou strechou, ktorou je dátový sklad. Tieto údaje sa potom vykazujú a vykazovanie sa vykonáva súhrnne, aby sa používateľom obchodných informácií pomohlo pri prijímaní platných rozhodnutí. Aby dátový sklad fungoval efektívne, vyžaduje zdroj údajov, databázu a nástroj na podávanie správ.
Dá sa preto povedať, že dátový sklad je databáza, ktorá sa používa na špecifické účely vykazovania údajov, ktoré boli analyzované. Tieto údaje pochádzajú z rôznych systémov, ktoré boli pripravené na podávanie správ.
Na splnenie tejto funkcie uchováva dátový sklad funkcie v troch rôznych vrstvách. Patria sem predstavenia, integrácia a prístup. V procese postupovania sa prvotné údaje ukladajú vývojári iba na účely analýzy a podpory. Integračná vrstva sa používa na integráciu údajov a na získanie úrovne abstrakcie od používateľov údajov. Napokon, prístupová vrstva je dôležitá pri získavaní údajov od rôznych používateľov údajov.
Dolovanie a ukladanie údajov možno označiť ako nástroje, ktoré sa používajú na zhromažďovanie obchodných informácií. Hlavný rozdiel medzi nimi je spôsob zhromažďovania obchodných informácií. Dá sa preto povedať, že údaje, ktoré boli dobre skladované, sa dajú ľahko ťažiť, a teda využívať. Dátový sklad je teda zodpovedný za uľahčenie práce pri získavaní údajov pri umiestnení všetkých relevantných údajov, ktoré je potrebné ťažiť na centrálnom mieste, a nie vtedy, keď musí získavanie údajov pokračovať v hľadaní údajov na rôznych miestach. To pomáha šetriť čas strávený ťažbou údajov a zdroje použité pri ťažbe.
zhrnutie
Dolovanie údajov je proces získavania údajov z veľkých súborov údajov.
Skladovanie údajov je proces združovania všetkých relevantných údajov.
Dolovanie a ukladanie údajov sú nástroje na zber podnikových informácií.
Dolovanie údajov je špecifické pri zbere údajov.
Skladovanie údajov je nástroj, ktorý šetrí čas a zvyšuje efektívnosť spájaním údajov z rôznych miest z rôznych oblastí organizácie.
Dátový sklad má tri vrstvy, konkrétne fázovanie, integráciu a prístup.