DBMS vs dolovanie dát
DBMS (Database Management System) je kompletný systém používaný na správu digitálnych databáz, ktorý umožňuje ukladanie obsahu databázy, vytváranie / údržbu údajov, vyhľadávanie a ďalšie funkcie. Na druhej strane, Data Mining je oblasť informatiky, ktorá sa zaoberá extrakciou predtým neznámych a zaujímavých informácií z nespracovaných údajov. Dáta použité ako vstup pre proces dolovania dát sa zvyčajne ukladajú do databáz. Používatelia, ktorí majú sklon k štatistikám, používajú dolovanie údajov. Využívajú štatistické modely na vyhľadávanie skrytých vzorcov v údajoch. Baníci údajov majú záujem nájsť užitočné vzťahy medzi rôznymi dátovými prvkami, čo je pre podniky v konečnom dôsledku výhodné.
DBMS
DBMS, niekedy nazývaná aj ako správca databáz, je zbierka počítačových programov určených na správu (t. J. Organizáciu, ukladanie a získavanie) všetkých databáz, ktoré sú nainštalované v systéme (t. J. Na pevnom disku alebo v sieti). Vo svete existujú rôzne typy systémov správy databáz a niektoré z nich sú navrhnuté na správne spravovanie databáz nakonfigurovaných na konkrétne účely. Najobľúbenejšími komerčnými systémami správy databáz sú Oracle, DB2 a Microsoft Access. Všetky tieto produkty poskytujú prostriedky na pridelenie rôznych úrovní oprávnení rôznym používateľom, čo umožňuje, aby bol DBMS centrálne riadený jedným správcom alebo aby bol pridelený niekoľkým rôznym ľuďom. V každom systéme správy databáz existujú štyri dôležité prvky. Sú to modelovací jazyk, dátové štruktúry, jazyk dotazov a mechanizmus transakcií. Modelovací jazyk definuje jazyk každej databázy hostenej v DBMS. V súčasnosti je v praxi niekoľko populárnych prístupov, ako sú hierarchické, sieťové, relačné a objektové. Dátové štruktúry pomáhajú organizovať údaje, ako sú jednotlivé záznamy, súbory, polia a ich definície a objekty, ako napríklad vizuálne médiá. Jazyk dopytov na údaje udržuje bezpečnosť databázy monitorovaním prihlasovacích údajov, prístupových práv k rôznym používateľom a protokolov na pridávanie údajov do systému. SQL je populárny dopytovací jazyk, ktorý sa používa v systémoch správy relačných databáz. Mechanizmus, ktorý umožňuje transakcie, napokon pomáha súbežnosti a multiplicite. Tento mechanizmus zabezpečí, aby ten istý záznam nemenili viacerí používatelia súčasne, čím sa zachová taktika integrity údajov. Okrem toho poskytuje DBMS zálohovanie a ďalšie zariadenia.
Ťažba dát
Dolovanie údajov je známe aj ako Zisťovanie znalostí v údajoch (KDD). Ako už bolo spomenuté vyššie, ide o pôdu z počítačovej vedy, ktorá sa zaoberá extrakciou predtým neznámych a zaujímavých informácií z nespracovaných údajov. V dôsledku exponenciálneho rastu údajov, najmä v takých oblastiach, ako je podnikanie, sa ťažba údajov stala veľmi dôležitým nástrojom na premenu tohto veľkého množstva údajov na obchodné informácie, pretože manuálna extrakcia modelov sa v posledných niekoľkých desaťročiach zdá byť nemožná. Napríklad sa v súčasnosti používa na rôzne aplikácie, napríklad na analýzu sociálnych sietí, zisťovanie podvodov a marketing. Dolovanie údajov sa zvyčajne zaoberá týmito štyrmi úlohami: zoskupovanie, klasifikácia, regresia a priradenie. Zhlukovanie identifikuje podobné skupiny z neštruktúrovaných údajov. Klasifikácia sú pravidlá učenia, ktoré sa dajú použiť na nové údaje a zvyčajne zahŕňajú tieto kroky: predspracovanie údajov, navrhovanie modelovania, výber učenia / funkcií a hodnotenie / validácia. Regresia spočíva v hľadaní funkcií s minimálnymi chybami pri modelovaní údajov. Asociácia hľadá vzťahy medzi premennými. Dolovanie údajov sa zvyčajne používa na zodpovedanie otázok, ako sú hlavné produkty, ktoré by mohli v budúcom roku vo Wal-Martu pomôcť dosiahnuť vysoký zisk?
Aký je rozdiel medzi DBMS a Data mining?
DBMS je plnohodnotný systém na bývanie a správu súboru digitálnych databáz. Dolovanie údajov je však technika alebo koncept v informatike, ktorý sa zaoberá získavaním užitočných a predtým neznámych informácií zo nespracovaných údajov. Väčšinou sú tieto nespracované údaje uložené vo veľmi veľkých databázach. Preto baníci údajov využívajú existujúce funkcie DBMS na spracovanie, správu a dokonca predspracovanie nespracovaných údajov pred procesom ťažby údajov a počas neho. Samotný systém DBMS však nemožno použiť na analýzu údajov. Niektoré databázy DBMS však v súčasnosti majú zabudované nástroje alebo funkcie na analýzu údajov.