kľúčový rozdiel medzi RDBMS a Hadoop je to RDBMS ukladá štruktúrované údaje, zatiaľ čo Hadoop ukladá štruktúrované, semi-štruktúrované a neštruktúrované údaje.
RDBMS je systém správy databáz založený na relačnom modeli. Hadoop je softvér na ukladanie údajov a spúšťanie aplikácií na klastroch komoditného hardvéru.
1. Prehľad a kľúčový rozdiel
2. Čo je to RDBMS
3. Čo je Hadoop
4. Porovnanie bok po boku - RDBMS vs Hadoop v tabuľkovej forme
5. Zhrnutie
RDBMS znamená Relational Database Management System založený na relačnom modeli. V RDBMS sa tabuľky používajú na ukladanie údajov a kľúče a indexy pomáhajú pri spájaní tabuliek. Tabuľka je súbor dátových prvkov a sú to entity. Obsahuje riadky a stĺpce. Riadky predstavujú jeden záznam v tabuľke. Stĺpce predstavujú atribúty.
Napríklad predajná databáza môže mať entity zákazníkov a produktov. Zákazník môže mať atribúty ako customer_id, meno, adresu, phone_no. Položka môže mať atribúty, ako napríklad product_id, name atď. Primárny kľúč tabuľky zákazníkov je customer_id, zatiaľ čo primárny kľúč tabuľky produktov je product_id. Umiestnením product_id do tabuľky zákazníkov ako cudzieho kľúča sa tieto dve entity spoja. Podobne sú aj tabuľky navzájom prepojené. Poskytujú integritu údajov, normalizáciu a mnoho ďalších. Málo spoločných RDBMS sú MySQL, MSSQL a Oracle. Na dotazovanie používajú SQL.
Hadoop je Apache open source framework napísaný v Jave. Pomáha ukladať a spracovávať veľké množstvo údajov v klastroch počítačov pomocou jednoduchých programovacích modelov. Hlavným cieľom spoločnosti Hadoop je ukladanie a spracovanie veľkých dát, ktorá sa týka veľkého množstva komplexných údajov. Priepustnosť Hadoopu, čo je kapacita na spracovanie objemu údajov v určitom časovom období, je vysoká.
V architektúre Hadoop sú štyri moduly. Sú to Hadoop obyčajný, YARN, Hadoop Distribuovaný súborový systém (HDFS) a Hadoop MapReduce. Spoločný modul obsahuje knižnice a pomocné programy Java. Má tiež súbory na spustenie Hadoop. Hadoop YARN vykonáva plánovanie úloh a správu klastrových prostriedkov.
Distribuovaný súborový systém Hadoop (HDFS) je navyše úložným systémom Hadoop. Používa architektúru master-slave. Hlavný uzol je NameNode a spravuje meta údaje systému súborov. Ďalšími počítačmi sú podriadené uzly alebo dátové uzly. Ukladajú skutočné údaje. Na druhej strane, Hadoop MapReduce vykonáva distribuovaný výpočet. Má algoritmy na spracovanie údajov. V HDFS má hlavný uzol sledovač úloh. Spustí mapu zmenšiť úlohy na slave uzloch. Pre každý podriadený uzol existuje nástroj na sledovanie úloh na dokončenie spracovania údajov a odoslanie výsledku späť do hlavného uzla. Hadoop celkovo poskytuje masívne ukladanie údajov s vysokým výpočtovým výkonom.
RDBMS vs Hadoop | |
RDBMS je systémový softvér na vytváranie a správu databáz, ktorý je založený na relačnom modeli. | Hadoop je zbierka softvéru s otvoreným zdrojovým kódom, ktorý spája mnoho počítačov pri riešení problémov týkajúcich sa veľkého množstva údajov a výpočtov. |
Odroda údajov | |
RDBMS ukladá štruktúrované údaje. | Hadoop ukladá štruktúrované, pološtrukturované a neštruktúrované údaje. |
Úložisko dát | |
RDBMS ukladá priemerné množstvo údajov. | Hadoop ukladá veľké množstvo údajov ako RDBMS. |
rýchlosť | |
V RDBMS sú čítania rýchle. | V Hadoope sú čítania a zápisy rýchle. |
škálovateľnosť | |
RDBMS má vertikálnu škálovateľnosť. | Hadoop má horizontálnu škálovateľnosť. |
technické vybavenie | |
RDBMS používajú špičkové servery. | Hadoop používa komoditný hardvér. |
priepustnosť | |
Priepustnosť RDBMS je vyššia. | Priepustnosť hadoopu je nižšia. |
V tomto článku sa diskutuje o rozdieloch medzi RDBMS a Hadoop. Kľúčový rozdiel medzi RDBMS a Hadoop je v tom, že RDBMS ukladá štruktúrované údaje, zatiaľ čo Hadoop ukladá štruktúrované, pološtrukturované a neštruktúrované údaje..
1. Príručky Bod. „Koncepty SQL RDBMS.“ , Tutorials Point, 8. január 2018. K dispozícii tu
2. Príručky Bod. "Výučba Hadoop." , Tutorials Point, 8. január 2018. K dispozícii tu
1.'8552968000'by spoločnosťou Intel Free Press (CC BY-SA 2.0) prostredníctvom služby Flickr