Rozdiel medzi Semi Join a Bloom Join

Semi Join vs Bloom Join

Semi join a Bloom join sú dve metódy spájania používané v spracovaní dotazov pre distribuované databázy. Pri spracovávaní dotazov v distribuovaných databázach je potrebné prenášať údaje medzi databázami umiestnenými na rôznych lokalitách. Môže to byť nákladná operácia v závislosti od množstva údajov, ktoré je potrebné preniesť. Preto pri spracovávaní dotazov v prostredí distribuovanej databázy je dôležité optimalizovať dotazy tak, aby sa minimalizovalo množstvo údajov prenášaných medzi webmi. Semi join a bloom join sú dve metódy, ktoré je možné použiť na zníženie množstva prenosu údajov a vykonanie efektívneho spracovania dotazov.

Čo je Semi Join?

Semi join je metóda používaná na efektívne spracovanie dotazov v prostredí distribuovanej databázy. Zvážte situáciu, v ktorej sa na mieste 1 nachádza databáza zamestnancov (informácie o držbe, ako je meno zamestnanca, číslo oddelenia, pre ktoré pracuje, atď.), A databáza pracoviska (informácie o držbe, ako je číslo oddelenia, názov oddelenia, umiestnenie atď.) Umiestnené na mieste. 2. Ak napríklad chceme získať meno zamestnanca a názov oddelenia, pre ktoré pracuje (iba pre oddelenia nachádzajúce sa v „New Yorku“), vykonaním dotazu v dotazovom procesore umiestnenom na mieste 3 existuje niekoľko spôsobov, ako Na dosiahnutie tejto úlohy je možné medzi týmito tromi miestami prenášať údaje. Pri prenose údajov je však dôležité si uvedomiť, že nie je potrebné prenášať celú databázu medzi weby. Na efektívne vykonanie dotazu je potrebné medzi weby preniesť iba niektoré atribúty (alebo n-tice), ktoré sú potrebné na pripojenie. Semi join je metóda, ktorú je možné použiť na zníženie množstva údajov dodávaných medzi webmi. V semifinále join sa iba stĺpec join prenáša z jedného webu na druhý a potom sa tento prenesený stĺpec používa na zmenšenie veľkosti dodávaných vzťahov medzi ostatnými servermi. Vo vyššie uvedenom príklade môžete jednoducho preniesť číslo oddelenia a názov oddelenia n-tice s location = ”New York” z lokality 2 na lokalitu 1 a vykonať spojenie na mieste 1 a preniesť konečný vzťah späť na lokalitu 3.

Čo je Bloom Join?

Ako už bolo spomenuté, pripojenie Bloom je ďalšou metódou používanou na zabránenie prenosu nepotrebných údajov medzi webmi pri vykonávaní dotazov v prostrediach distribuovanej databázy. V spojení s kvetmi sa namiesto prenosu samotného stĺpca spájania medzi weby prenáša kompaktné znázornenie stĺpca spojenia. Bloom join používa bloom filter, ktorý používa bitový vektor na vykonávanie členských otázok. Najskôr sa vytvorí bloomový filter pomocou stĺpca join a prevedie sa medzi miestami a potom sa vykonajú operácie spájania.

Aký je rozdiel medzi Semi Join a Bloom Join?

Aj keď sa metódy semi-join aj bloom join používajú na minimalizáciu množstva údajov prenášaných medzi servermi pri vykonávaní dotazov v prostredí distribuovanej databázy, bloom join znižuje množstvo prenesených údajov (počet n-tíc) v porovnaní s polospojením pomocou využitia koncept blokových filtrov, ktoré používajú bitový vektor na určenie členstva v sade. Preto bude použitie bloom join efektívnejšie ako semi-join.