Dozorované učenie a učenie bez dozoru sú dva základné pojmy strojového učenia. Dohliadané učenie je úloha strojového učenia sa naučiť funkciu, ktorá mapuje vstup na výstup na základe príkladov párov vstup-výstup. Učenie bez dozoru je úlohou strojového učenia odvodiť funkciu opisujúcu skrytú štruktúru z neoznačených údajov. kľúčový rozdiel medzi strojovým učením pod dohľadom a bez dozoru je to supervízované učenie používa údaje označené, zatiaľ čo učenie bez dozoru využíva neoznačené údaje.
Strojové učenie je oblasť počítačovej vedy, ktorá umožňuje počítačovému systému učiť sa z údajov bez toho, aby bol výslovne naprogramovaný. Umožňuje analyzovať údaje a predpovedať v nich vzory. Existuje mnoho aplikácií strojového učenia. Niektoré z nich sú rozpoznávanie tváre, rozpoznávanie gest a rozpoznávanie reči. Existujú rôzne algoritmy týkajúce sa strojového učenia. Niektoré z nich sú regresia, klasifikácia a zoskupovanie. Najbežnejšie programovacie jazyky pre vývoj aplikácií založených na strojovom učení sú R a Python. Môžu sa použiť aj iné jazyky ako Java, C ++ a Matlab.
1. Prehľad a kľúčový rozdiel
2. Čo je učenie pod dohľadom
3. Čo je vzdelávanie bez dozoru
4. Podobnosti medzi strojovým učením pod dohľadom a bez dozoru
5. Porovnanie bok po boku - strojové učenie pod dohľadom a bez dozoru v tabuľkovej forme
6. Zhrnutie
V systémoch založených na strojovom učení model funguje podľa algoritmu. Pri učení pod dohľadom je model pod dohľadom. Najprv je potrebné model trénovať. Na základe získaných poznatkov dokáže predvídať odpovede na budúce prípady. Model je trénovaný pomocou označeného súboru údajov. Ak sa do systému zadajú údaje mimo vzorky, môže to predpovedať výsledok. Nasleduje malý výpis z populárneho súboru údajov IRIS.
Podľa vyššie uvedenej tabuľky sa atribúty nazývajú dĺžka septy, šírka septy, dĺžka papule, šírka papule a druh. Stĺpce sú známe ako funkcie. Jeden riadok obsahuje údaje pre všetky atribúty. Jeden riadok sa preto nazýva pozorovanie. Údaje môžu byť číselné alebo kategorické. Modelu sa ako vstup poskytujú pozorovania s príslušným názvom druhu. Keď je dané nové pozorovanie, model by mal predvídať druh druhu, do ktorého patrí.
V učení pod dohľadom existujú algoritmy na klasifikáciu a regresiu. Klasifikácia je proces klasifikácie označených údajov. Model vytvoril hranice, ktoré oddeľovali kategórie údajov. Keď sa modelu poskytnú nové údaje, možno ho kategorizovať podľa toho, kde bod existuje. Klasifikačný model je K-Nearest Neighbors (KNN). V závislosti od hodnoty k sa rozhodne o kategórii. Napríklad, ak k je 5, ak je konkrétny dátový bod blízko k ôsmim údajovým bodom v kategórii A a šiestim údajovým bodom v kategórii B, potom sa dátový bod klasifikuje ako A.
Regresia je proces predpovedania trendu predchádzajúcich údajov na predpovedanie výsledku nových údajov. V regresii môže výstup pozostávať z jednej alebo viacerých spojitých premenných. Predikcia sa vykonáva pomocou čiary, ktorá pokrýva väčšinu dátových bodov. Najjednoduchším regresným modelom je lineárna regresia. Je rýchly a nevyžaduje parametre ladenia, napríklad v KNN. Ak údaje ukazujú parabolický trend, potom nie je vhodný lineárny regresný model.
Toto sú niektoré príklady dohliadaných učebných algoritmov. Vo všeobecnosti sú výsledky generované metódami výučby pod dohľadom presnejšie a spoľahlivejšie, pretože vstupné údaje sú dobre známe a označené. Preto musí stroj analyzovať iba skryté vzory.
Pri učení bez dozoru nie je model pod dohľadom. Model pracuje sám o sebe, aby predpovedal výsledky. Používa algoritmy strojového učenia, aby dospel k záverom o neoznačených údajoch. Vo všeobecnosti sú nesledované učebné algoritmy ťažšie ako učebné algoritmy pod dohľadom, pretože existuje len málo informácií. Zhlukovanie je druh učenia bez dozoru. Môže sa použiť na zoskupenie neznámych dát pomocou algoritmov. Klastrovanie na základe k a strednej hustoty sú dva klastrové algoritmy.
k-stredný algoritmus, náhodne umiestňuje k centroid pre každý klaster. Potom je každý dátový bod priradený k najbližšej ťažisku. Euklidovská vzdialenosť sa používa na výpočet vzdialenosti od údajového bodu k ťažisku. Dátové body sú rozdelené do skupín. Polohy k centroidov sa počítajú znova. Nová poloha ťažiska sa určuje na základe všetkých bodov v skupine. Každý dátový bod je opäť priradený k najbližšej ťažisku. Tento proces sa opakuje, až kým sa už ťažiská nezmenia. k-priemer je rýchly klastrovací algoritmus, ale nie je špecifikovaná inicializácia klastrových bodov. Existuje tiež veľká variabilita klastrových modelov založených na inicializácii klastrových bodov.
Ďalším zoskupovacím algoritmom je Zoskupovanie založené na hustote. Je známy aj ako aplikácie priestorového zoskupovania založené na hustote s hlukom. Funguje tak, že definuje klaster ako maximálnu skupinu pripojených bodov hustoty. Sú to dva parametre používané na zhlukovanie založené na hustote. Sú to Ɛ (epsilon) a minimálne body. Ɛ je maximálny polomer susedstva. Minimálne body sú minimálny počet bodov v susedstve Ɛ, ktoré definujú klaster. Toto je niekoľko príkladov zoskupovania, ktoré spadajú do učenia bez dozoru.
Všeobecne platí, že výsledky generované z nepodporovaných algoritmov učenia nie sú príliš presné a spoľahlivé, pretože stroj musí pred určením skrytých vzorov a funkcií definovať a označiť vstupné údaje..
Strojové učenie pod dohľadom a bez dozoru | |
Dohliadané učenie je úlohou strojového učenia sa naučiť funkciu, ktorá mapuje vstup na výstup na základe príkladov párov vstup-výstup. | Učenie bez dozoru je úlohou strojového učenia odvodiť funkciu opisujúcu skrytú štruktúru z neznačených údajov. |
Hlavná funkčnosť | |
Pri učení pod dohľadom model predpovedá výsledok na základe označených vstupných údajov. | V učení bez dozoru model predpovedá výsledok bez označených údajov identifikáciou vzorov sám. |
Presnosť výsledkov | |
Výsledky generované metódami výučby pod dohľadom sú presnejšie a spoľahlivejšie. | Výsledky generované metódami bez dozoru nie sú príliš presné a spoľahlivé. |
Hlavné algoritmy | |
V učení pod dohľadom existujú algoritmy na regresiu a klasifikáciu. | Existujú algoritmy na zoskupovanie v učení bez dozoru. |
Dozorované učenie a učenie bez dozoru sú dva typy strojového učenia. Dohliadané učenie je úlohou strojového učenia sa naučiť funkciu, ktorá mapuje vstup na výstup na základe príkladov párov vstup-výstup. Učenie bez dozoru je úlohou strojového učenia odvodiť funkciu opisujúcu skrytú štruktúru z neznačených údajov. Rozdiel medzi strojovým učením pod dohľadom a bez dozoru spočíva v tom, že pod dohľadom učené údaje sa používajú, zatiaľ čo učenie bez dozoru využíva neoznačené údaje..
1.TheBigDataUniversity. Strojové učenie - pod dohľadom VS bez dozoru, kognitívna trieda, 13. marca 2017. K dispozícii tu
2. „Výučba bez dozoru.“ Wikipedia, Wikimedia Foundation, 20. marca 2018. K dispozícii tu
3. „Dozorované učenie“. Wikipedia, Wikimedia Foundation, 15. marca 2018. K dispozícii tu
1.'2729781 'od GDJ (Public Domain) prostredníctvom pixabay