Rozdiel medzi klastrovaním a klasifikáciou

kľúčový rozdiel medzi zhlukovaním a klasifikáciou je to klastrovanie je technika bez dozoru, ktorá zoskupuje podobné prípady na základe prvkov, zatiaľ čo klasifikácia je technika pod dohľadom, ktorá priraďuje vopred definované značky inštanciám na základe prvkov.

Aj keď sa zdá, že zoskupovanie a klasifikácia sú podobné procesy, medzi nimi existuje rozdiel na základe ich významu. Vo svete ťažby údajov sú zoskupovanie a klasifikácia dvoma typmi metód učenia. Obe tieto metódy charakterizujú objekty do skupín pomocou jednej alebo viacerých funkcií.

OBSAH

1. Prehľad a kľúčový rozdiel
2. Čo je klastrovanie
3. Čo je klasifikácia
4. Porovnanie vedľa seba - zhlukovanie verzus klasifikácia v tabuľkovej forme
5. Zhrnutie

Čo je klastrovanie?

Zhlukovanie je metóda zoskupovania objektov takým spôsobom, že objekty s podobnými vlastnosťami sa spoja a objekty s odlišnými vlastnosťami sa rozpadnú. Je to bežná technika štatistickej analýzy údajov pre strojové učenie a získavanie údajov. Analýza a generalizácia prieskumných údajov je tiež oblasťou, ktorá využíva zoskupovanie.

Obrázok 01: Zhlukovanie

Klastrovanie patrí k dozeraniu údajov bez dozoru. Nejde o jediný špecifický algoritmus, ale o všeobecnú metódu riešenia úlohy. Preto je možné dosiahnuť zoskupovanie pomocou rôznych algoritmov. Vhodný klastrový algoritmus a nastavenia parametrov závisia od jednotlivých súborov údajov. Nie je to automatická úloha, ale je to iteratívny proces objavovania. Preto je potrebné modifikovať spracovanie údajov a modelovanie parametrov, až kým výsledok nedosiahne požadované vlastnosti. K-znamená klastrovanie a hierarchické klastrovanie sú dva bežné algoritmy klastrovania pri získavaní údajov.

Čo je klasifikácia?

Klasifikácia je proces kategorizácie, ktorý využíva školiacu sadu údajov na rozpoznávanie, rozlišovanie a porozumenie objektov. Klasifikácia je technikou výučby pod dohľadom, kde je k dispozícii tréningová súprava a správne definované pozorovania.

Obrázok 02: Klasifikácia

Algoritmus, ktorý implementuje klasifikáciu, je klasifikátor, zatiaľ čo pozorovania sú príklady. Algoritmus K-Nearest Neighbor a algoritmy rozhodovacieho stromu sú najznámejšie klasifikačné algoritmy pri získavaní údajov.

Aký je rozdiel medzi zhlukovaním a klasifikáciou?

Zhlukovanie je učenie bez dozoru, zatiaľ čo klasifikácia je technika učenia pod dohľadom. Zoskupuje podobné prípady na základe funkcií, zatiaľ čo klasifikácia priraďuje vopred definované značky inštanciám na základe prvkov. Zhlukovanie rozdelilo súbor údajov do podmnožín, aby sa inštancie spojili s podobnými funkciami. Nepoužíva označené údaje ani školiace sady. Na druhej strane nové údaje kategorizujte podľa pozorovaní tréningového súboru. Tréningová súprava je označená.

Cieľom klastrovania je zoskupiť skupinu objektov, aby sa zistilo, či medzi nimi existuje nejaký vzťah, zatiaľ čo cieľom klasifikácie je zistiť, do ktorej triedy nový objekt patrí zo sady preddefinovaných tried..

Zhrnutie - zhlukovanie verzus klasifikácia

Zhlukovanie a klasifikácia sa môže zdať podobná, pretože oba algoritmy dolovania údajov rozdeľujú množinu údajov do podskupín, ale ide o dve rôzne techniky učenia, v získavaní údajov na získanie spoľahlivých informácií zo súboru prvotných údajov. Rozdiel medzi klastrovaním a klasifikáciou spočíva v tom, že klastrovanie je technika bez dozoru, ktorá zoskupuje podobné prípady na základe funkcií, zatiaľ čo klasifikácia je technika pod dohľadom, ktorá priraďuje vopred definované značky inštanciám na základe funkcií..

S láskavým dovolením:
1. "Cluster-2" podľa Cluster-2.gif: hellisp odvodené dielo: (Public Domain) prostredníctvom Wikimedia Commons  2. „Magnetizmus“ od Johna Aplessed - Vlastná práca. (Public Domain) prostredníctvom Wikimedia Commons