Rozdiel medzi klasifikáciou a regresiou

kľúčový rozdiel medzi klasifikáciou a regresným stromom je to v klasifikácii sú závislé premenné kategorizované a neusporiadané, zatiaľ čo v regresii sú závislé premenné spojité alebo usporiadané celé hodnoty.

Klasifikácia a regresia sú techniky učenia sa na vytváranie modelov predpovede zo zhromaždených údajov. Obe techniky sú graficky prezentované ako klasifikačné a regresné stromy alebo skôr vývojové diagramy s rozdelením údajov po každom kroku alebo skôr „vetvou“ v strome. Tento proces sa nazýva rekurzívne rozdelenie. Oblasti ako ťažba používajú tieto techniky klasifikácie a regresie. Tento článok sa zameriava na klasifikačný strom a regresný strom.

OBSAH

1. Prehľad a kľúčový rozdiel
2. Čo je klasifikácia
3. Čo je to regresia
4. Porovnanie vedľa seba - klasifikácia verzus regresia v tabuľkovej forme
5. Zhrnutie

Čo je klasifikácia?

Klasifikácia je technika, ktorá sa používa na dosiahnutie schémy, ktorá ukazuje usporiadanie údajov počnúc prekurzorovou premennou. Závislé premenné sú to, čo klasifikuje údaje.

Obrázok 01: Ťažba údajov

Klasifikačný strom začína nezávislou premennou, ktorá sa rozvetví do dvoch skupín, ako je určené existujúcimi závislými premennými. Účelom je objasniť odpovede vo forme kategorizácie vyvolanej závislými premennými.

Čo je to regresia

Regresia je predikčná metóda, ktorá je založená na predpokladanej alebo známej číselnej výstupnej hodnote. Táto výstupná hodnota je výsledkom série rekurzívneho rozdelenia, pričom každý krok má jednu číselnú hodnotu a ďalšiu skupinu závislých premenných, ktoré sa rozvetvujú do iného páru, ako je tento.

Regresný strom začína jednou alebo viacerými prekurzorovými premennými a končí jednou konečnou výstupnou premennou. Závislé premenné sú buď spojité alebo diskrétne číselné premenné.

Aký je rozdiel medzi klasifikáciou a regresiou?

 Klasifikácia vs regresia

Stromový model, kde cieľová premenná môže mať diskrétnu množinu hodnôt. Stromový model, kde cieľová premenná môže mať spojité hodnoty, zvyčajne reálne čísla.
Závislá premenná
Pre klasifikačný strom sú závislé premenné kategorické. Pre strom regresie sú závislé premenné číselné.
hodnoty
Má stanovené množstvo neusporiadaných hodnôt. Má buď diskrétne, ale zoradené hodnoty, alebo nejednotné hodnoty.
Účel výstavby
Účelom zostavenia regresného stromu je prispôsobiť regresný systém každej determinantnej vetve takým spôsobom, aby sa dosiahla očakávaná výstupná hodnota.. Klasifikačný strom sa rozvetví, ako je určené závislou premennou odvodenou z predchádzajúceho uzla.

Zhrnutie - klasifikácia verzus regresia

Regresné a klasifikačné stromy sú užitočné techniky na mapovanie procesu, ktorý ukazuje na študovaný výsledok, či už v klasifikácii alebo na jedinej číselnej hodnote. Rozdiel medzi klasifikačným stromom a regresným stromom je ich závislá premenná. Klasifikačné stromy majú závislé premenné, ktoré sú kategorické a neusporiadané. Regresné stromy majú závislé premenné, ktoré sú spojité alebo usporiadané celé hodnoty.

referencie:

1. „Učenie sa rozhodovacieho stromu“. Wikipedia, Nadácia Wikimedia Foundation, 13. mája 2018. K dispozícii tu 

S láskavým dovolením:

1.'Data Mining'By Arbeck - Vlastné dielo, (CC BY 3.0) prostredníctvom Commons Wikimedia