Lineárna vs. logistická regresia
V štatistickej analýze je dôležité identifikovať vzťahy medzi premennými, ktorých sa štúdia týka. Niekedy to môže byť jediný účel samotnej analýzy. Jedným silným nástrojom na zistenie existencie vzťahu a identifikáciu vzťahu je regresná analýza.
Najjednoduchšou formou regresnej analýzy je lineárna regresia, kde vzťah medzi premennými je lineárny vzťah. V štatistickom vyjadrení sa uvádza vzťah medzi vysvetľujúcou premennou a premennou odozvy. Napríklad pomocou regresie môžeme určiť vzťah medzi cenou komodity a spotrebou na základe údajov získaných z náhodnej vzorky. Regresná analýza vytvorí regresnú funkciu množiny údajov, čo je matematický model, ktorý najlepšie vyhovuje dostupným údajom. Toto môže byť ľahko reprezentované rozptylovým grafom. Grafická regresia je ekvivalentná nájdeniu najvhodnejšej krivky pre daný súbor údajov. Funkciou krivky je regresná funkcia. Pomocou matematického modelu je možné predpovedať použitie komodity za danú cenu.
Regresná analýza sa preto široko používa pri predpovedaní a predpovedaní. Používa sa tiež na nadviazanie vzťahov v experimentálnych údajoch, v oblastiach fyziky, chémie a v mnohých prírodných a technických odboroch. Ak je vzťahová alebo regresná funkcia lineárnou funkciou, potom je tento proces známy ako lineárna regresia. V rozptylovom grafe môže byť znázornená ako priama čiara. Ak funkcia nie je lineárnou kombináciou parametrov, potom je regresia nelineárna.
Logistická regresia je porovnateľná s viacrozmernou regresiou a vytvára model na vysvetlenie vplyvu viacerých prediktorov na premennú odozvy. Avšak v logistickej regresii by konečná výsledná premenná mala byť kategorická (zvyčajne rozdelená; t.j. pár dosiahnuteľných výsledkov, ako je smrť alebo prežitie, hoci špeciálne techniky umožňujú modelovanie podrobnejších informácií). Premenná súvislého výsledku sa môže transformovať na kategorickú premennú, ktorá sa použije na logistickú regresiu; kolapsu spojitých premenných týmto spôsobom sa však väčšinou neodporúča, pretože to znižuje presnosť.
Na rozdiel od lineárnej regresie, predpovedajúce premenné v logistickej regresii nemusia byť prinútené, aby boli lineárne spojené, bežne distribuované alebo aby mali rovnakú odchýlku vo vnútri každého zoskupenia. Výsledkom je, že vzťah medzi prediktorom a výstupnými premennými pravdepodobne nebude lineárnou funkciou.
Aký je rozdiel medzi logistickou a lineárnou regresiou?
• Pri lineárnej regresii sa predpokladá lineárny vzťah medzi vysvetľujúcou premennou a premennou odozvy a analýzou sa zistia parametre vyhovujúce modelu, aby sa dal presný vzťah.
• Lineárna regresia sa vykonáva pre kvantitatívne premenné a výsledná funkcia je kvantitatívna.
• V logistickej regresii môžu byť použité údaje buď kategorické alebo kvantitatívne, ale výsledok je vždy kategorický.