Razlika med linearno regresijo in logistično regresijo - Razlika Med

Razlika med linearno regresijo in logistično regresijo

The glavna razlika med linearno regresijo in logistično regresijo Linearna regresija se uporablja za napovedovanje stalne vrednosti, medtem ko se logistična regresija uporablja za napovedovanje diskretne vrednosti.

Sistemi strojnega učenja lahko predvidevajo prihodnje rezultate na podlagi usposabljanja preteklih vložkov. Obstajata dve glavni vrsti strojnega učenja, imenovano nadzorovano učenje in nenadzorovano učenje. Regresija in klasifikacija spadata pod nadzorovano učenje, medtem ko je združevanje pod nadzorom nenadzorovanega učenja. Nadzorovani učni algoritmi uporabljajo označene podatke za usposabljanje podatkovnega niza. Linearna regresija in logistična regresija sta dve vrsti nadzorovanih učnih algoritmov. Linearna regresija se uporablja, kadar je odvisna spremenljivka neprekinjena, in model je linearan. Logistična regresija se uporablja, kadar je odvisna spremenljivka diskretna in model nelinearen.

Pokrita ključna območja

1. Kaj je linearna regresija
- Opredelitev, funkcionalnost
2. Kaj je logistična regresija
- Opredelitev, funkcionalnost
3. Razlika med linearno regresijo in logistično regresijo
- Primerjava ključnih razlik

Ključni pogoji

Linearna regresija, logistična regresija, strojno učenje


Kaj je linearna regresija

Linearna regresija najde razmerje med neodvisnimi in odvisnimi spremenljivkami. Oba sta sosednja. Neodvisna spremenljivka je spremenljivka, ki je ne spremenijo druge spremenljivke. Označuje ga x. Obstaja lahko tudi več neodvisnih spremenljivk, kot so x1, x2, x3, itd. Odvisna spremenljivka se spreminja glede na neodvisno spremenljivko in je označena z y.

Če obstaja ena neodvisna spremenljivka, je regresijska enačba naslednja.

y = b0 + b1x

Na primer, predpostavimo, da x predstavlja padavine in y predstavlja donos pridelka.


Slika 1: Linearna regresija

Podatkovni niz bo izgledal zgoraj. Nato se izbere vrstica, ki pokriva večino podatkovnih točk. Ta vrstica predstavlja predvidene vrednosti.


Slika 2: Razdalja med dejanskimi podatkovnimi točkami in predvidenimi vrednostmi

Nato se najde razdalja od vsake podatkovne točke do črte, kot je prikazano na zgornjem grafu. To je razdalja med dejansko vrednostjo in predvideno vrednostjo. Ta razdalja je znana tudi kot napaka ali ostanki. Najboljša vrstica mora imeti najmanj vsoto kvadratov napak. Ko je podana nova količina padavin (x), je s to linijo mogoče najti ustrezen donos pridelka (y).

V resničnem svetu lahko obstaja več neodvisnih spremenljivk (x1, x2, x3…). To se imenuje več linearna regresija. Množična linearna regresijska enačba je naslednja.

Kaj je logistična regresija

Logistično regresijo lahko uporabimo za razvrščanje dveh razredov. Znan je tudi kot binarna klasifikacija. Preverjanje, ali je e-pošta neželena ali ne predvideva, ali bo kupec kupil izdelek ali ne, napoveduje, ali je mogoče dobiti promocijo ali ne, so nekateri drugi primeri logistične regresije.


Slika 3: Logistična regresija

Predpostavimo, da je število ur, ki jih je študent študiral na dan, neodvisna spremenljivka. Glede na to se izračuna verjetnost uspešno opravljenega izpita. Vrednost 0,5 velja za prag. Ko je podano novo število ur, je mogoče z uporabo tega grafa poiskati ustrezno verjetnost, da se izpit opravi. Če je verjetnost nad 0,5, se šteje kot 1 ali prehod. Če je verjetnost pod 0,5, se šteje kot 0 ali ne.

Uporaba linearne regresijske enačbe za sigmoidno funkcijo bo dala logistično regresijsko enačbo.

Sigmoidna funkcija je


Druga pomembna točka, ki jo je treba omeniti, je, da logistična regresija velja samo za razvrščanje dveh razredov. Ne uporablja se za večklasno klasifikacijo.

Razlika med linearno regresijo in logistično regresijo

Opredelitev

Linearna regresija je linearni pristop, ki modelira razmerje med odvisno spremenljivko in eno ali več neodvisnih spremenljivk. Nasprotno je logistična regresija statistični model, ki predvideva verjetnost izida, ki lahko ima samo dve vrednosti.

Uporaba

Medtem ko se za reševanje regresijskih problemov uporablja linearna regresija, se logistična regresija uporablja za reševanje problemov klasifikacije (binarna klasifikacija).

Metodologija

Linearna regresija oceni odvisno spremenljivko, kadar pride do spremembe neodvisne spremenljivke. Logistična regresija izračuna možnost nastanka dogodka. To je ena pomembna razlika med linearno regresijo in logistično regresijo.

Izhodna vrednost

Tudi pri linearni regresiji je izhodna vrednost stalna. Pri logistični regresiji je izhodna vrednost diskretna.

Model

Čeprav linearna regresija uporablja ravno črto, logistična regresija uporablja S krivuljo ali sigmoidno funkcijo. To je še ena pomembna razlika med linearno regresijo in logistično regresijo.

Primeri

Napovedovanje BDP države, napovedovanje cene izdelka, ki predvideva hišno prodajno ceno, napovedovanje rezultatov so nekateri primeri linearne regresije. Napovedovanje, ali je e-pošta neželena ali ne, napovedovanje, ali je transakcija s kreditno kartico goljufija ali ne, predvideva, ali bo stranka sprejela posojilo ali ne, nekateri primeri logistične regresije.

Zaključek

Razlika med linearno regresijo in logistično regresijo je v tem, da se linearna regresija uporablja za napovedovanje stalne vrednosti, medtem ko se logistična regresija uporablja za napovedovanje diskretne vrednosti. Na kratko, za regresijo se uporablja linearna regresija, za klasifikacijo pa logistična regresija.

Sklic:

1. Linearna regresijska analiza | Linearna regresija v Pythonu | Algoritmi strojnega učenja | Simplilearn, 26. marec 2018,