Doğrusal Regresyon ve Lojistik Regresyon, denetimli öğrenme tekniği kapsamına giren iki ünlü Makine Öğrenimi Algoritmasıdır. Her iki algoritma da doğası gereği denetimli olduğundan, bu algoritmalar tahminleri yapmak için etiketli veri kümesini kullanır. Ancak aralarındaki temel fark, bunların nasıl kullanıldığıdır. Doğrusal Regresyon, Regresyon problemlerini çözmek için kullanılırken, Lojistik Regresyon, Sınıflandırma problemlerini çözmek için kullanılır. Her iki algoritmanın açıklaması, fark tablosuyla birlikte aşağıda verilmiştir.
Doğrusal Regresyon:
- Doğrusal Regresyon, Denetimli Öğrenme tekniği kapsamında gelen ve regresyon problemlerini çözmek için kullanılan en basit Makine öğrenme algoritmalarından biridir.
- Sürekli bağımlı değişkenin bağımsız değişkenler yardımıyla tahmin edilmesinde kullanılır.
- Doğrusal regresyonun amacı, sürekli bağımlı değişkenin çıktısını doğru bir şekilde tahmin edebilen en iyi uyum çizgisini bulmaktır.
- Tahmin için tek bir bağımsız değişken kullanılıyorsa buna Basit Doğrusal Regresyon, ikiden fazla bağımsız değişken varsa bu tür bir regresyona Çoklu Doğrusal Regresyon adı verilir.
- Algoritma en iyi uyum çizgisini bularak bağımlı değişken ile bağımsız değişken arasındaki ilişkiyi kurar. Ve ilişki doğrusal nitelikte olmalıdır.
- Doğrusal regresyonun çıktısı yalnızca fiyat, yaş, maaş vb. gibi sürekli değerler olmalıdır. Bağımlı değişken ile bağımsız değişken arasındaki ilişki aşağıdaki resimde gösterilebilir:
Yukarıdaki görselde bağımlı değişken Y ekseninde (maaş), bağımsız değişken ise x ekseninde (deneyim) yer almaktadır. Regresyon doğrusu şu şekilde yazılabilir:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
Burada bir0ve bir1katsayılardır ve ε hata terimidir.
Lojistik regresyon:
- Lojistik regresyon, Denetimli Öğrenme teknikleri kapsamındaki en popüler Makine öğrenme algoritmalarından biridir.
- Regresyon problemlerinin yanı sıra Sınıflandırma için de kullanılabilir, ancak esas olarak Sınıflandırma problemleri için kullanılır.
- Kategorik bağımlı değişkeni bağımsız değişkenler yardımıyla tahmin etmek için lojistik regresyon kullanılır.
- Lojistik Regresyon probleminin çıktısı yalnızca 0 ile 1 arasında olabilir.
- İki sınıf arasındaki olasılıkların gerekli olduğu durumlarda lojistik regresyon kullanılabilir. Bugün yağmur yağıp yağmayacağı, 0 ya da 1, doğru ya da yanlış gibi.
- Lojistik regresyon Maksimum Olabilirlik tahmini kavramına dayanmaktadır. Bu tahmine göre gözlemlenen veriler en olası veriler olmalıdır.
- Lojistik regresyonda, girdilerin ağırlıklı toplamını, 0 ile 1 arasındaki değerleri eşleyebilen bir aktivasyon fonksiyonundan geçiririz. Bu aktivasyon fonksiyonu olarak bilinir. sigmoid işlevi ve elde edilen eğriye sigmoid eğri veya S eğrisi adı verilir. Aşağıdaki görüntüyü göz önünde bulundurun:
- Lojistik regresyon denklemi şöyledir:
Doğrusal Regresyon ile Lojistik Regresyon arasındaki fark:
Doğrusal Regresyon | Lojistik regresyon |
---|---|
Doğrusal regresyon, belirli bir bağımsız değişken kümesini kullanarak sürekli bağımlı değişkeni tahmin etmek için kullanılır. | Lojistik Regresyon, belirli bir bağımsız değişken kümesini kullanarak kategorik bağımlı değişkeni tahmin etmek için kullanılır. |
Regresyon problemini çözmek için Doğrusal Regresyon kullanılır. | Sınıflandırma problemlerini çözmek için lojistik regresyon kullanılır. |
Doğrusal regresyonda sürekli değişkenlerin değerini tahmin ederiz. | Lojistik Regresyonda kategorik değişkenlerin değerlerini tahmin ederiz. |
Doğrusal regresyonda çıktıyı kolayca tahmin edebileceğimiz en iyi uyum çizgisini buluruz. | Lojistik Regresyonda örnekleri sınıflandırabileceğimiz S eğrisini buluruz. |
Doğruluğun tahmini için en küçük kareler tahmin yöntemi kullanılmaktadır. | Doğruluğun tahmini için maksimum olabilirlik tahmin yöntemi kullanılmaktadır. |
Doğrusal Regresyon çıktısı fiyat, yaş vb. gibi sürekli bir değer olmalıdır. | Lojistik Regresyonun çıktısı 0 veya 1, Evet veya Hayır vb. gibi Kategorik bir değer olmalıdır. |
Doğrusal regresyonda bağımlı değişken ile bağımsız değişken arasındaki ilişkinin doğrusal olması gerekir. | Lojistik regresyonda bağımlı ve bağımsız değişken arasında doğrusal bir ilişkinin olması gerekli değildir. |
Doğrusal regresyonda bağımsız değişkenler arasında eşdoğrusallık olabilir. | Lojistik regresyonda bağımsız değişkenler arasında eşdoğrusallık olmamalıdır. |