MAKINE ÖĞRENIMI MODELLERI - MAKINE ÖĞRENME

Makine öğrenimi modeli, eğitim sürecinin çıktısının matematiksel temsili olarak tanımlanır. Makine öğrenimi, deneyim ve eski veriler yoluyla otomatik olarak gelişebilen ve model oluşturabilen farklı algoritmaların incelenmesidir. Makine öğrenimi modeli, önceki deneyimlere veya verilere dayalı kalıpları veya davranışları tanımak için tasarlanmış bilgisayar yazılımına benzer. Öğrenme algoritması, eğitim verileri içindeki kalıpları keşfeder ve bu kalıpları yakalayan ve yeni veriler üzerinde tahminler yapan bir ML modelinin çıktısını alır.

Kullanıcının duygularını yüz ifadelerine göre tanımak için bir uygulama oluşturduğumuz ML modelinin bir örneğini anlayalım. Yani böyle bir uygulamayı oluşturmak, üzerinde çeşitli duyguların etiketlendiği yüzlerin görüntülerini besleyerek bir modeli eğiteceğimiz Makine öğrenimi modelleri ile mümkün. Bu uygulama kullanıcının ruh halini belirlemek için kullanıldığında, tüm beslenen verileri okur ve ardından herhangi bir kullanıcının ruh halini belirler.

Dolayısıyla basit bir ifadeyle şunu söyleyebiliriz: makine öğrenimi modeli, bir şeyin veya sürecin basitleştirilmiş bir temsilidir. Bu konuda farklı makine öğrenimi modellerini ve bunların tekniklerini ve algoritmalarını tartışacağız. .

Makine Öğrenme Modeli Nedir?

Makine Öğrenimi modelleri, yeni veriler içindeki kalıpları bulmak ve tahminlerde bulunmak üzere eğitilmiş bir program olarak anlaşılabilir. Bu modeller, girdi verileri biçimindeki istekleri alan, girdi verileri üzerinde tahminler yapan ve ardından yanıt olarak bir çıktı sağlayan matematiksel bir fonksiyon olarak temsil edilir. İlk olarak, bu modeller bir veri kümesi üzerinden eğitilir ve daha sonra veriler üzerinde akıl yürütmek, feed verilerinden modeli çıkarmak ve bu verilerden öğrenmek için onlara bir algoritma sağlanır. Bu modeller eğitildikten sonra görünmeyen veri kümesini tahmin etmek için kullanılabilirler.

Farklı iş hedeflerine ve veri kümelerine dayalı olarak çeşitli türde makine öğrenimi modelleri mevcuttur.

Makine Öğrenmesi Modellerinin Sınıflandırılması:

Algoritmalar için farklı iş hedeflerine ve veri kümelerine dayalı üç öğrenme modeli vardır. Her makine öğrenimi algoritması üç modelden birine yerleşir:

Denetimli Öğrenme
Denetimsiz Öğrenme
Takviyeli Öğrenme

Denetimli Öğrenme ayrıca iki kategoriye ayrılır:

sınıflandırma
Regresyon

Denetimsiz Öğrenme ayrıca aşağıdaki kategorilere ayrılmıştır:

Kümeleme
Birliktelik Kuralı
Boyutsal küçülme

1. Denetimli Makine Öğrenimi Modelleri

Denetimli Öğrenme, hangi giriş verilerinin eğitim verileri olarak adlandırıldığını ve çıkış olarak bilinen bir etikete veya sonuca sahip olduğunu anlamak için en basit makine öğrenimi modelidir. Yani giriş-çıkış çiftleri prensibiyle çalışır. Bir eğitim veri seti kullanılarak eğitilebilecek bir fonksiyon oluşturulmasını gerektirir ve daha sonra bilinmeyen verilere uygulanarak bazı tahmin performansı sağlar. Denetimli öğrenme göreve dayalıdır ve etiketli veri kümeleri üzerinde test edilmiştir.

Denetimli öğrenme modelini basit gerçek hayat problemlerine uygulayabiliriz. Örneğin yaş ve boydan oluşan bir veri setimiz var; daha sonra kişinin boyunu yaşına göre tahmin etmek için denetimli bir öğrenme modeli oluşturabiliriz.

Denetimli Öğrenme modelleri ayrıca iki kategoriye ayrılır:

Regresyon

Regresyon problemlerinde çıktı sürekli bir değişkendir. Yaygın olarak kullanılan bazı Regresyon modelleri şunlardır:

a) Doğrusal Regresyon

Doğrusal regresyon, bir veya daha fazla girdi değişkeni kullanarak bir çıktı değişkenini tahmin etmeye çalıştığımız en basit makine öğrenme modelidir. Doğrusal regresyonun temsili, bir dizi girdi değerini (x) ve tahmin edilen çıktıyı (y) bu girdi değerleri kümesi için birleştiren doğrusal bir denklemdir. Bir çizgi şeklinde temsil edilir:

Y = bx + c.

Doğrusal regresyon modelinin temel amacı veri noktalarına en iyi uyan doğruyu bulmaktır.

Doğrusal regresyon, çoklu doğrusal regresyona (en iyi uyum düzlemini bulun) ve polinom regresyona (en iyi uyum eğrisini bulun) kadar genişletilir.

b) Karar Ağacı

jsonobject'e dize

Karar ağaçları hem regresyon hem de sınıflandırma problemlerinde kullanılabilecek popüler makine öğrenme modelleridir.

Karar ağacı, kararların olası sonuçları ve sonuçlarıyla birlikte ağaca benzer bir yapı kullanır. Burada her dahili düğüm, bir öznitelik üzerindeki testi temsil etmek için kullanılır; her dal testin sonucunu temsil etmek için kullanılır. Karar ağacında ne kadar çok düğüm varsa sonuç o kadar doğru olur.

Karar ağaçlarının avantajı, sezgisel olmaları ve uygulanmasının kolay olmasıdır, ancak doğruluktan yoksundurlar.

Karar ağaçları yaygın olarak kullanılmaktadır. Yöneylem araştırması, özellikle karar analizinde, stratejik planlamada ve esas olarak makine öğreniminde.

c) Rastgele Orman

Rastgele Orman, çok sayıda karar ağacından oluşan topluluk öğrenme yöntemidir. Rastgele ormandaki her karar ağacı bir sonucu tahmin eder ve oyların çoğunluğunu alan tahmin sonuç olarak kabul edilir.

Rastgele orman modeli hem regresyon hem de sınıflandırma problemleri için kullanılabilir.

Sınıflandırma görevi için rastgele ormanın sonucu oyların çoğunluğundan alınır. Regresyon görevinde ise sonuç, her ağacın ürettiği tahminlerin ortalamasından veya ortalamasından alınır.

d) Sinir Ağları

Sinir ağları, makine öğreniminin alt kümesidir ve yapay sinir ağları olarak da bilinir. Sinir ağları yapay nöronlardan oluşmakta ve insan beyninin yapısına ve çalışmasına benzeyecek şekilde tasarlanmaktadır. Her yapay nöron, bir sinir ağındaki diğer birçok nöronla bağlantı kurar ve bu milyonlarca bağlantılı nöron, karmaşık bir bilişsel yapı oluşturur.

Sinir ağları, bir giriş katmanı, bir veya daha fazla gizli katman ve bir çıkış katmanı içeren çok katmanlı bir yapıdan oluşur. Her nöron başka bir nörona bağlı olduğundan, bir katmandaki verileri bir sonraki katmandaki diğer nörona aktarır. Son olarak veriler, sinir ağının son katmanına veya çıktı katmanına ulaşır ve çıktı üretir.

Sinir ağları, öğrenmek ve doğruluklarını geliştirmek için eğitim verilerine dayanır. Ancak mükemmel şekilde eğitilmiş ve doğru bir sinir ağı, verileri hızlı bir şekilde kümeleyebilir ve güçlü bir makine öğrenimi ve yapay zeka aracı haline gelebilir. En iyi bilinen sinir ağlarından biri Google'ın arama algoritması.

sınıflandırma

Sınıflandırma modelleri, kategorik formda gözlemlenen değerlerden sonuçlar çıkarmak için kullanılan ikinci tür Denetimli Öğrenme teknikleridir. Örneğin sınıflandırma modeli, e-postanın spam olup olmadığını belirleyebilir; bir alıcı ürünü satın alacak mı almayacak mı vb. Sınıflandırma algoritmaları iki sınıfı tahmin etmek ve çıktıyı farklı gruplara ayırmak için kullanılır.

Sınıflandırmada, veri setini farklı kategorilere ayıran bir sınıflandırıcı modeli tasarlanmakta ve her kategoriye bir etiket atanmaktadır.

Makine öğreniminde iki tür sınıflandırma vardır:

İkili sınıflandırma: Sorunun yalnızca iki olası sınıfı varsa buna ikili sınıflandırıcı denir. Örneğin kedi veya köpek, Evet veya Hayır,Çok sınıflı sınıflandırma: Eğer problemin ikiden fazla olası sınıfı varsa, bu çok sınıflı bir sınıflandırıcıdır.

Bazı popüler sınıflandırma algoritmaları aşağıdaki gibidir:

a) Lojistik Regresyon

Lojistik Regresyon, makine öğrenmesinde sınıflandırma problemlerini çözmek için kullanılır. Doğrusal regresyona benzerler ancak kategorik değişkenleri tahmin etmek için kullanılırlar. Çıktıyı Evet veya Hayır, 0 veya 1, Doğru veya Yanlış vb. olarak tahmin edebilir. Ancak kesin değerleri vermek yerine 0 ile 1 arasındaki olasılıksal değerleri sağlar.

b) Destek Vektör Makinesi

Destek vektör makinesi veya SVM, sınıflandırma ve regresyon görevleri için yaygın olarak kullanılan popüler makine öğrenme algoritmasıdır. Ancak özellikle sınıflandırma problemlerini çözmek için kullanılır. DVM'nin temel amacı, veri noktalarını sınıflara ayırabilen N boyutlu bir uzayda en iyi karar sınırlarını bulmaktır ve en iyi karar sınırı Hiperdüzlem olarak bilinir. SVM hiperdüzlemi bulmak için uç vektörü seçer ve bu vektörler destek vektörleri olarak bilinir.

c) Naif Bayes

Naïve Bayes, makine öğreniminde kullanılan bir başka popüler sınıflandırma algoritmasıdır. Bayes teoremine dayandığı ve özellikler arasındaki basit (bağımsız) varsayımı takip ettiği için bu şekilde adlandırılmıştır:

Her bir naif Bayes sınıflandırıcısı, belirli bir değişkenin değerinin diğer herhangi bir değişkenden/özellikten bağımsız olduğunu varsayar. Örneğin bir meyvenin rengine, şekline ve tadına göre sınıflandırılması gerekiyorsa. Yani sarı, oval ve tatlı mango olarak tanınacaktır. Burada her özellik diğer özelliklerden bağımsızdır.

2. Denetimsiz Makine öğrenimi modelleri

Denetimsiz Makine öğrenimi modelleri, denetimli öğrenmenin tersi olan öğrenme sürecini uygular; bu, modelin etiketlenmemiş eğitim veri kümesinden öğrenmesine olanak sağladığı anlamına gelir. Model, etiketlenmemiş veri kümesine dayanarak çıktıyı tahmin eder. Denetimsiz öğrenmeyi kullanan model, veri kümesindeki gizli kalıpları herhangi bir denetime gerek kalmadan kendi kendine öğrenir.

Denetimsiz öğrenme modelleri temel olarak aşağıdaki üç görevi gerçekleştirmek için kullanılır:

Görüntü segmentasyonu, İstatistiksel veri analizi, Pazar segmentasyonu

K-Kümeleme, hiyerarşik Kümeleme, DBSCAN anlamına gelir

Pazar Sepeti analizi, Web kullanım madenciliği, sürekli üretim

Apriori Algoritması, Eclat, FP-büyüme algoritması.

Yüksek boyutlu veri kümesini daha küçük boyutlu veri kümesine dönüştürerek benzer bilgiler sağlamasına yönelik bir işlemdir.

PCA (Temel Bileşen Analizi), Tekil Değer Ayrışımı vb.

Takviyeli Öğrenme

Takviyeli öğrenmede algoritma, bir hedef duruma yol açan belirli bir durum kümesi için eylemleri öğrenir. Çevreyle etkileşime girerek her durum veya eylemden sonra geri bildirim sinyalleri alan geri bildirime dayalı bir öğrenme modelidir. Bu geri bildirim bir ödül olarak çalışır (her iyi eylem için olumlu ve her kötü eylem için olumsuz) ve temsilcinin hedefi, performansını artırmak için olumlu ödülleri en üst düzeye çıkarmaktır.

Takviyeli öğrenmede modelin davranışı, insanların geri bildirim olarak deneyimler yoluyla bir şeyler öğrenmesi ve çevreyle etkileşime girmesi nedeniyle insan öğrenmesine benzer.

Takviyeli öğrenme kapsamına giren bazı popüler algoritmalar aşağıda verilmiştir:

Q-öğrenme:Q-öğrenme, Bellman denklemine dayanan, takviyeli öğrenmenin popüler modelsiz algoritmalarından biridir.

Belirli bir durumda yapay zeka temsilcisinin ödülü en üst düzeye çıkarmak için en iyi eylemi yapmasına yardımcı olabilecek politikayı öğrenmeyi amaçlamaktadır. Belirli bir durum yolunu takip etmenin ödülünü belirten her durum-eylem çifti için Q değerlerini içerir ve Q değerini maksimuma çıkarmaya çalışır.

Durum Eylemi Ödülü Durum Eylemi için, tuple'ı (s, a, r, s', a') simgeliyor.

veya Deep Q Sinir ağı Q-öğreniyor

Makine Öğrenimi Modellerinin Eğitimi

Makine öğrenimi modeli oluşturulduktan sonra uygun sonuçların alınabilmesi için eğitilir. Bir makine öğrenimi modelini eğitmek için büyük miktarda önceden işlenmiş veriye ihtiyaç vardır. Burada önceden işlenmiş veriler, azaltılmış null değerleri vb. içeren yapılandırılmış formdaki veriler anlamına gelir. Önceden işlenmiş verileri sağlamazsak, modelimizin çok kötü performans gösterme ihtimali çok yüksektir.

En iyi model nasıl seçilir?

Yukarıdaki bölümde farklı makine öğrenimi modellerini ve algoritmalarını tartıştık. Ancak yeni başlayanların aklına gelebilecek en kafa karıştırıcı soru 'hangi modeli seçmeliyim?'. Yani cevap, bunun esas olarak iş gereksinimine veya proje gereksinimine bağlı olduğudur. Bunun dışında ilgili niteliklere, mevcut veri kümesinin hacmine, özelliklerin sayısına, karmaşıklığa vb. de bağlıdır. Ancak pratikte her zaman belirli bir duruma uygulanabilecek en basit modelle başlamamız önerilir. Sorunu çözün ve ardından yavaş yavaş karmaşıklığı artırın ve parametre ayarlama ve çapraz doğrulama yardımıyla doğruluğu test edin.

Makine öğrenimi modeli ile Algoritmalar arasındaki fark

Yeni başlayanlar arasında en kafa karıştırıcı sorulardan biri, makine öğrenimi modelleri ve algoritmaların aynı olup olmadığıdır. Çünkü makine öğrenimi ve veri bilimindeki çeşitli durumlarda bu iki terim birbirinin yerine kullanılmaktadır.

Bu sorunun cevabı Hayır'dır ve makine öğrenimi modeli bir algoritma ile aynı değildir. Basit bir şekilde, bir ML algoritması, verilerden kalıplar keşfetmek için veriler üzerinde çalışan bir prosedür veya yöntem gibidir. ve modeli oluşturun. Aynı zamanda bir Makine öğrenimi modeli, çıktı üreten veya tahminlerde bulunan bir bilgisayar programı gibidir . Daha spesifik olarak, bir algoritmayı verilerle eğittiğimizde bu bir model haline gelir.

 Machine Learning Model = Model Data + Prediction Algorithm