Makine öğrenimi modeli, eğitim sürecinin çıktısının matematiksel temsili olarak tanımlanır. Makine öğrenimi, deneyim ve eski veriler yoluyla otomatik olarak gelişebilen ve model oluşturabilen farklı algoritmaların incelenmesidir. Makine öğrenimi modeli, önceki deneyimlere veya verilere dayalı kalıpları veya davranışları tanımak için tasarlanmış bilgisayar yazılımına benzer. Öğrenme algoritması, eğitim verileri içindeki kalıpları keşfeder ve bu kalıpları yakalayan ve yeni veriler üzerinde tahminler yapan bir ML modelinin çıktısını alır.
Kullanıcının duygularını yüz ifadelerine göre tanımak için bir uygulama oluşturduğumuz ML modelinin bir örneğini anlayalım. Yani böyle bir uygulamayı oluşturmak, üzerinde çeşitli duyguların etiketlendiği yüzlerin görüntülerini besleyerek bir modeli eğiteceğimiz Makine öğrenimi modelleri ile mümkün. Bu uygulama kullanıcının ruh halini belirlemek için kullanıldığında, tüm beslenen verileri okur ve ardından herhangi bir kullanıcının ruh halini belirler.
Dolayısıyla basit bir ifadeyle şunu söyleyebiliriz: makine öğrenimi modeli, bir şeyin veya sürecin basitleştirilmiş bir temsilidir. Bu konuda farklı makine öğrenimi modellerini ve bunların tekniklerini ve algoritmalarını tartışacağız. .
Makine Öğrenme Modeli Nedir?
Makine Öğrenimi modelleri, yeni veriler içindeki kalıpları bulmak ve tahminlerde bulunmak üzere eğitilmiş bir program olarak anlaşılabilir. Bu modeller, girdi verileri biçimindeki istekleri alan, girdi verileri üzerinde tahminler yapan ve ardından yanıt olarak bir çıktı sağlayan matematiksel bir fonksiyon olarak temsil edilir. İlk olarak, bu modeller bir veri kümesi üzerinden eğitilir ve daha sonra veriler üzerinde akıl yürütmek, feed verilerinden modeli çıkarmak ve bu verilerden öğrenmek için onlara bir algoritma sağlanır. Bu modeller eğitildikten sonra görünmeyen veri kümesini tahmin etmek için kullanılabilirler.
Farklı iş hedeflerine ve veri kümelerine dayalı olarak çeşitli türde makine öğrenimi modelleri mevcuttur.
Makine Öğrenmesi Modellerinin Sınıflandırılması:
Algoritmalar için farklı iş hedeflerine ve veri kümelerine dayalı üç öğrenme modeli vardır. Her makine öğrenimi algoritması üç modelden birine yerleşir:
- Denetimli Öğrenme
- Denetimsiz Öğrenme
- Takviyeli Öğrenme
Denetimli Öğrenme ayrıca iki kategoriye ayrılır:
- sınıflandırma
- Regresyon
Denetimsiz Öğrenme ayrıca aşağıdaki kategorilere ayrılmıştır:
- Kümeleme
- Birliktelik Kuralı
- Boyutsal küçülme
1. Denetimli Makine Öğrenimi Modelleri
Denetimli Öğrenme, hangi giriş verilerinin eğitim verileri olarak adlandırıldığını ve çıkış olarak bilinen bir etikete veya sonuca sahip olduğunu anlamak için en basit makine öğrenimi modelidir. Yani giriş-çıkış çiftleri prensibiyle çalışır. Bir eğitim veri seti kullanılarak eğitilebilecek bir fonksiyon oluşturulmasını gerektirir ve daha sonra bilinmeyen verilere uygulanarak bazı tahmin performansı sağlar. Denetimli öğrenme göreve dayalıdır ve etiketli veri kümeleri üzerinde test edilmiştir.
Denetimli öğrenme modelini basit gerçek hayat problemlerine uygulayabiliriz. Örneğin yaş ve boydan oluşan bir veri setimiz var; daha sonra kişinin boyunu yaşına göre tahmin etmek için denetimli bir öğrenme modeli oluşturabiliriz.
Denetimli Öğrenme modelleri ayrıca iki kategoriye ayrılır:
Regresyon
Regresyon problemlerinde çıktı sürekli bir değişkendir. Yaygın olarak kullanılan bazı Regresyon modelleri şunlardır:
a) Doğrusal Regresyon
Doğrusal regresyon, bir veya daha fazla girdi değişkeni kullanarak bir çıktı değişkenini tahmin etmeye çalıştığımız en basit makine öğrenme modelidir. Doğrusal regresyonun temsili, bir dizi girdi değerini (x) ve tahmin edilen çıktıyı (y) bu girdi değerleri kümesi için birleştiren doğrusal bir denklemdir. Bir çizgi şeklinde temsil edilir:
Y = bx + c.
Doğrusal regresyon modelinin temel amacı veri noktalarına en iyi uyan doğruyu bulmaktır.
Doğrusal regresyon, çoklu doğrusal regresyona (en iyi uyum düzlemini bulun) ve polinom regresyona (en iyi uyum eğrisini bulun) kadar genişletilir.
b) Karar Ağacı
jsonobject'e dize
Karar ağaçları hem regresyon hem de sınıflandırma problemlerinde kullanılabilecek popüler makine öğrenme modelleridir.
Karar ağacı, kararların olası sonuçları ve sonuçlarıyla birlikte ağaca benzer bir yapı kullanır. Burada her dahili düğüm, bir öznitelik üzerindeki testi temsil etmek için kullanılır; her dal testin sonucunu temsil etmek için kullanılır. Karar ağacında ne kadar çok düğüm varsa sonuç o kadar doğru olur.
Karar ağaçlarının avantajı, sezgisel olmaları ve uygulanmasının kolay olmasıdır, ancak doğruluktan yoksundurlar.
Karar ağaçları yaygın olarak kullanılmaktadır. Yöneylem araştırması, özellikle karar analizinde, stratejik planlamada ve esas olarak makine öğreniminde.
c) Rastgele Orman
Rastgele Orman, çok sayıda karar ağacından oluşan topluluk öğrenme yöntemidir. Rastgele ormandaki her karar ağacı bir sonucu tahmin eder ve oyların çoğunluğunu alan tahmin sonuç olarak kabul edilir.
Rastgele orman modeli hem regresyon hem de sınıflandırma problemleri için kullanılabilir.
Sınıflandırma görevi için rastgele ormanın sonucu oyların çoğunluğundan alınır. Regresyon görevinde ise sonuç, her ağacın ürettiği tahminlerin ortalamasından veya ortalamasından alınır.
d) Sinir Ağları
Sinir ağları, makine öğreniminin alt kümesidir ve yapay sinir ağları olarak da bilinir. Sinir ağları yapay nöronlardan oluşmakta ve insan beyninin yapısına ve çalışmasına benzeyecek şekilde tasarlanmaktadır. Her yapay nöron, bir sinir ağındaki diğer birçok nöronla bağlantı kurar ve bu milyonlarca bağlantılı nöron, karmaşık bir bilişsel yapı oluşturur.
Sinir ağları, bir giriş katmanı, bir veya daha fazla gizli katman ve bir çıkış katmanı içeren çok katmanlı bir yapıdan oluşur. Her nöron başka bir nörona bağlı olduğundan, bir katmandaki verileri bir sonraki katmandaki diğer nörona aktarır. Son olarak veriler, sinir ağının son katmanına veya çıktı katmanına ulaşır ve çıktı üretir.
Sinir ağları, öğrenmek ve doğruluklarını geliştirmek için eğitim verilerine dayanır. Ancak mükemmel şekilde eğitilmiş ve doğru bir sinir ağı, verileri hızlı bir şekilde kümeleyebilir ve güçlü bir makine öğrenimi ve yapay zeka aracı haline gelebilir. En iyi bilinen sinir ağlarından biri Google'ın arama algoritması.
sınıflandırma
Sınıflandırma modelleri, kategorik formda gözlemlenen değerlerden sonuçlar çıkarmak için kullanılan ikinci tür Denetimli Öğrenme teknikleridir. Örneğin sınıflandırma modeli, e-postanın spam olup olmadığını belirleyebilir; bir alıcı ürünü satın alacak mı almayacak mı vb. Sınıflandırma algoritmaları iki sınıfı tahmin etmek ve çıktıyı farklı gruplara ayırmak için kullanılır.
Sınıflandırmada, veri setini farklı kategorilere ayıran bir sınıflandırıcı modeli tasarlanmakta ve her kategoriye bir etiket atanmaktadır.
Makine öğreniminde iki tür sınıflandırma vardır:
Bazı popüler sınıflandırma algoritmaları aşağıdaki gibidir:
a) Lojistik Regresyon
Lojistik Regresyon, makine öğrenmesinde sınıflandırma problemlerini çözmek için kullanılır. Doğrusal regresyona benzerler ancak kategorik değişkenleri tahmin etmek için kullanılırlar. Çıktıyı Evet veya Hayır, 0 veya 1, Doğru veya Yanlış vb. olarak tahmin edebilir. Ancak kesin değerleri vermek yerine 0 ile 1 arasındaki olasılıksal değerleri sağlar.
b) Destek Vektör Makinesi
Destek vektör makinesi veya SVM, sınıflandırma ve regresyon görevleri için yaygın olarak kullanılan popüler makine öğrenme algoritmasıdır. Ancak özellikle sınıflandırma problemlerini çözmek için kullanılır. DVM'nin temel amacı, veri noktalarını sınıflara ayırabilen N boyutlu bir uzayda en iyi karar sınırlarını bulmaktır ve en iyi karar sınırı Hiperdüzlem olarak bilinir. SVM hiperdüzlemi bulmak için uç vektörü seçer ve bu vektörler destek vektörleri olarak bilinir.
c) Naif Bayes
Naïve Bayes, makine öğreniminde kullanılan bir başka popüler sınıflandırma algoritmasıdır. Bayes teoremine dayandığı ve özellikler arasındaki basit (bağımsız) varsayımı takip ettiği için bu şekilde adlandırılmıştır:
Her bir naif Bayes sınıflandırıcısı, belirli bir değişkenin değerinin diğer herhangi bir değişkenden/özellikten bağımsız olduğunu varsayar. Örneğin bir meyvenin rengine, şekline ve tadına göre sınıflandırılması gerekiyorsa. Yani sarı, oval ve tatlı mango olarak tanınacaktır. Burada her özellik diğer özelliklerden bağımsızdır.
2. Denetimsiz Makine öğrenimi modelleri
Denetimsiz Makine öğrenimi modelleri, denetimli öğrenmenin tersi olan öğrenme sürecini uygular; bu, modelin etiketlenmemiş eğitim veri kümesinden öğrenmesine olanak sağladığı anlamına gelir. Model, etiketlenmemiş veri kümesine dayanarak çıktıyı tahmin eder. Denetimsiz öğrenmeyi kullanan model, veri kümesindeki gizli kalıpları herhangi bir denetime gerek kalmadan kendi kendine öğrenir.
Denetimsiz öğrenme modelleri temel olarak aşağıdaki üç görevi gerçekleştirmek için kullanılır:
Kümeleme, veri noktalarını benzerliklere ve farklılıklara göre farklı kümelere ayırmayı veya kümelemeyi içeren denetimsiz bir öğrenme tekniğidir. En fazla benzerliğe sahip nesneler aynı grupta kalır ve diğer gruplardan benzerlikleri yoktur veya çok azdır.
Kümeleme algoritmaları aşağıdaki gibi farklı görevlerde yaygın olarak kullanılabilir: Görüntü segmentasyonu, İstatistiksel veri analizi, Pazar segmentasyonu , vesaire.
Yaygın olarak kullanılan bazı Kümeleme algoritmaları şunlardır: K-Kümeleme, hiyerarşik Kümeleme, DBSCAN anlamına gelir , vesaire.
Birliktelik kuralı öğrenme, büyük bir veri kümesindeki değişkenler arasında ilginç ilişkiler bulan denetimsiz bir öğrenme tekniğidir. Bu öğrenme algoritmasının temel amacı, bir veri öğesinin başka bir veri öğesine bağımlılığını bulmak ve bu değişkenleri buna göre eşleştirerek maksimum kâr elde etmektir. Bu algoritma esas olarak şu alanlarda uygulanır: Pazar Sepeti analizi, Web kullanım madenciliği, sürekli üretim , vesaire.
Birliktelik kuralı öğrenmenin bazı popüler algoritmaları şunlardır: Apriori Algoritması, Eclat, FP-büyüme algoritması.
Bir veri kümesinde mevcut olan özelliklerin/değişkenlerin sayısı, veri kümesinin boyutluluğu olarak bilinir ve boyutluluğu azaltmak için kullanılan teknik, boyutluluk azaltma tekniği olarak bilinir.
Daha fazla veri daha doğru sonuçlar sağlasa da, aşırı uyum sorunları gibi modelin/algoritmanın performansını da etkileyebilir. Bu gibi durumlarda boyut azaltma teknikleri kullanılır.
' Yüksek boyutlu veri kümesini daha küçük boyutlu veri kümesine dönüştürerek benzer bilgiler sağlamasına yönelik bir işlemdir. .'
Farklı boyutluluk azaltma yöntemleri PCA (Temel Bileşen Analizi), Tekil Değer Ayrışımı vb.
Takviyeli Öğrenme
Takviyeli öğrenmede algoritma, bir hedef duruma yol açan belirli bir durum kümesi için eylemleri öğrenir. Çevreyle etkileşime girerek her durum veya eylemden sonra geri bildirim sinyalleri alan geri bildirime dayalı bir öğrenme modelidir. Bu geri bildirim bir ödül olarak çalışır (her iyi eylem için olumlu ve her kötü eylem için olumsuz) ve temsilcinin hedefi, performansını artırmak için olumlu ödülleri en üst düzeye çıkarmaktır.
Takviyeli öğrenmede modelin davranışı, insanların geri bildirim olarak deneyimler yoluyla bir şeyler öğrenmesi ve çevreyle etkileşime girmesi nedeniyle insan öğrenmesine benzer.
Takviyeli öğrenme kapsamına giren bazı popüler algoritmalar aşağıda verilmiştir:
Belirli bir durumda yapay zeka temsilcisinin ödülü en üst düzeye çıkarmak için en iyi eylemi yapmasına yardımcı olabilecek politikayı öğrenmeyi amaçlamaktadır. Belirli bir durum yolunu takip etmenin ödülünü belirten her durum-eylem çifti için Q değerlerini içerir ve Q değerini maksimuma çıkarmaya çalışır.
Makine Öğrenimi Modellerinin Eğitimi
Makine öğrenimi modeli oluşturulduktan sonra uygun sonuçların alınabilmesi için eğitilir. Bir makine öğrenimi modelini eğitmek için büyük miktarda önceden işlenmiş veriye ihtiyaç vardır. Burada önceden işlenmiş veriler, azaltılmış null değerleri vb. içeren yapılandırılmış formdaki veriler anlamına gelir. Önceden işlenmiş verileri sağlamazsak, modelimizin çok kötü performans gösterme ihtimali çok yüksektir.
En iyi model nasıl seçilir?
Yukarıdaki bölümde farklı makine öğrenimi modellerini ve algoritmalarını tartıştık. Ancak yeni başlayanların aklına gelebilecek en kafa karıştırıcı soru 'hangi modeli seçmeliyim?'. Yani cevap, bunun esas olarak iş gereksinimine veya proje gereksinimine bağlı olduğudur. Bunun dışında ilgili niteliklere, mevcut veri kümesinin hacmine, özelliklerin sayısına, karmaşıklığa vb. de bağlıdır. Ancak pratikte her zaman belirli bir duruma uygulanabilecek en basit modelle başlamamız önerilir. Sorunu çözün ve ardından yavaş yavaş karmaşıklığı artırın ve parametre ayarlama ve çapraz doğrulama yardımıyla doğruluğu test edin.
Makine öğrenimi modeli ile Algoritmalar arasındaki fark
Yeni başlayanlar arasında en kafa karıştırıcı sorulardan biri, makine öğrenimi modelleri ve algoritmaların aynı olup olmadığıdır. Çünkü makine öğrenimi ve veri bilimindeki çeşitli durumlarda bu iki terim birbirinin yerine kullanılmaktadır.
Bu sorunun cevabı Hayır'dır ve makine öğrenimi modeli bir algoritma ile aynı değildir. Basit bir şekilde, bir ML algoritması, verilerden kalıplar keşfetmek için veriler üzerinde çalışan bir prosedür veya yöntem gibidir. ve modeli oluşturun. Aynı zamanda bir Makine öğrenimi modeli, çıktı üreten veya tahminlerde bulunan bir bilgisayar programı gibidir . Daha spesifik olarak, bir algoritmayı verilerle eğittiğimizde bu bir model haline gelir.
Machine Learning Model = Model Data + Prediction Algorithm