logo

AlexNet ve GoogleNet arasındaki fark

Son yıllarda derin öğrenme, bilgisayarla görme alanını değiştirerek bilgisayarların görsel bilgileri alışılmadık düzeylerde algılamasına ve çözmesine olanak sağladı. Evrişimli Sinir Ağları (CNN'ler) oyununun bu değişim üzerinde çok önemli bir etkisi oldu ve çığır açan birkaç tasarım buna öncülük etti. En etkili CNN yapılarından ikisi AlexNet ve GoogleNet'tir (InceptionNet). İki model, görüntü sınıflandırma görevlerinin ilerlemesine hep birlikte katkıda bulundu, ancak yapıları ve tasarım ilkeleri açısından farklılık gösteriyorlar. Bu makalede, AlexNet ile GoogleNet arasındaki kritik farkları inceleyerek yapılarını, tasarım kararlarını ve uygulamalarını inceleyeceğiz.

AlexNet ve GoogleNet Arasındaki Temel Farklar

Özellik AlexNet GoogleNet (BaşlangıçV3)
Yayınlandığı / Tanıtıldığı Yıl 2012 2014
Modeldeki Katman Sayısı 8 (5 Evrişim, 3 FC) 159 (Yardımcı Dahil)
Mimari Ardışık Çoklu Şube (Başlangıç)
Evrişim Boyutu Daha büyük filtreler (11x11, 5x5) Daha küçük filtreler (1x1, 3x3, 5x5)
Katmanları Havuzlama Maksimum Havuzlama Maksimum ve Ortalama Havuzlama
Aktivasyon Fonksiyonu sürdürmek ReLU ve Diğer varyasyonlar
Yerel Yanıt Normalleştirmesi (LRN) Kullanılmış Kullanılmamış
Başlangıç ​​Modülleri Kullanılmamış Birçok çoklu şubeyle kullanılır
Hesaplama Verimliliği Ilıman Daha yüksek
Model Karmaşıklığı Düşük Yüksek
En İyi 1 Doğruluk (ImageNet) 0,571 0,739

AlexNet nedir?

AlexNet, Alex Krizhevsky, Ilya Sutskever ve Geoffrey Hinton tarafından oluşturulan dikkate değer bir evrişimli sinir ağı (CNN) mimarisidir. 2012 yılında tanıtıldı ve ImageNet Geniş Kapsamlı Görsel Tanıma Yarışmasında (ILSVRC) farklı metodolojileri geride bırakarak kritik ilerleme kaydetti. AlexNet, görüntü sıralama görevleri için derin öğrenmenin uygulanabilirliğini gösteren başlıca CNN oldu ve bu, bilgisayarlı görme alanında belirleyici bir anı ifade ediyor.

1. Mimarlık

2012'de piyasaya sürülen AlexNet, kritik hata payı ile ImageNet Geniş Kapsamlı Görsel Tanıma Yarışmasını (ILSVRC) kazanan öncü bir CNN'di. Beş evrişimli katman ve ardından üç tamamen ilişkili katmandan oluşur. ReLU'nun (Düzeltilmiş Doğrudan Birim) çalıştırılması ve komşuluk reaksiyonu standardizasyonunun (LRN) kullanılması, başarısını artırdı. AlexNet ayrıca GPU'ları hazırlık sürecine dahil etme fikrini sundu ve bu da deneyimin büyümesini tamamen hızlandırdı.

2. Ağ Derinliği:

Sekiz katmandan (beş evrişimli ve üç tamamen ilişkili katman) oluşan AlexNet, sunulduğu saatte derin olarak görülüyordu. Bununla birlikte, mevcut tasarımların aksine, genellikle yüzeyseldir ve son derece karmaşık veri kümelerindeki akıllara durgunluk veren öğeleri ve örnekleri yakalama kapasitesini kısıtlar.

3. Hesaplamalı Verimlilik:

AlexNet'in GPU hazırlığı sunumu eğitim deneyimini hızlandırsa da, tamamen ilişkili daha derin katmanları ve paralelleştirmenin kısıtlı kullanımı nedeniyle hala hesaplama açısından maliyetliydi.

4. Aşırı Uyum:

Orta düzeyde sığ tasarımı ve çok sayıda sınırı nedeniyle AlexNet, özellikle daha mütevazı veri kümelerinde aşırı uyum sağlamaya daha yatkındı. Daha sonra bu sorunu hafifletmek için okulu bırakma gibi stratejiler tanıtıldı.

AlexNet ve GoogleNet arasındaki fark

5. Eğitim:

Yaratıcılar, AlexNet'i eğitmek için 1.000 sınıflandırmadan 1.000.000'den fazla adlandırılmış görüntü içeren ImageNet veri kümesini kullandı. İyileştirme hesaplaması olarak enerjiyle birlikte stokastik açı düşüşünü (SGD) kullandılar. Eğitim sırasında, eğitim veri kümesinin boyutunu genişletmek ve genellemeyi daha da geliştirmek için keyfi düzenleme ve çevirme gibi bilgi genişletme yöntemleri uygulandı.

Eğitim sistemi hesaplamalı olarak talep edildi ve AlexNet'in eşit kullanım için GPU'ları kullanması gerekli hale geldi. AlexNet'in çift GPU çerçevesinde eğitilmesi yaklaşık yedi gün sürdü; bu, geleneksel bilgisayar işlemcisi tabanlı eğitim süreleriyle karşılaştırıldığında kritik bir gelişmeydi.

6. Sonuçlar:

ImageNet 2012 rekabetinde AlexNet, farklı metodolojileri ezici bir çoğunlukla geride bırakarak yaklaşık %15,3'lük kayda değer bir ilk 5 hata hızı elde etti.

AlexNet'in sonucu, derin öğrenmeye ve CNN'lere yönelik bir ilgi seli başlattı ve yerel bilgisayar görüşünde ek karmaşık ve daha derin sinir ağlarına yönelik yoğunlaşmada bir değişikliğe yol açtı.

7. Evrişimsel Katman Kurulumu:

AlexNet'teki evrişimsel katmanlar, alt örnekleme için periyodik maksimum havuzlama katmanları ile temel bir sırayla düzenlenir. Bu net mühendislik o noktada çok önemliydi ancak organizasyonun karmaşık ilerici unsurları yakalama kapasitesini kısıtlıyordu.

8. Boyutsallığın Azaltılması:

AlexNet, alt örnekleme için maksimum havuzlama katmanlarını içerir ve öğe haritalarının uzamsal bileşenlerini azaltır. Bu, hesaplama ağırlığının azaltılmasına ve aşırı uyumun kontrol edilmesine yardımcı olur.

9. Model Boyutu ve Karmaşıklığı:

AlexNet bu noktada derin olarak görülse de, daha sonraki tasarımlarla karşılaştırıldığında biraz daha mütevazı ve daha az karmaşıktır. Bu basitlik onu daha belirgin hale getirdi ve gerçekleştirdi.

10. Yardımcı Sınıflandırıcıların Kullanımı:

Linux'u barındır

Hazırlık sırasında açıların buharlaşması sorununu çözmek için AlexNet, yardımcı sınıflandırıcılar fikrini sundu. Bu ekstra sınıflandırıcılar orta katmanlara birleştirildi ve geri yayılım sırasında önceki katmanlara açı işaretleri verdi.

11. Araştırma Yönüne Etkisi:

AlexNet'in sonucu, PC görüşü alanında büyük bir değişime işaret ediyordu. Bilim adamlarını, resimle ilgili farklı görevler için derin öğrenme yeteneğini araştırmaya teşvik ederek, daha da geliştirilmiş CNN tasarımlarının hızlı bir şekilde iyileştirilmesine yol açtı.

GoogleNet nedir?

Inception v1 olarak da adlandırılan GoogleNet, Google Brain grubu tarafından, özellikle Christian Szegedy, Wei Liu ve diğerleri tarafından oluşturulan bir CNN mimarisidir. 2014 yılında tanıtıldı ve daha da geliştirilmiş hassasiyet ve hesaplama üretkenliğiyle ILSVRC ödülünü kazandı. GoogleNet'in mimarisi, 22 katmandan oluşan derin tasarımıyla tanımlanıyor ve bu da onu ilk 'olağanüstü derin' CNN'lerden biri yapıyor.

1. Mimarlık

GoogleNet (Inception v1): 2014 yılında sunulan GoogleNet, CNN'lerin Inception grubu için gereklidir. 22 katmandan (başlangıç ​​modülleri) oluşan derin tasarımıyla tanınır. GoogleNet'in hayati gelişimi, benzer bir katman içinde çeşitli kanal boyutlarının eşit evrişimlerini dikkate alan başlangıç ​​modülüdür. Bu, hesaplama karmaşıklığını azaltırken hassasiyeti de korudu ve GoogleNet'i AlexNet'ten daha etkili hale getirdi.

2. Ağ Derinliği:

GoogleNet'in başlangıç ​​modülleri, hesaplama masraflarını artırmadan esasen daha derin bir tasarım olarak kabul edilir. 22 katmanla GoogleNet, genişletilmiş ağ derinliğinin faydalarını gösteren ve daha da gelişmiş kesinlik ve güç sağlayan ana CNN'lerden biriydi.

3. Hesaplamalı Verimlilik:

GoogleNet'teki başlangıç ​​modülleri, hesaplama varlıklarının daha verimli bir şekilde kullanılması olarak kabul edilir. GoogleNet, her başlangıç ​​bloğunda eşit evrişimler kullanarak sınırların ve hesaplamaların sayısını azalttı, sürekli uygulamalar ve varlık gerektiren cihazlar üzerinde aktarım için onu daha erişilebilir hale getirdi.

4. Aşırı Uyum:

GoogleNet'in derin ancak etkili tasarımı, aşırı uyumu önemli ölçüde azalttı ve daha mütevazı veri kümelerinde ve hareketli öğrenme durumlarında daha iyi performans göstermesine olanak tanıdı.

AlexNet ve GoogleNet arasındaki fark

5. Eğitim:

GoogleNet eğitimi ayrıca ImageNet veri kümesinin kullanımına da değinmektedir ve genellemeyi yükseltmek için karşılaştırılabilir bilgi artırma prosedürleri kullanılmıştır. Öyle olsa bile, daha derin mimarisi nedeniyle GoogleNet, eğitim sırasında AlexNet'ten daha fazla hesaplama varlığına ihtiyaç duyuyordu.

Başlangıç ​​modüllerinin geliştirilmesi, GoogleNet'in derinlik ile hesaplama etkinliği arasında bir tür uyum bulmasına olanak tanıdı. Her başlangıç ​​bloğundaki eşit evrişimler, hesaplama sayısını ve sınırları tamamen azaltarak eğitimi daha ulaşılabilir ve etkili hale getirdi.

6. Sonuçlar:

GoogleNet, ImageNet 2014 yarışmasında AlexNet'in sunumundan daha iyi bir performans göstererek, yaklaşık %6,67'lik harika bir ilk 5 hata hızı elde etti.

GoogleNet'in derin ancak yetkin mimarisi, hesaplamalı ulaşılabilirliğe ayak uydururken daha derin sinir ağlarının yeteneğini sergiledi ve onu gerçek uygulamalar için daha ilgi çekici hale getirdi.

7. Evrişimsel Katman Kurulumu:

GoogleNet, çeşitli kanal boyutlarında çok sayıda eşit evrişimli katmandan oluşan başlangıç ​​modülleri fikrini sundu. Bu plan, GoogleNet'in farklı ölçeklerde öne çıkanları yakalamasına olanak tanır ve kuruluşun önemli unsurları farklı düzeylerdeki değerlendirmelerden çıkarma kapasitesi üzerinde tamamen çalışır.

8. Boyutsallığın Azaltılması:

Geleneksel maksimum havuzlamaya rağmen GoogleNet, 1x1 evrişimler gibi boyut azaltma yöntemlerini kullanır. Bu daha mütevazı evrişimler hesaplama açısından daha az artırılır ve temel verileri korurken öğe sayısının azaltılmasına yardımcı olur.

9. Model Boyutu ve Karmaşıklığı:

GoogleNet'in başlangıç ​​modülleri, temelde daha fazla katman ve sınıra sahip daha kapsamlı bir tasarım sağlar. Bu karmaşıklık, daha gelişmiş hassasiyet sunarken aynı zamanda kuruluşun daha fazla test hazırlamasına ve kalibre etmesine de neden olabilir.

10. Yardımcı Sınıflandırıcıların Kullanımı:

GoogleNet, yardımcı sınıflandırıcılar fikrini, bunları başlatma modüllerine dahil ederek geliştirdi. Bu yardımcı sınıflandırıcılar, daha derin katmanların hazırlanmasını ilerletir ve açı akışını yükselterek daha istikrarlı ve etkili bir hazırlığa katkıda bulunur.

11. Araştırma Yönüne Etkisi:

GoogleNet'in başlangıç ​​modülleri, çeşitli ölçeklerde etkili bileşen çıkarma olanağı sunuyordu. Bu fikir, ortaya çıkan tasarımların planını etkileyerek, analistlerin hassasiyeti korurken veya daha da geliştirirken organizasyon derinliğini ve hesaplama üretkenliğini ilerletmeye odaklanmasını sağladı.

Çözüm

Hem AlexNet hem de GoogleNet, bilgisayarla görme ve derin öğrenme alanını kalıcı olarak etkiliyor. AlexNet, CNN'lerin görüntü tanıma görevleri konusundaki yeteneğini sergiledi ve gelecekteki ilerlemeler için hazırlandı. Daha sonra GoogleNet, onları daha etkili ve daha derin CNN yapılarına hazır hale getiren başlangıç ​​modülleri fikrini bir kez daha sundu.

3. çeyrekte hangi aylar var

AlexNet ve GoogleNet'in kendine has özellikleri olsa da, sunumlarından bu yana derin öğrenme alanı temelden gelişti. ResNet, DenseNet ve EfficientNet gibi günümüz tasarımları ayrıca kesinlik, üretkenlik ve genellemenin sınırlarını da zorladı. Analistler bu temel modelleri geliştirmeye ve genişletmeye devam ettikçe, bilgisayarla görmenin kaderi çok daha kayda değer bir kararlılığa ve ek ilgi çekici beklentilere sahip olacaktır.