logo

Veri Madenciliğinde CRISP Nedir?

CRISP-DM, veri madenciliği için endüstriler arası standart süreci temsil eder. CRISP-DM metodolojisi, bir veri madenciliği projesinin planlanmasına yönelik yapılandırılmış bir yaklaşım sağlar. Sağlam ve kanıtlanmış bir metodolojidir. Üzerinde herhangi bir mülkiyet iddiasında değiliz. Onu biz icat etmedik. İş sorunlarını çözmek için analitiği kullanırken güçlü pratiklik, esneklik ve kullanışlılığın dönüştürücüsüyüz. Neredeyse her müşteri toplantısında geçen altın konu budur.

Bu model idealize edilmiş bir olaylar dizisidir. Uygulamada birçok görev farklı bir sırayla gerçekleştirilebilir ve çoğu zaman önceki görevlere geri dönüp belirli eylemleri tekrarlamak gerekli olacaktır. Model, veri madenciliği süreci boyunca olası tüm rotaları yakalamaya çalışmaz.

CRISP nasıl yardımcı olur?

CRISP DM bir yol haritası sağlar, size en iyi uygulamaları sunar ve veri madenciliği kullanımında daha iyi ve daha hızlı sonuçlar elde etmek için yapılar sağlar; böylece işletmenin bir veri madenciliği projesini planlarken ve yürütürken takip etmesine bu şekilde yardımcı olur.

CRISP-DM'nin Aşamaları

CRISP-DM, bir süreç modeli olarak veri madenciliği yaşam döngüsüne genel bir bakış sağlar. Yaşam döngüsü modeli altı aşamadan oluşur; oklar, aşamalar arasındaki en önemli ve sık görülen bağımlılıkları gösterir. Aşamaların sırası kesin değildir. Ve çoğu proje gerektiğinde fazlar arasında ileri geri hareket eder. CRISP-DM modeli esnektir ve kolayca özelleştirilebilir.

Örneğin, kuruluşunuz kara para aklamayı tespit etmeyi hedefliyorsa, büyük olasılıkla belirli bir modelleme hedefi olmadan büyük miktarda veriyi eleyeceksiniz. Çalışmanız, modelleme yerine finansal verilerdeki şüpheli kalıpları ortaya çıkarmak için veri keşfetmeye ve görselleştirmeye odaklanacaktır. CRISP-DM ihtiyaçlarınıza uygun bir veri madenciliği modeli oluşturmanıza olanak tanır.

Bir projenin tipik aşamalarının tanımlarını, her aşamada yer alan görevleri ve bu görevler arasındaki ilişkilerin açıklamasını içerir.

Veri Madenciliğinde CRISP Nedir?

Aşama 1: İş Anlayışı

CRISP-DM sürecinin ilk aşaması, iş perspektifinden neyi başarmak istediğinizi anlamaktır. Kuruluşunuzun uygun şekilde dengelenmesi gereken birbiriyle rekabet eden hedefleri ve kısıtlamaları olabilir. Bu süreç aşaması, projenin sonucunu etkileyen önemli faktörleri ortaya çıkarmayı amaçlamaktadır. Bu adımı ihmal etmek, yanlış sorulara doğru yanıtlar üretmek için çok fazla çaba sarf edilmesi anlamına gelebilir.

Projenin arzu edilen çıktıları nelerdir?

    Hedefleri belirleyin:Birincil hedefinizi iş perspektifinden tanımlayın. Bahsetmek istediğiniz başka ilgili sorular da olabilir. Örneğin, birincil hedefiniz mevcut müşterilerinizi ne zaman bir rakibe geçme eğiliminde olacaklarını tahmin ederek elinizde tutmak olabilir.Proje planı üretin:Veri madenciliği ve iş hedeflerine ulaşma planını açıklayın. Plan, araçların ve tekniklerin ilk seçimi de dahil olmak üzere, projenin geri kalanında gerçekleştirilecek adımları belirtmelidir.İş başarısı kriterleri:Burada projenin iş açısından başarılı olup olmadığını belirlemek için kullanacağınız kriterleri belirleyeceksiniz. Bunlar ideal olarak spesifik ve ölçülebilir olmalıdır; örneğin müşteri ritmini belirli bir seviyeye düşürmek. Ancak bazen ilişkilere ilişkin yararlı bilgiler vermek gibi daha öznel ölçütlere sahip olmak gerekli olabilir.

Mevcut durumu değerlendirin

akşam yemeği vs akşam yemeği

Bu, veri analizi hedefinizi ve proje planınızı belirlerken dikkate almanız gereken kaynaklar, kısıtlamalar, varsayımlar ve diğer faktörler hakkında daha ayrıntılı bilgi toplamayı içerir.

    Kaynak envanteri:Aşağıdakiler de dahil olmak üzere proje için mevcut olan kaynakları listeleyin:
    • Personel (iş uzmanları, veri uzmanları, teknik destek, veri madenciliği uzmanları)
    • Veriler (sabit alıntılar, canlı, depolanmış veya operasyonel verilere erişim)
    • Bilgi işlem kaynakları (donanım platformları)
    • Yazılım (veri madenciliği araçları, diğer ilgili yazılımlar)
    Gereksinimler, varsayımlar ve kısıtlamalar:Tamamlama takvimi, gerekli anlaşılırlık ve sonuçların kalitesi ve veri güvenliği endişeleri ve yasal sorunlar da dahil olmak üzere projenin tüm gereksinimlerini listeleyin. Verileri kullanmanıza izin verildiğinden emin olun. Proje tarafından yapılan varsayımları listeleyin. Bunlar, veri madenciliği sırasında doğrulanabilecek verilere ilişkin varsayımlar olabileceği gibi, projeyle ilgili işe ilişkin doğrulanamayan varsayımları da içerebilir. Sonuçların geçerliliğini etkiliyorsa ikincisini listelemek önemlidir. Projedeki kısıtlamaları listeleyin. Bunlar kaynakların kullanılabilirliğine ilişkin kısıtlamalar olabilir ancak modelleme için kullanılması pratik olan veri setinin boyutu gibi teknolojik kısıtlamaları da içerebilir.Riskler ve beklenmedik durumlar:Projeyi geciktirebilecek veya başarısızlığa neden olabilecek riskleri veya olayları listeleyin. İlgili acil durum planlarını listeleyin; örneğin bu riskler veya olaylar meydana gelirse hangi eylemi gerçekleştireceksiniz?Terminoloji:Projeyle ilgili bir terminoloji sözlüğü hazırlayın. Bunun genellikle iki bileşeni olacaktır:
    • İlgili iş terminolojisi sözlüğü, projede mevcut olan iş anlayışının bir parçasını oluşturur. Bu sözlüğün oluşturulması yararlı bir 'bilginin ortaya çıkarılması' ve eğitim uygulamasıdır.
    • Veri madenciliği terminolojisi sözlüğü iş problemiyle ilgili örneklerle gösterilmiştir.
    Maliyetler ve faydalar:Projenin maliyetlerini, başarılı olması durumunda işletmeye sağlayacağı potansiyel faydalarla karşılaştıran proje için bir maliyet-fayda analizi oluşturun. Bu karşılaştırma mümkün olduğunca spesifik olmalıdır. Örneğin ticari bir durumda mali tedbirleri kullanmalısınız.

Veri madenciliği hedeflerini belirleyin

Bir iş hedefi, iş terminolojisindeki hedefleri belirtir. Bir veri madenciliği hedefi, proje hedeflerini teknik terimlerle belirtir. Örneğin iş hedefi, mevcut müşterilere katalog satışlarını artırmak olabilir. Bir veri madenciliği hedefi, bir müşterinin son üç yıldaki satın alma işlemleri, demografik bilgiler (yaş, maaş, şehir vb.) ve ürünün fiyatı göz önüne alındığında kaç adet widget satın alacağını tahmin etmek olabilir.

    İş başarısı kriterleri:İş hedeflerine ulaşılmasını sağlayan projenin amaçlanan çıktılarını açıklar.Veri madenciliği başarı kriterleri:Başarılı bir proje sonucunun kriterlerini tanımlar. Örneğin, belirli bir düzeyde tahmin doğruluğu veya belirli bir 'artış' derecesine sahip bir satın alma eğilimi profili. İş başarısı kriterlerinde olduğu gibi bunların da subjektif terimlerle tanımlanması gerekebilir, bu durumda subjektif yargıyı veren kişi veya kişilerin belirlenmesi gerekir.

Proje planı üretin

Veri madenciliği hedeflerine ve iş hedeflerine ulaşmak için amaçlanan planı açıklayın. Planınız, araçların ve tekniklerin ilk seçimi de dahil olmak üzere, projenin geri kalanında gerçekleştirilecek adımları belirtmelidir.

1. Proje planı: Projede yürütülecek aşamaları süreleri, gerekli kaynakları, girdileri, çıktıları ve bağımlılıklarıyla birlikte listeleyin. Mümkün olduğunda, veri madenciliği sürecindeki büyük ölçekli yinelemeleri, örneğin modelleme ve değerlendirme aşamalarının tekrarlarını açık bir şekilde yapmaya çalışın.

Proje planının bir parçası olarak zaman çizelgeleri ve riskler arasındaki bağımlılığı analiz etmek önemlidir. Bu analizlerin sonuçlarını, risklerin ortaya çıkması durumunda ideal olarak eylem ve önerilerle birlikte proje planında açıkça işaretleyin. Değerlendirme aşamasında hangi değerlendirme stratejisinin kullanılacağına karar verin.

javafx öğreticisi

Proje planınız dinamik bir belge olacaktır. Her aşamanın sonunda ilerlemeyi ve başarıları gözden geçirecek ve proje planını buna göre güncelleyeceksiniz. Bu güncellemeler için özel inceleme noktaları proje planının bir parçası olmalıdır.

2. Araç ve tekniklerin ilk değerlendirmesi: İlk aşamanın sonunda, araç ve tekniklerin ilk değerlendirmesini yapmalısınız. Örneğin, sürecin farklı aşamaları için çeşitli yöntemleri destekleyen bir veri madenciliği aracı seçersiniz. Araç ve tekniklerin seçimi tüm projeyi etkileyebileceğinden, araçların ve tekniklerin sürecin başında değerlendirilmesi önemlidir.

Aşama 2: Veri Anlama

CRISP-DM sürecinin ikinci aşaması, proje kaynaklarında listelenen verileri almanızı gerektirir. Bu ilk toplama, verilerin anlaşılması için gerekli olması durumunda veri yüklemeyi içerir. Örneğin, verileri anlamak için belirli bir araç kullanıyorsanız verilerinizi bu araca yüklemeniz son derece mantıklıdır. Birden fazla veri kaynağı edinirseniz bunları nasıl ve ne zaman entegre edeceğinizi düşünmeniz gerekir.

    İlk veri toplama raporu:Elde edilen veri kaynaklarını, konumlarını, bunları elde etmek için kullanılan yöntemleri ve karşılaşılan sorunları listeleyin. Karşılaştığınız sorunları ve ulaştığınız çözümleri kaydedin. Bu, bu projenin gelecekte tekrarlanmasına ve gelecekte benzer projelerin yürütülmesine yardımcı olacaktır.

Verileri açıklayın

Elde edilen verilerin 'brüt' veya 'yüzey' özelliklerini inceleyin ve sonuçları rapor edin.

    Veri açıklaması raporu:Formatı, miktarı, alanların kimlikleri ve keşfedilen diğer yüzey özellikleri de dahil olmak üzere elde edilen verileri açıklayın. Elde edilen verilerin ihtiyaçlarınızı karşılayıp karşılamadığını değerlendirin.

Verileri keşfedin

Bu aşamada sorgulama, veri görselleştirme ve raporlama tekniklerini kullanarak veri madenciliği sorularını ele alacaksınız. Bunlar şunları içerebilir:

  • Temel niteliklerin dağılımı
  • Çiftler veya az sayıda nitelik arasındaki ilişkiler
  • Basit toplamaların sonuçları
  • Önemli alt popülasyonların özellikleri
  • Basit istatistiksel analizler

Bu analizler doğrudan veri madenciliği hedeflerinize hitap edebilir. Veri tanımına ve kalite raporlarına katkıda bulunabilir veya bunları iyileştirebilir ve daha ileri analiz için gereken dönüşüm ve diğer veri hazırlama adımlarına katkıda bulunabilirler.

    Veri araştırma raporu:İlk bulgular veya ilk hipotezler ve bunların projenin geri kalanı üzerindeki etkileri de dahil olmak üzere veri araştırmanızın sonuçlarını açıklayın. Uygunsa, ilginç veri alt kümelerinin daha ayrıntılı incelenmesini öneren veri özelliklerini belirtmek için buraya grafikler ve grafikler ekleyebilirsiniz.

Veri kalitesini doğrulayın

Aşağıdaki gibi soruları yanıtlayarak verilerin kalitesini inceleyin:

gri kod
  • Veriler tam mı, yoksa gerekli tüm durumları kapsıyor mu?
  • Doğru mu, hatalar içeriyor mu ve hatalar varsa bunlar ne kadar yaygın?
  • Verilerde eksik değerler var mı? Eğer öyleyse, nasıl temsil ediliyorlar, nerede ortaya çıkıyorlar ve ne kadar yaygınlar?

Veri kalitesi raporu

Veri kalitesi doğrulamasının sonuçlarını listeleyin. Kalite sorunları varsa olası çözümleri önerin. Veri kalitesi sorunlarının çözümleri genellikle büyük ölçüde verilere ve iş bilgisine bağlıdır.

Aşama 3: Veri Hazırlama

Bu proje aşamasında analiz için kullanacağınız verilere karar verirsiniz. Bu kararı vermek için kullanabileceğiniz kriterler arasında verilerin veri madenciliği hedeflerinizle ilgisi, verilerin kalitesi ve veri hacmi veya veri türleri üzerindeki sınırlamalar gibi teknik kısıtlamalar yer alır.

    Dahil etme/hariç tutma gerekçesi:Dahil edilecek/hariç tutulacak verileri ve bu kararların nedenlerini listeleyin.

Verilerinizi temizleyin

Bu görev, veri kalitesinin seçtiğiniz analiz tekniklerinin gerektirdiği düzeye çıkarılmasını içerir. Bu, verilerin temiz alt kümelerinin seçilmesini, uygun varsayılanların eklenmesini veya eksik verilerin modelleme yoluyla tahmin edilmesi gibi daha iddialı teknikleri içerebilir.

    Veri temizleme raporu:Veri kalitesi sorunlarını çözmek için hangi kararları ve eylemleri aldığınızı açıklayın. Temizleme amacıyla yapılan veri dönüşümlerini ve bunların analiz sonuçları üzerindeki olası etkilerini göz önünde bulundurun.

Gerekli verileri oluşturun

Bu görev, türetilmiş öznitelikler, tamamen yeni kayıtlar veya mevcut öznitelikler için dönüştürülmüş değerler üretmek gibi yapıcı veri hazırlama işlemlerini içerir.

    Türetilmiş nitelikler:Bunlar aynı kayıttaki bir veya daha fazla mevcut özellikten oluşturulan yeni özelliklerdir. Örneğin, yeni bir alan değişkenini hesaplamak için uzunluk ve genişlik değişkenlerini kullanabilirsiniz.Oluşturulan kayıtlar:Burada tamamen yeni kayıtların oluşturulmasını açıklayacaksınız. Örneğin geçen yıl satın alma işlemi gerçekleştirmemiş müşterileriniz için kayıt oluşturmanız gerekebilir. Ham verilerde bu tür kayıtların bulunmasına gerek yoktu. Yine de belirli müşterilerin modelleme amacıyla açıkça sıfır satın alma yaptığını göstermek mantıklı olabilir.

Verileri entegre edin

Bu yöntemler, yeni kayıtlar veya değerler oluşturmak için birden fazla veritabanından, tablodan veya kayıttan gelen bilgileri birleştirir.

    Birleştirilmiş veriler:Tabloların birleştirilmesi, aynı nesneler hakkında farklı bilgiler içeren iki veya daha fazla tablonun birleştirilmesi anlamına gelir. Örneğin, bir perakende zincirinde, her mağazanın genel özellikleri (ör. kat alanı, alışveriş merkezi türü) hakkında bilgilerin yer aldığı bir tablo, özet satış verilerinin (ör. kâr, önceki yıla göre satışlardaki yüzde değişim) yer aldığı başka bir tablo ve bir diğeri ise çevredeki bölgenin demografisi hakkında bilgi veriyor. Bu tabloların her biri, her mağaza için bir kayıt içerir. Bu tablolar, kaynak tablolardaki alanlar birleştirilerek her mağaza için bir kayıt içeren yeni bir tabloda birleştirilebilir.Toplamalar:Toplamalar, birden fazla kayıt veya tablodaki bilgilerin özetlenmesi yoluyla yeni değerlerin hesaplandığı işlemlerdir. Örneğin, her satın alma için bir kaydın bulunduğu bir müşteri satın alma tablosunu, satın alma sayısı, ortalama satın alma tutarı, kredi kartından tahsil edilen siparişlerin yüzdesi, ürün yüzdesi gibi alanlarla birlikte her müşteri için bir kayıt ve yeni bir tabloya dönüştürmek. promosyon altında vb.

Aşama 4: Modelleme

Modelleme tekniğini seçin: İlk adım olarak kullanacağınız temel modelleme tekniğini seçeceksiniz. İşi anlama aşamasında zaten bir araç seçmiş olsanız da, bu aşamada belirli modelleme tekniğini seçeceksiniz; C5.0 ile karar ağacı oluşturma veya geri yayılımlı sinir ağı oluşturma. Birden fazla teknik uygulanıyorsa bu görevi her teknik için ayrı ayrı gerçekleştirin.

    Modelleme tekniği:Kullanılacak temel modelleme tekniğini belgeleyin.Modelleme varsayımları:Çoğu modelleme tekniği verilerle ilgili belirli varsayımlarda bulunur; örneğin tüm niteliklerin tekdüze dağılımlara sahip olduğu, eksik değerlere izin verilmediği, sınıf niteliğinin sembolik olması gerektiği vb. Yapılan varsayımları kaydedin.

Test tasarımı oluştur

Bir model oluşturmadan önce modelin kalitesini ve geçerliliğini test edecek bir prosedür veya mekanizma oluşturmanız gerekir. Örneğin, sınıflandırma gibi denetimli veri madenciliği görevlerinde, veri madenciliği modelleri için kalite ölçütü olarak hata oranlarının kullanılması yaygındır. Bu nedenle, genellikle veri kümesini eğitim ve test kümelerine ayırırsınız, modeli eğitim kümesinde oluşturursunuz ve ayrı test kümesinde kalitesini tahmin edersiniz.

    Test tasarımı:Modellerin eğitimi, test edilmesi ve değerlendirilmesi için amaçlanan planı açıklayın. Planın birincil bileşeni, mevcut veri kümesinin eğitim, test ve doğrulama veri kümelerine nasıl bölüneceğinin belirlenmesidir.

Model oluştur

Bir veya daha fazla model oluşturmak için modelleme aracını hazırlanan veri kümesi üzerinde çalıştırın.

satır ve sütun
    Parametre ayarları:Herhangi bir modelleme aracında genellikle ayarlanabilecek çok sayıda parametre vardır. Parametreleri, değerlerini ve parametre ayarlarını seçme gerekçelerini listeleyin.Modeller:Bunlar modeller hakkında bir rapor değil, modelleme aracı tarafından üretilen modellerdir.Model açıklamaları:Ortaya çıkan modelleri tanımlayın, modellerin yorumlanmasını raporlayın ve anlamlarıyla ilgili karşılaşılan zorlukları belgeleyin.

Modeli değerlendir

Modelleri alan bilginize, veri madenciliği başarı kriterlerine ve istediğiniz test tasarımına göre yorumlayın. Modelleme ve keşif tekniklerinin uygulanmasının başarısını değerlendirin ve daha sonra iş bağlamında veri madenciliği sonuçlarını tartışmak için iş analistleri ve alan uzmanlarıyla iletişime geçin. Bu görev yalnızca modelleri dikkate alırken, değerlendirme aşamasında proje sırasında üretilen diğer tüm sonuçlar da dikkate alınır.

Bu aşamada modelleri sıralamalı ve değerlendirme kriterlerine göre değerlendirmelisiniz. Burada elinizden geldiğince iş hedeflerini ve başarı kriterlerini göz önünde bulundurmalısınız. Çoğu veri madenciliği projesinde tek bir teknik birden fazla uygulanmakta ve veri madenciliği sonuçları birkaç farklı teknikle üretilmektedir.

    Model değerlendirmesi:Bu görevin sonuçlarını özetler, oluşturulan modellerinizin niteliklerini (örneğin doğruluk açısından) listeler ve kalitelerini birbirleriyle sıralar.Revize edilmiş parametre ayarları:Model değerlendirmesine göre bunları revize edin ve bir sonraki modelleme çalışması için ayarlayın. En iyi modeli/modelleri bulduğunuza kuvvetle inanana kadar model oluşturma ve değerlendirmeyi yineleyin. Bu tür tüm revizyonları ve değerlendirmeleri belgeleyin.

Aşama 5: Değerlendirme

Sonuçlarınızı değerlendirin: Önceki değerlendirme adımlarında modelin doğruluğu ve genelliği gibi faktörler ele alınıyordu. Bu adım sırasında, modelin iş hedeflerinizi ne ölçüde karşıladığını değerlendirecek ve bu modelin yetersiz olmasının ticari bir nedeni olup olmadığını belirlemeye çalışacaksınız. Diğer bir seçenek de, zaman ve bütçe kısıtlamaları izin veriyorsa, modeli gerçek uygulamadaki test uygulamaları üzerinde test etmektir. Değerlendirme aşaması aynı zamanda oluşturduğunuz diğer veri madenciliği sonuçlarının değerlendirilmesini de içerir. Veri madenciliği sonuçları, orijinal iş hedefleriyle mutlaka ilgili olan modelleri ve orijinal iş hedefleriyle mutlaka ilgili olmayan ancak aynı zamanda gelecekteki yönler için ek zorlukları, bilgileri veya ipuçlarını da ortaya çıkarabilecek tüm diğer bulguları içerir.

    Veri madenciliği sonuçlarının değerlendirilmesi:Değerlendirme sonuçlarını, projenin başlangıçtaki iş hedeflerini karşılayıp karşılamadığına ilişkin nihai bir açıklama da dahil olmak üzere iş başarısı kriterlerinde özetleyin.Onaylanan modeller:Modeller iş başarısı kriterlerine göre değerlendirildikten sonra, seçilen kriterleri karşılayan oluşturulan modeller onaylanan modeller haline gelir.

İnceleme süreci

Bu noktada ortaya çıkan modellerin tatmin edici olduğu ve iş ihtiyaçlarını karşıladığı görülmektedir. Artık, bir şekilde gözden kaçırılan önemli bir faktör veya görevin olup olmadığını belirlemek için veri madenciliği katılımını daha kapsamlı bir şekilde incelemeniz uygun olacaktır. Bu inceleme aynı zamanda kalite güvencesi konularını da kapsamaktadır. Örneğin: modeli doğru bir şekilde oluşturduk mu? Yalnızca kullanmamıza izin verilen ve gelecekteki analizler için mevcut olan nitelikleri mi kullandık?

    Sürecin gözden geçirilmesi:Süreç incelemesini özetleyin ve kaçırılan ve tekrarlanması gereken faaliyetleri vurgulayın.

Sonraki adımları belirleyin

Artık değerlendirme sonuçlarına ve süreç incelemesine bağlı olarak nasıl ilerleyeceğinize karar verirsiniz. Bu projeyi bitirip dağıtıma mı geçeceksiniz, daha fazla yineleme başlatacak mısınız veya yeni veri madenciliği projeleri mi kuracaksınız? Kararlarınızı etkileyebilecek kalan kaynaklarınızı ve bütçenizi de değerlendirmelisiniz.

    Olası eylemlerin listesi:Her seçeneğin lehinde ve aleyhinde olası diğer eylemleri ve nedenlerini listeleyin.Karar:Gerekçesiyle birlikte nasıl ilerleyeceğinize ilişkin kararı açıklayın.

Aşama 6: Dağıtım

Dağıtımı planlayın: Dağıtım aşamasında, değerlendirme sonuçlarınızı alacak ve bunların dağıtımı için bir strateji belirleyeceksiniz. İlgili modeli/modelleri oluşturmak için genel bir prosedür tanımlanmışsa, bu prosedür daha sonra devreye alınmak üzere burada belgelenir. Dağıtımın projenin başarısı için çok önemli olması nedeniyle, işi anlama aşamasında dağıtım yollarını ve araçlarını dikkate almak mantıklıdır. Tahmine dayalı analizlerin işletmenizin operasyonel yönünü iyileştirmeye yardımcı olduğu yer burasıdır.

    Dağıtım planı:Gerekli adımlar ve bunların nasıl gerçekleştirileceği de dahil olmak üzere dağıtım stratejinizi özetleyin.

İzleme ve bakımı planlayın

Veri madenciliği sonucu günlük işin ve ortamın bir parçası haline gelirse izleme ve bakım önemli konulardır. Bir bakım stratejisinin dikkatli bir şekilde hazırlanması, veri madenciliği sonuçlarının gereksiz derecede uzun süreli yanlış kullanımını önlemeye yardımcı olur. Projenin, veri madenciliği sonuçlarının dağıtımını izlemek için ayrıntılı bir izleme süreci planına ihtiyacı var. Bu plan, belirli dağıtım türünü dikkate alır.

    İzleme ve bakım planı:Gerekli adımlar ve bunların nasıl gerçekleştirileceği de dahil olmak üzere izleme ve bakım stratejisini özetleyin.

Nihai raporu üretin

Projenin sonunda bir final raporu yazacaksınız. Dağıtım planına bağlı olarak bu rapor, projenin ve deneyimlerinin yalnızca bir özeti olabilir (eğer halihazırda devam eden bir faaliyet olarak belgelenmemişse) veya veri madenciliği sonucunun nihai ve kapsamlı bir sunumu olabilir.

    Son rapor:Bu, veri madenciliği sözleşmesinin nihai yazılı raporudur. Sonuçların özetlenmesi ve organize edilmesiyle önceki tüm teslimatları içerir.Son sunum:Projeden sonra sıklıkla sonuçların müşteriye sunulduğu bir toplantı yapılır.

Projeyi incele

anaconda vs piton yılanı

Neyin doğru, neyin yanlış gittiğini, nelerin iyi yapıldığını ve nelerin iyileştirilmesi gerektiğini değerlendirin.

    Deneyim belgeleri:Proje sırasında kazanılan önemli deneyimleri özetleyin. Örneğin, bu belge karşılaştığınız tuzakları, yanıltıcı yaklaşımları veya benzer durumlarda en uygun veri madenciliği tekniklerini seçmeye yönelik ipuçlarını içerebilir. İdeal projelerde deneyim dokümantasyonu aynı zamanda bireysel proje üyelerinin projenin önceki aşamalarında yazdığı raporları da kapsar.