Makine Öğrenmesi ve İstatistiksel Öğrenme Neden ikisini de kullanıyoruz?

Makina Öğrenmesi ve İstatistiksel Öğrenme

Genelde terminolojik farklar olmakla birlikte birbirlerinden ayrıldıkları en önemli nokta açıklanabilir modeller (istatistiksel öğrenme) ile açıklanabilirliği düşük modellerdir (makine öğrenmesi). Yani nedenselliktir.

 Örneğin bir kedi resmine kedi demek için açıklanabilir modele ihtiyaç yoktur. Bu makine öğrenmesidir. Fakat bir müşterinin sizi terk etmesini modellemek istediğinizde sizi neden terk ettiği sonucunu aksiyona dönüştürmek istediğinizde neden -sonuç bağlamında model kurmanız gerekir. Bu durumda iki yaklaşım arasında ihtiyaca göre seçim yapılması gerektiği ortaya çıkmaktadır.Makine öğrenmesi yapay zekanın bir alt alanıdır. • İstatistiksel öğrenme istatistiğin bir alt alanıdır. • Birçok ortak noktaları vardır ve her iki alan da aynı problemleri çözmeye çalışır. • Makine öğrenmesi ağırlıklı olarak büyük ölçekli uygulamalarda kullanılır ve tahmin yakınlığı ile ilgilenir. • İstatistiksel öğrenme modellere ve modellerin yorumlarına odaklanmakla birlikte tutarlılık ve belirsizlik gibi kavramlara da ağırlık vermektedir. İstatistiksel öğrenme Makine öğrenmesi Model kurmak için, bağımsız değişkenlerde meydana gelen değişimlerin yanıt değişkeninde meydana getirmesi beklenen değişimleri ile ilgili yorum yapılabilir. Oluşturulan tahmin fonksiyonu doğrusal olduğundan yorum yapılabilir. Bağımlı değişkende (yanıt değişkeni) meydana gelen değişiklikleri hangi bağımsız değişkenin ne düzeyde gerçekleştirdiği ve bağımsız değişkenler ile yapılacak değişikliklerde bağımlı değişkenin ne tepkiler vereceğini görmek oldukça işlevseldir. Gerektiği yerlerde istatistiksel öğrenme modelleri veya ekonometrik modeller kullanılmalıdır. (doğrusal regresyon, lojistik regresyon, logit, probit modeller vs) Varsayımlara ve varsayımların kontrollerine ihtiyaç vardır. Varsayımlara ve varsayımların kontrollerine ihtiyaçları yoktur. Eksik gözlem, aykırı gözlem gibi durumlardan çok daha fazla etkilenir. Veri kalitesi ve veri ön işleme önemlidir. Aykırı gözlem, eksik gözlem gibi durumlardan daha az etkilenir. Bunun sebebi veri içerisindeki yapıyı temsil etmek için oluşturulan fonksiyonların esnek yapıda olmasıdır. Bağımlı ve bağımsız değişkenlerin içeriği ile ilgilenildiğinde ve bu değişkenlerdeki değişimlere daha hassas yaklaşıldığında daha fazla tercih sebebi olmalıdır. Varsayımlara ihtiyaç olmaması, kolay uygulanabilmesi ve daha büyük ölçekte projeler için uygun olması sebebiyle tercih sebebi olabilmektedir. Varsayımlar fazladır ve modellerin kullanımı daha zordur. Direk sonuç ile ilgilenilmediğinden dolayı yani bağımsız değişkenler ili ilgili yorum yapabilme olanağı sağladığından dolayı sonuç odaklı değildir. Varsayımlar daha azdır ve modellerin kullanımı daha kolaydır. Direk sonuç ile ilgilenildiğinden dolayı yani bağımsız değişkenler ile ilgili çok fazla yorum yapmaya olanak olmadığından dolayı makine öğrenmesi modellerinin sonuç odaklıdır. Bir örnek ile açıklayacak olursak: Bir şirketin yıllık toplantısında şirket harcamaları için strateji geliştirilmeye çalışıldığını, harcamaların optimize edilmek istendiğini ve gelirin arttırılmasının hedeflendiğini düşünelim. Veri bilimcinin önüne gelen bu projenin amacı, harcamaları optimize edip geliri arttırmaktır. Veri bilimci şu soruya cevap aramalıdır: Hangi harcama kalemlerinin geliri ne düzeyde etkilediğini bulmalıyım ki buna göre iş stratejileri belirlenebilsin. Örneğin reklam harcamaları arttıkça gelir artmıyorsa ya da personel harcamaları arttıkça gelir artıyorsa bu durum ve bu durumun şiddeti tespit edildiği durumda sorun çözülecektir. Bu durumda şirketin gelir giderleri ile alakalı istatistiksel ya da ekonometrik bir modele ihtiyaç duyulacaktır. Gelir bağımlı değişkeninin, personel harcamaları, ürün satışları, reklam harcamaları, sosyal sorumluluk yapılıp yapılmaması gibi değişkenler ile modellenmesi gerekmektedir. Kurulan model sonucunda şöyle bir sonuç ile karşılaşılacaktır: Model çıktısında pazarlama harcamaları değişkeninin bu model için anlamlı olduğunu ve katsayısının -0.90 çıktığını varsayalım. Yorum: Diğer değişkenler sabit varsayıldığında pazarlama harcamalarındaki bir birimlik artışın gelirde meydana getirmesi beklenen ortalama değişim -0.90’dır. Bu durumda pazarlama için harcama yapmak geliri arttırması bir kenara geliri düşürmektedir çünkü pazarlama harcamaları da bir gider kalemidir. Bu durumu görebilmek ve bu yorumu yapabilmek için istatistiksel ya da ekonometrik modellere ihtiyaç vardır. Bu yorumu yapma şansını veren şey veri içerisindeki yapının doğrusal bir fonksiyon ile modellenmesidir. Peki makine öğrenmesi yaklaşımlarına hangi durumda ihtiyaç duyulurdu? Eğer yönetim şu sorunun cevabını arıyor olsaydı o zaman makine öğrenmesi modellerini kullanabilirdik: Yıl sonu gelirlerimizin tahmin edilmesi gerekiyor. Bu tahminlere göre başka yatırımlar için alt yapı çalışmalarına başlayacağız. Bize harcama optimizasyonu lazım değil sadece geliri tahmin et ve iyi tahmin et, çok iyi çok yakın tahmin bekliyoruz. (söz konusu gelir olsa da zamansal bir veri olmadığını varsayıyoruz) Bu durumda biz geliri etkileyen faktörlerle ve bu faktörlerde meydana gelecek değişikliklerin geliri ne düzeyde etkileyeceği ile ilgilenmediğimiz için burada yüksek tahmin edilen başarıya ve varsayımlarda boğulmayan yaklaşımlara ihtiyacımız vardır. Bu yaklaşım da Makine öğrenmesidir. 

Yorumlar
Henüz Yazıya Yorum Yapılmamış. İstersen İlk Yorumu Sen Yapabilirsin.
Yorum Yaz
BÜŞRA NUR ÜNAL
Merhaba, ben BÜŞRA NUR ÜNAL

Yazımı beğendiyseniz ne mutlu, sosyal medyada paylaşarak dergimize katkı sağlarsanız çok memnun oluruz.

Son Yazıları
Kategoriler
Sosyoloji Gündeminden Anında Haberdar olun.

Bültenimize Üye Olarak yayınlardan ilk siz haberdar olabilirsiniz