Simpson Paradoksu
Simpson paradoksu, bir veri kümesinin farklı alt gruplara bölünmesi sonucunda ortaya çıkan yanıltıcı bir durumun oluşmasına denir. Bu paradoksta, her alt grup kendi içindeki ilişkileri gösterirken, grupların birleşimiyle farklı bir ilişki ortaya çıkabilir. Özetle, bir genellemenin alt gruplara ayrılmasıyla elde edilen sonuçlar genellemeyle çelişebilmesidir.
Simpson paradoksu genellikle istatistiksel analizlerde karşımıza çıkar. Örneğin, bir tıbbi araştırmada bir tedavi yönteminin etkinliğini değerlendirirken, farklı alt gruplarda farklı sonuçlar elde edilebilir. Fakat bu alt grupların toplamı incelendiği zaman, genel olarak farklı bir sonuca ulaşılabilir. Bu paradoks, veri analizi ve yorumlaması yapılırken dikkat edilmesi gereken önemli bir noktadır çünkü yanıltıcı sonuçlara neden olabilir.
Örneğin; Bir hastanede bir tıbbi tedavi yöntemi test ediliyor ve toplam hasta grubu iki farklı kategoriye ayrılıyor: gençler ve yaşlılar. Tedavi gençlerde %60 başarı oranı gösterirken, yaşlılarda %40 başarı oranı gösteriyor gibi görünebilir. Fakat detaylı bir analiz yapıldığında, her iki yaş grubundaki hasta sayısının dağılımına bakıldığında gençler arasında daha ağır hasta sayısı daha azdır ve bu sebeple başarı oranı daha yüksektir. Diğer taraftan, yaşlılar arasında daha ağır hasta sayısı daha fazla olduğu için başarı oranı daha düşüktür. Fakat, gençlerin sayısı daha az olduğu için toplam hasta sayısına bakıldığında tedavinin genel başarı oranı %50 olarak ortaya çıkabilir. Yani, her iki alt grup ayrı ayrı değerlendirildiğinde farklı sonuçlar elde edilirken, toplam hasta grubu incelendiğinde farklı bir sonuca varılabilir. Bu da Simpson paradoksunun bir örneğidir.
Bir başka örnekte ise bir üniversitenin kabul oranlarını ele alalım. Bir üniversite, genel başvuru oranı %50 olarak açıklıyor. Fakat cinsiyet bazında ayrıntılı bir analiz yapıldığında, erkeklerin başvuru oranının %60, kadınların ise %40 olduğu görülüyor. Ayrıca, her iki cinsiyetten kabul edilen öğrencilerin oranlarına bakıldığı zamanda, erkeklerin %70‘i kabul edilirken, kadınların yalnızca %30‘u kabul ediliyor gibi görülüyor. Fakat, genel olarak bakıldığında, kabul oranının %50 olduğu belirtiliyor. Bu durumda, cinsiyet bazında ayrıntılı bir inceleme yapılmadan sadece genel başvuru oranına bakıldığında, yanıltıcı bir sonuca varılabilir.
Daha kısa bir örnek ise; Bir spor takımının bir sezondaki galibiyet oranı evde oynanan maçlarda %60, deplasmandaki maçlarda ise %40 olarak belirtiliyor. Fakat tüm maçlara bakıldığında, takımın galibiyet oranı %50 olarak ortaya çıkıyor. İşte tüm bu durumlar, Simpson paradoksunun örnekleridir.
Yazan: Selim ÖZTEMEL
Bir yanıt bırakın