📝 10. Sınıf Matematik: İki Kategorik Değişken İçeren Dağılımlar Ders Notu
İki Kategorik Değişken İçeren Dağılımlar 📊
Bu bölümde, iki farklı kategorik değişken arasındaki ilişkiyi incelemek için kullanılan dağılımları öğreneceğiz. Kategorik değişkenler, gözlemleri belirli gruplara veya kategorilere ayıran değişkenlerdir. Örneğin, cinsiyet (erkek/kadın), medeni durum (bekar/evli/boşanmış) veya tercih edilen renk (kırmızı/mavi/yeşil) gibi değişkenler kategoriktir. İki kategorik değişkeni aynı anda incelediğimizde, bu değişkenlerin birbirleriyle nasıl bir ilişki içinde olduğunu anlamak için çeşitli istatistiksel araçlar kullanırız.
Çapraz Döküm (Contingency Table) 📝
İki kategorik değişken arasındaki ilişkiyi görselleştirmek ve analiz etmek için en yaygın kullanılan yöntemlerden biri çapraz dökümdür. Çapraz döküm, iki değişkenin aldığı değerlere göre gözlem sayılarının bir tabloya yerleştirilmesidir. Bu tablo, satırlarda bir değişkenin kategorilerini ve sütunlarda diğer değişkenin kategorilerini gösterir.
Örnek 1: Öğrenci Tercihleri 🍎🍊
Bir okulda yapılan ankete göre öğrencilerin en sevdiği meyve ile cinsiyetleri arasındaki ilişkiyi inceleyelim.
- Değişken 1: Cinsiyet (Kız, Erkek)
- Değişken 2: Sevilen Meyve (Elma, Portakal)
| Elma | Portakal | Toplam | |
|---|---|---|---|
| Kız | 45 | 55 | 100 |
| Erkek | 60 | 40 | 100 |
| Toplam | 105 | 95 | 200 |
Bu tablo, cinsiyet ve sevilen meyve arasında bir ilişki olup olmadığını görmemize yardımcı olur. Örneğin, kız öğrencilerin daha çok elmayı, erkek öğrencilerin ise daha çok portakalı tercih ettiği gözlemlenebilir.
Marjinal Dağılımlar ve Koşullu Dağılımlar 📈
Çapraz döküm tablosunu incelediğimizde, hem marjinal dağılımları hem de koşullu dağılımları hesaplayabiliriz.
- Marjinal Dağılım: Tek bir değişkenin kendi içindeki dağılımıdır. Tablonun satır ve sütun toplamları marjinal dağılımları verir. Yukarıdaki örnekte, kız öğrencilerin toplam sayısı 100, erkek öğrencilerin toplam sayısı 100'dür. Elma sevenlerin toplam sayısı 105, portakal sevenlerin toplam sayısı 95'tir.
- Koşullu Dağılım: Bir değişkenin, diğer değişkenin belirli bir kategorisi verildiğindeki dağılımıdır.
Örnek 1'in Koşullu Dağılımları:
- Kızlar için sevilen meyve dağılımı:
- Elma: \( \frac{45}{100} = 0.45 \) veya %45
- Portakal: \( \frac{55}{100} = 0.55 \) veya %55
- Erkekler için sevilen meyve dağılımı:
- Elma: \( \frac{60}{100} = 0.60 \) veya %60
- Portakal: \( \frac{40}{100} = 0.40 \) veya %40
- Elma sevenler için cinsiyet dağılımı:
- Kız: \( \frac{45}{105} \approx 0.43 \) veya %43
- Erkek: \( \frac{60}{105} \approx 0.57 \) veya %57
- Portakal sevenler için cinsiyet dağılımı:
- Kız: \( \frac{55}{95} \approx 0.58 \) veya %58
- Erkek: \( \frac{40}{95} \approx 0.42 \) veya %42
Bu koşullu dağılımlar, cinsiyet ve sevilen meyve arasında bir ilişki olduğunu gösterir. Örneğin, kızların portakal sevme oranı (%55), erkeklerin portakal sevme oranından (%40) daha yüksektir. Bu, iki değişken arasında bir ilişki olabileceğine işaret eder.
Bağımsızlık Testi (Sezgisel Yaklaşım) 🧐
İki kategorik değişkenin birbirinden bağımsız olup olmadığını anlamak için sezgisel bir yaklaşım kullanabiliriz. Eğer değişkenler bağımsız ise, bir değişkenin belirli bir kategorisindeki gözlemlerin, diğer değişkenin kategorilerine dağılımı, genel (marjinal) dağılımdan önemli ölçüde farklı olmamalıdır.
Örnek 2: Eğitim Durumu ve Sigara Kullanımı 🚬📚
Bir grup yetişkin üzerinde yapılan bir araştırmada, eğitim durumları ve sigara kullanıp kullanmadıkları incelenmiştir.
- Değişken 1: Eğitim Durumu (Lise, Üniversite)
- Değişken 2: Sigara Kullanımı (Evet, Hayır)
| Sigara Evet | Sigara Hayır | Toplam | |
|---|---|---|---|
| Lise | 80 | 120 | 200 |
| Üniversite | 30 | 170 | 200 |
| Toplam | 110 | 290 | 400 |
Marjinal Dağılımlar:
- Lise mezunu: 200
- Üniversite mezunu: 200
- Sigara kullanan: 110
- Sigara kullanmayan: 290
Koşullu Dağılımlar:
- Lise mezunları için sigara kullanımı:
- Evet: \( \frac{80}{200} = 0.40 \) veya %40
- Hayır: \( \frac{120}{200} = 0.60 \) veya %60
- Üniversite mezunları için sigara kullanımı:
- Evet: \( \frac{30}{200} = 0.15 \) veya %15
- Hayır: \( \frac{170}{200} = 0.85 \) veya %85
Genel Sigara Kullanım Oranı: \( \frac{110}{400} = 0.275 \) veya %27.5
Yorum: Lise mezunlarının %40'ı sigara kullanırken, üniversite mezunlarının sadece %15'i sigara kullanmaktadır. Bu oran, genel sigara kullanım oranından (%27.5) oldukça farklıdır. Bu durum, eğitim durumu ile sigara kullanımı arasında bir ilişki olduğunu düşündürmektedir. Eğer bu iki değişken bağımsız olsaydı, lise ve üniversite mezunları için sigara kullanma oranlarının yaklaşık olarak aynı olması beklenirdi.
Bu tür analizler, iki kategorik değişken arasındaki ilişkiyi anlamak ve bu ilişki hakkında çıkarımlar yapmak için temel oluşturur. İlerleyen sınıflarda bu ilişkileri daha formal istatistiksel testlerle (örneğin Ki-kare testi) inceleme fırsatı bulacaksınız.