Materi Ajar: Ukuran Pemusatan dan Penyebaran Data
A. Memahami: Konsep Dasar Statistik Deskriptif
Selamat pagi, anak-anak! Hari ini kita akan menjadi detektif data. Statistika adalah ilmu mengumpulkan, mengolah, menyajikan, dan menganalisis data untuk mengambil kesimpulan.
Ada dua "lensa" utama yang kita gunakan untuk "melihat" data:
- Ukuran Pemusatan (Central Tendency): Di mana "pusat" atau "nilai tipikal" dari data? Ini seperti mencari kapten tim. (Mean, Median, Modus).
- Ukuran Penyebaran (Dispersion): Seberapa "tersebar" atau "bervariasi" data tersebut? Apakah nilainya mirip semua (konsisten) atau sangat beragam? (Jangkauan, Kuartil, Simpangan Baku).
Data Tunggal vs. Data Kelompok
Kita akan menganalisis dua jenis data:
- Data Tunggal: Data yang disajikan satu per satu.
Contoh: Nilai ulangan 5 siswa: 70, 80, 60, 80, 90. - Data Kelompok: Data dalam jumlah besar yang disajikan dalam interval (kelas) pada tabel frekuensi.
Contoh: Nilai 50 siswa (misal: 70-79: 15 siswa, 80-89: 25 siswa, dst).
B. Mengaplikasikan: Ukuran Pemusatan Data
1. Mean (Rata-Rata Hitung, \(\bar{x}\))
Adalah "nilai rata-rata" yang didapat dari jumlah semua nilai dibagi banyaknya data. Sangat sensitif terhadap nilai ekstrem (outlier).
Data Tunggal: \(\bar{x} = \frac{\sum x_i}{n} = \frac{x_1 + x_2 + ... + x_n}{n}\)
Contoh: Data [70, 80, 60, 80, 90] → \(\bar{x} = \frac{70+80+60+80+90}{5} = \frac{380}{5} = 76\)
Data Kelompok: Kita gunakan Nilai Tengah (\(x_i\)) setiap kelas.
\[ \bar{x} = \frac{\sum (f_i \cdot x_i)}{\sum f_i} \]
(Jumlah dari (frekuensi \(\times\) nilai tengah) dibagi total frekuensi)
2. Median (Nilai Tengah, \(Me\))
Adalah "nilai yang tepat di tengah" setelah data diurutkan. Tidak sensitif terhadap nilai ekstrem.
Data Tunggal:
Contoh: Data [60, 70, 80, 80, 90] (sudah urut). \(n=5\) (ganjil).
Median adalah data ke-\((\frac{n+1}{2}) = \frac{6}{2} = 3\). Data ke-3 adalah 80.
Jika data [60, 70, 80, 90]. \(n=4\) (genap). Median = \(\frac{\text{Data ke-2 + Data ke-3}}{2} = \frac{70+80}{2} = 75\).
Data Kelompok: (Ini adalah rumus penting)
1. Cari Kelas Median: Tentukan di mana letak data ke-\((\frac{n}{2})\).
2. Gunakan rumus:
\[ Me = T_b + \left( \frac{\frac{1}{2}n - F_k}{f_m} \right) p \]
Keterangan:
- \(T_b\): Tepi Bawah kelas median (Batas bawah - 0.5)
- \(n\): Total frekuensi
- \(F_k\): Frekuensi Kumulatif sebelum kelas median
- \(f_m\): Frekuensi kelas median
- \(p\): Panjang interval kelas
3. Modus (Nilai Paling Sering Muncul, \(Mo\))
Adalah nilai yang frekuensinya paling tinggi.
Data Tunggal:
Contoh: Data [60, 70, 80, 80, 90] → Modus = 80.
Data Kelompok:
1. Cari Kelas Modus: Kelas dengan frekuensi tertinggi.
2. Gunakan rumus:
\[ Mo = T_b + \left( \frac{d_1}{d_1 + d_2} \right) p \]
Keterangan:
- \(T_b\): Tepi Bawah kelas modus
- \(d_1\): Selisih frekuensi kelas modus dengan kelas sebelumnya
- \(d_2\): Selisih frekuensi kelas modus dengan kelas sesudahnya
- \(p\): Panjang interval kelas
C. Mengaplikasikan: Ukuran Penyebaran Data
Pemusatan saja tidak cukup. Kita perlu tahu seberapa "menyebar" data tersebut.
1. Jangkauan (Range) dan Kuartil
- Jangkauan (Range): \(J = x_{\text{maks}} - x_{\text{min}}\) (Ukuran paling kasar).
- Kuartil: Data yang diurutkan dibagi menjadi 4 bagian sama besar.
- \(Q_1\) (Kuartil Bawah): Nilai tengah dari separuh data bagian bawah.
- \(Q_2\) (Kuartil Tengah): Sama dengan Median.
- \(Q_3\) (Kuartil Atas): Nilai tengah dari separuh data bagian atas.
- Jangkauan Interkuartil (IQR): \(IQR = Q_3 - Q_1\). Ini adalah "range" dari 50% data di tengah, lebih tahan terhadap outlier.
Contoh Data Tunggal (Kuartil): Data [2, 4, 5, 5, 6, 7, 8, 9, 10]
- \(Q_2\) (Median): Data ke-5 = 6.
- \(Q_1\) (Tengah dari [2, 4, 5, 5]): \(\frac{4+5}{2} = 4.5\).
- \(Q_3\) (Tengah dari [7, 8, 9, 10]): \(\frac{8+9}{2} = 8.5\).
- IQR = \(8.5 - 4.5 = 4\).
Data Kelompok: Rumus Kuartil (\(Q_i\)) sangat mirip dengan Median: \[ Q_i = T_b + \left( \frac{\frac{i}{4}n - F_k}{f_{Q_i}} \right) p \quad \text{(untuk i=1, 2, atau 3)} \]
2. Simpangan Baku (Standard Deviation, \(S\))
Ini adalah ukuran penyebaran yang paling umum dan paling kuat. Ini mengukur "rata-rata jarak setiap data dari Mean (\(\bar{x}\))".
- Simpangan Baku \((S)\) kecil: Data cenderung berkumpul dekat rata-rata (konsisten).
- Simpangan Baku \((S)\) besar: Data cenderung menyebar jauh dari rata-rata (tidak konsisten).
Data Tunggal: \(S = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)
Data Kelompok: \(S = \sqrt{\frac{\sum f_i (x_i - \bar{x})^2}{\sum f_i}}\)
(Catatan: Ragam (Variance) adalah \(S^2\), yaitu nilai sebelum diakar).
D. Bernalar: Menyelesaikan Masalah (HOTS)
Studi Kasus 1: Konsistensi Pemain (Simpangan Baku)
Soal: Manajer tim basket harus memilih 1 dari 2 pemain (A atau B) untuk dimasukkan ke tim. Rata-rata (Mean) skor mereka dalam 5 pertandingan terakhir sama, yaitu 20 poin.
Skor Pemain A: [18, 20, 20, 21, 21]
Skor Pemain B: [5, 10, 20, 30, 35]
Siapa yang harus dipilih jika manajer mencari pemain yang konsisten?
Penalaran (Model Matematika):
"Konsisten" berarti penyebarannya rendah. Kita harus membandingkan Simpangan Baku (S).
- Pemain A: \(\bar{x} = 20\). Datanya sangat dekat dengan 20. Simpangan Bakunya akan sangat kecil.
\( (18-20)^2 = 4, (20-20)^2 = 0, (20-20)^2 = 0, (21-20)^2 = 1, (21-20)^2 = 1 \).
\(S_A = \sqrt{\frac{4+0+0+1+1}{5}} = \sqrt{\frac{6}{5}} \approx 1.1\) - Pemain B: \(\bar{x} = 20\). Datanya sangat jauh dari 20. Simpangan Bakunya akan besar.
\( (5-20)^2 = 225, (10-20)^2 = 100, (20-20)^2 = 0, (30-20)^2 = 100, (35-20)^2 = 225 \).
\(S_B = \sqrt{\frac{225+100+0+100+225}{5}} = \sqrt{\frac{650}{5}} = \sqrt{130} \approx 11.4\)
Jawaban: Manajer harus memilih Pemain A, karena simpangan bakunya jauh lebih kecil, yang membuktikan ia bermain jauh lebih konsisten.
Studi Kasus 2: Menganalisis Distribusi Pendapatan (Histogram)
Soal: Diberikan histogram pendapatan penduduk di Desa Sukamakmur. Terlihat bahwa sebagian besar penduduk (frekuensi tinggi) ada di interval kiri (pendapatan rendah), dan ada beberapa orang (frekuensi rendah) di interval kanan (pendapatan sangat tinggi).
Pertanyaan Penalaran: Ukuran pemusatan manakah (Mean atau Median) yang lebih baik untuk menggambarkan "pendapatan khas" penduduk desa?
Penalaran (Bentuk Distribusi):
Distribusi data ini disebut "Miring ke Kanan" (Right-Skewed).
- Mean (\(\bar{x}\)): Sangat sensitif terhadap outlier. Pendapatan beberapa "sultan" yang sangat tinggi akan menarik nilai Mean ke kanan (membuatnya lebih tinggi).
- Median (\(Me\)): Hanya peduli pada nilai tengah. Median tidak peduli seberapa kaya 10 orang terkaya, ia hanya peduli di mana letak orang ke-50%.
Jawaban: Median adalah ukuran yang lebih baik. Jika kita menggunakan Mean, kita akan mendapatkan gambaran yang "terlalu optimis" tentang pendapatan penduduk, karena nilainya "terseret" oleh pendapatan ekstrem yang sangat tinggi, padahal kebanyakan penduduk berpenghasilan rendah. Median akan menunjukkan pendapatan penduduk yang "sesungguhnya" di tengah-tengah.