Statistika : Ukuran Penyebaran Data


         Blog Koma - Dengan menentukan pemusatan data dan ukuran letak data ternyata belum cukup untuk memberikan gambaran yang jelas dari suatu data. Pada pengukuran statistika, selain ukuran pemusatan dan ukuran letak, juga ada Ukuran Penyebaran Data. Ukuran penyebaran data adalah ukuran yang menunjukkan seberapa jauh data suatu menyebar dari rata-ratanya. Pada ukuran penyebaran data, kita akan mempelajari materi Jangkauan (Range), Simpangan, Ragam (Variansi), ukuran penyebaran pada nilai kuartil, dan Pencilan (Outlier) . Sebelum membaca tentang ukuran penyebaran data, sebaiknya kita baca dulu materi "Statistika Secara Umum" dan "Statistika : Penyajian Data".

Jangkauan (Range)
       Jangkauan sering disebut range atau rentang. Jangkauan dari suatu data didefinisikan sebagai selisih antara data terbesar dengan data terkecil. Disini kita simbolkan jangkauan dengan huruf R.
Rumus umum jangkauan (range) :
Keterangan :
$ R = \, $ Jangkauan atau range
$ X_{min} = \, $ nilai atau data terkecil
$ X_{maks} = \, $ nilai atau data terbesar

$\clubsuit $ Jangkauan data tunggal
       Untuk jangkauan data tunggal, langsung tentukan nilai terbesar dan terkecilnya, lalu dikurangkan.

Contoh
Tentukan jangkauan(range) dari data-data di bawah ini.
6, 7, 3, 4, 8, 3, 7, 6, 10, 15, 20
Penyelesaian :
Dari data di atas diperoleh $x_{maks} = 20 \, $ dan $x_{min} = 3 $
*). Menentukan jangkauannya :
$\begin{align} R = x_{maks} - x_{min} = 20 - 3 = 17 \end{align} $
Jadi, jangkauan data tersebut adalah 17.

$\clubsuit $ Jangkauan data Berkelompok
       Untuk data bergolong, nilai tertinggi diambil dari nilai tengah kelas tertinggi dan nilai terendah diambil dari nilai kelas yang terendah.

Contoh
Tentukan range dari tabel berikut ini.
Penyelesaian :
*). Nilai tengah kelas terendah :
       $ x_{min} = \frac{3+5}{2} = 4 $
*). Nilai tengah kelas tertinggi :
       $ x_{maks} = \frac{18+20}{2} = 19 $
*). Menentukan jangkauannya :
$\begin{align} R = x_{maks} - x_{min} = 19 - 4 = 15 \end{align} $
Jadi, jangkauan data tersebut adalah 15.

Simpangan Rata-rata
       Simpangan rata-rata atau deviasi rata-rata adalah ukuran yang menyatakan seberapa besar penyebaran tiap nilai data terhadap nilai meannya (rata-ratanya).

$\spadesuit $ Simpangan rata-rata data tunggal
Rumus menghitung simpangan rata-rata data tunggal :
Keterangan :
$ SR = \, $ Simpangan rata-rata
$ n = \, $ ukuran data (total frekuensi)
$ x_i = \, $ data ke-$i$ dari data $ x_1, x_2, x_3, ..., x_n $
$ \overline{x} = \, $ rataan hitung.
$ \sum = \, $ notasi sigma yang artinya jumlahan.
$ |x_i - \overline{x}| = \, $ harga mutlak dari $ x_i - \overline{x} \, $ yang hasilnya selalu positif.
contoh : $ |3| = 3 \, $ dan $ |-3| = 3 $

Contoh :
Diketahui data: 7, 6, 8, 7, 6, 10, 5. Tentukan simpangan rata-ratanya.
Penyelesaian :
*). Menentukan rata-ratanya,
$ \begin{align} \overline{x} = \frac{7+6+8+7+6+10+5}{7} = \frac{49}{7} = 7 \end{align} $
*). Menentukan simpangan rata-ratanya :
$ \begin{align} SR & = \frac{1}{n} \displaystyle \sum_{i = 1}^{n} |x_i - \overline{x}| \\ & = \frac{1}{7} \displaystyle \sum_{i = 1}^{7} |x_i - 7| \\ & = \frac{1}{7} (|7-7|+|6-7|+|8-7|+|7-7|+|6-7|+|10-7|+|5-7|) \\ & = \frac{1}{7} (|0|+|-1|+|1|+|0|+|-1|+|3|+|-2|) \\ & = \frac{1}{7} (0+1+1+0+1+3+2) \\ & = \frac{1}{7} (8) = \frac{8}{7} \end{align} $
Jadi, simpangan rata-ratanya adalah $ \frac{8}{7} $

$\spadesuit $ Simpangan rata-rata data berkelompok
Rumus menghitung simpangan rata-rata data berkelompok :
Keterangan :
$ SR = \, $ Simpangan rata-rata
$ n = \, $ banyak kelas
$ x_i = \, $ nilai tengah kelas ke-$i$
$ \overline{x} = \, $ rataan hitung.
$ f_i = \, $ frekuensi kelas ke-$i$
$ \displaystyle \sum_{i = 1}^{n} f_i = \, $ total frekuensi

Contoh :
Tentukan simpangan rata-rata pada tabel berikut ini.
Penyelesaian :
*). Melengkapkan isi tabel
*). Menentukan rata-rata :
$ \begin{align} \overline{x} = \frac{\displaystyle \sum_{i = 1}^{n} f_i.x_i}{\displaystyle \sum_{i = 1}^{n} f_i} = \frac{6300}{40} = 157,5 \end{align} $
*). Menentukan simpangan rata-ratanya :
$ \begin{align} SR = \frac{\displaystyle \sum_{i = 1}^{n} f_i.|x_i - \overline{x}|}{\displaystyle \sum_{i = 1}^{n} f_i} = \frac{260}{40} = 5,15. \end{align} $
Jadi, simpangan rata-ratanya adalah 5,15.

Simpangan Baku (Standar Deviasi) Data tunggal
       Diketahui sekumpulan data kuantitatif yang tidak dikelompokkan dan dinyatakan oleh $x_1, x_2, ..., x_n$. Dari data tersebut, dapat diperoleh nilai simpangan baku ($S$) yang ditentukan oleh rumus berikut.
Data sampel berlaku untuk $ n < 30 \, $ dan data populasi untuk $ n \geq 30 $
Contoh:
Dari 40 siswa kelas XI IPA diperoleh nilai yang mewakili adalah 7, 9, 6, 3, dan 5. Tentukan simpangan baku dari data tersebut.
Penyelesaian :
*). Menentukan rata-rata :
$ \overline{x} = \frac{7+9+6+3+5}{5} = \frac{30}{5} = 6 $
*). Melengkapkan tabel
*). Menentukan simpangan baku
$ \begin{align} s = \sqrt{\frac{\displaystyle \sum_{i=1}^{5} (x_i - \overline{x})^2}{n-1}} = \sqrt{\frac{20}{5-1}} = \sqrt{5} = 2,24 \end{align} $
Jadi, simpangan bakunya adalah 2,24.

Simpangan Baku (Standar Deviasi) Data Berkelompok
       Sekumpulan data kuantitatif yang dikelompokkan, dapat dinyatakan oleh $x_1, x_2, ..., x_n$ dan masing-masing data mempunyai frekuensi $f_1 , f_2 , ..., f_n$ . Simpangan baku ($S$) dari data tersebut diperoleh dengan menggunakan rumus
Data sampel berlaku untuk $ n < 30 \, $ dan data populasi untuk $ n \geq 30 $
Contoh :
Hasil tes Matematika 30 siswa kelas XI IPA seperti ditunjukkan pada tabel di bawah.
Berdasarkan data tersebut, tentukan simpangan bakunya.
Penyelesaian :
*).Melengkapkan isi tabel
*). Menentukan rata-ratanya :
$ \begin{align} \overline{x} = \frac{\displaystyle \sum_{i = 1}^{n} f_i.x_i}{\displaystyle \sum_{i = 1}^{n} f_i} = \frac{490}{30} = 16,33 \end{align} $
*). Menentukan simpangan bakunya
$ \begin{align} s = \sqrt{\frac{\displaystyle \sum_{i=1}^{5} f_i.(x_i - \overline{x})^2}{n}} = \sqrt{\frac{836,7}{30}} = \sqrt{27,89} = 5,28 \end{align} $
Jadi, simpangan bakunya adalah 5,28.

Ragam (Variansi)
       Variansi (ragam) adalah rata-rata dari jumlah kuadrat simpangan tiap data. Ragam bisa dirumuskan sebagai :
                     Ragam $ = S^2 \, $
Artinya ragam diperoleh dari nilai simpangan baku dikuadratkan.
Contoh :
Dari contoh soal yang berkaitan dengan simpangan baku data berkelompok di atas, diperoleh simpangan bakunya adalah 5,28. Sehingga nilai ragamanya (variansi) adalah :
Ragam $ = S^2 = (5,28)^2 = 27,89 $

Koefisien Keragaman (KK)
    Rumus koefisien keragaman (KK) dari sekumpulan data $x_1, x_2, x_3, ..., x_n $ adalah
                     $ \begin{align} KK = \frac{S}{\overline{x}} \end{align} $
Keterangan :
$ KK = \, $ Koefisien Keragaman
$ S = \, $ simpangan baku
$ \overline{x} = \, $ nilai rata-rata data.

Contoh :
Pak Murtono seorang pengusaha. Bidang usaha yang ia jalani adalah penerbitan, tekstil, dan angkutan. Dalam 5 bulan terakhir, ia mencatat keuntungan bersih ketiga bidang usahanya. Hasilnya tampak pada Tabel berikut
Jika Pak Murtono berpendapat bahwa bidang usaha yang akan dipertahankan hanya dua bidang usaha dengan kriteria bidang usaha dengan keuntungan bersih yang stabil, tentukanlah bidang usaha yang sebaiknya tidak dilanjutkan.
Penyelesaian :
*). Menghitung rataan, simpangan baku, dan koefisien keragaman dari setiap bidang usaha.
i). Bidang usaha penerbitan
$ \begin{align} \overline{x} & = \frac{60+116+100+132+72}{5} = 96 \\ S & = \sqrt{\frac{\displaystyle \sum_{i=1}^{5} (x_i - \overline{x})^2}{n-1}} \\ & = \sqrt{\frac{(60-96)^2+(116-96)^2+(100-96)^2+(132-96)^2+(72-96)^2}{5-1}} \\ & = \sqrt{\frac{3584}{4}} = 29,93 \\ KK & = \frac{S}{\overline{x}} = \frac{29,93}{96} = 0,31 \end{align} $

ii). Bidang usaha tekstil
$ \begin{align} \overline{x} & = 156 \\ S & = 40,69 \\ KK & = \frac{S}{\overline{x}} = \frac{40,69}{156} = 0,26 \end{align} $

ii). Bidang usaha angkutan
$ \begin{align} \overline{x} & = 161,6 \\ S & = 100,58 \\ KK & = \frac{S}{\overline{x}} = \frac{100,58}{161,6} = 0,62 \end{align} $
Jadi, sebaiknya Pak Murtono tidak melanjutkan usaha angkutan karena keuntungannya tidak stabil (nilai KK paling besar).

Ukuran Penyebaran Data pada Nilai Kuartil
       Dari data kita bisa menentukan nilai kuartilnya baik kuartil kesatu ($Q_1$), kuartil kedua ($Q_2$), dan kuatil ketiga ($Q_3$). Untuk cara menentukan nilai kuartil, silahkan baca materi "Statistika : Ukuran Letak Data". Dari nilai-nilai kuartil tersebut juga berlaku ukuran penyebaran yaitu Jangkauan antarkuartil (Hamparan) yang kita simbolkan dengan JK dan Jangkauan semi antarkuartil (Simpangan Kuartil) yang kita simbolkan dengan SK.
Rumus masing-masing :
$ \begin{align} JK = Q_3 - Q_1 \, \, \, \, \text{ dan } \, \, \, SK = \frac{1}{2}(JK) = \frac{1}{2}(Q_3 - Q_1) \end{align} $
       Dari nilai penyebaran pada kuartil dikenal juga istilah Langkah (L), yang dirumuskan :
$ \begin{align} L = \frac{3}{2} (JK) = \frac{3}{2}(Q_3 - Q_1) \end{align} $
Catatan :
Buku lain juga menyebutkan istilah Jangkauan antarkuartil = Jangkauan interkuartil dan Jangkauan semi antarkuartil = Jangkauan semi interkuartil .

Pencilan (Outlier)
       Istilah Pagar dalam dan pagar luar :
*). Pagar dalam (PD) adalah nilai data yang berada satu langkah di bawah kuartil pertama. Rumusnya : $ PD = Q_1 - L $
*). Pagar luar (PL) adalah nilai data yang berada satu langkah di atas kuartil ketiga.. Rumusnya : $ PL = Q_3 + L $

Pengertian Pencilan :
       Semua data yang nilainya kurang dari pagar dalam atau lebih dari pagar luar disebut pencilan. Pencilan adalah datum yang memiliki karakteristik berbeda dari datum lainnya. Dapat dikatakan bahwa pencilan merupakan datum yang tidak konsisten (tidak normal) dalam kumpulan data.
Contoh :
Hasil tes matematika dari 20 siswa tercatat sebagai berikut.
70, 68, 71, 68, 66, 73, 65, 74, 65, 64, 78, 79, 61, 81, 60, 97, 44, 64, 83, 56.
Jika ada data pencilan, tentukan datum tersebut.
Penyelesaian :
*). Data setelah diurutkan menjadi :
44, 56, 60, 61, 64, 64, 65, 65, 66, 68, 68, 70, 71, 73, 74, 78, 79, 81, 83, 97
ada 20 datum ($n =20$) .
*). Menentukan nilai kuartil data, jangkauan antarkuartil, langkah, pagar dalam(PD) dan pagar luar(PL).
$ \begin{align} Q_1 & = X_{\frac{1}{4}(n+1)} = X_{\frac{1}{4}(20+1)} = X_{5,25} \\ Q_1 & = x_5 + 0,25(x_6 - x_5) \\ & = 64 + 0,25(64-64) = 64 + 0 = 64 \\ Q_2 & = X_{\frac{2}{4}(n+1)} = X_{\frac{2}{4}(20+1)} = X_{10,5} \\ Q_2 & = x_{10} + 0,5(x_{11} - x_{10}) \\ & = 68 + 0,5(68-68) = 68 + 0 = 68 \\ Q_3 & = X_{\frac{3}{4}(n+1)} = X_{\frac{3}{4}(20+1)} = X_{15,75} \\ Q_3 & = x_{15} + 0,75(x_{16} - x_{15}) \\ & = 74 + 0,75(78-74) = 74 + 3 = 77 \\ JK & = Q_3 - Q_1 = 77 - 64 = 13 \\ L & = \frac{3}{2}(JK) = \frac{3}{2}.(13) = 19,5 \\ PD & = Q_1 - L = 64 - 19,5 = 44,5 \\ PL & = Q_3 + L = 77 + 19,5 = 96,5 \end{align} $
Jadi, ada dua pencilan dalam data ini, yaitu 44 dan 97 karena datum 44 nilainya kurang dari PD dan datum 97 nilainya lebih besar dari PL.