Belajar Statistika: Dari alasan perlunya belajar statistika, statistik vs statistika, populasi dan sampel, level pengukuran data, dan statistika deskriptif vs inferensial

Di antara beberapa penyesalan terbesar saya adalah, saya tidak mempelajari sungguh – sungguh statistika saat masa kuliah.

Sebenarnya, pengetahuan saya terkait statistik memang tidak jelek-jelek amat.

Hanya memang pengetahuan tersebut masih melompat-lompat dan bolong-bolong. Belum terkonstruksi secara utuh.

Maka, sejak setahun terakhir, saya mempelajari ulang statistika dan berharap bisa membangun pengetahuan yang utuh dan terkoneksi mulai dari bagian yang paling dasar.

Mengapa belajar statistika?

Pertama, karena banyak statistika di sekitar kita.

Penggunaan statistika banyak terdapat di bidang-bidang yang terkait dengan hidup saya. 

Misal ketika membaca paper ilmiah, hasil penelitian, infografis, berita sepak bola dan tentunya Fantasy Premier League (FPL).

Contoh penggunaan statistik untuk membantu bermain FPL, diambil dari fplstatistics.co.uk

Setidaknya, dengan memahami statistika, pengetahuan saya lebih terstruktur dan saya menjadi lebih mudah menangkap informasi-informasi tersebut.

Kedua, tuntutan pekerjaan dan tuntutan zaman.

Saya bekerja di bidang konservasi hidupan liar, di mana banyak analisis yang dilakukan membutuhkan dasar analisis yang kuat.

Setiap bulan banyak data yang masuk dalam database, dan setiap saat saya selalu bertanya harus saya apakan semua data ini.

Di sisi lain, munculnya internet of things dan big data membuat berkembang pesatnya field data science dan data analytics.

Tren ini juga terjadi di bidang geospasial, bidang yang selama ini saya geluti.

Tentu saya tidak mau ketinggalan, atau setidaknya, harus bisa lah sedikit-sedikit.

Ketiga, membantu analisis dan studi.

Alasan ini masih terkait dengan alasan kedua tadi.

Pemahaman terhadap statistik membantu saya untuk menjawab pertanyaan seperti: Bagaimana analisis data dan informasi yang ada? Metode apa yang harus saya gunakan?

Karena saya masih berniat melanjutkan studi (amiiinnnn), pengetahuan saya mengenai statistika harus segera saya perbaiki.

Terakhir, ternyata sangat menyenangkan

Kata statistika pada awalnya sangat menakutkan dan mengintimidasi.

Namun setelah saya mulai mempelajari kembali, apalagi sambil langsung bermain dengan data, analisis dan belajar pemrograman R, saya menyimpulkan bahwa belajar statistik bisa menjadi sangat menyenangkan.

Apa itu statistika?

Kurang lebih, statistika digunakan untuk mengukur parameter dari populasi berdasarkan sampel dan menghitung ketidakpatian dalam pengukuran tersebut. 

Dengan menghitung aspek ketidakpastian ini, statistik memungkinkan kita untuk melihat seberapa jauh hasil pengukuran kita jika dibandingkan dengan keadaan aslinya.

Dari penjelasan di atas, setidaknnya ada beberapa kata kunci. 

Perbedaan statistika vs statistik

Meskipun terlihat sama, alias hanya berbeda satu huruf saja, statistika (statistics) dan statistik (statistic) merupakan hal yang berbeda.

BACA JUGA  Analisis deforestasi dengan R menggunakan Hansen dataset dan gfcanalysis package

Pengertian statistika adalah sebuah ilmu yang mempelajari bagaimana cara merencanakan, mengumpulkan, menganalisis,cmenginterpretasikan, dan mempresentasikan data.

Sedangkan statistik adalah data-data atau nilai-nilai yang mendeskripsikan keadaan sampel.

Statistik juga dapat diartikan sebagai wakil dari kumpulan data, contohnya rerata (mean) dan simpangan baku (standar deviasi).

Jadi perbedaannya jelas, statistika adalah ilmu yang berkaitan dengan data, dan statistik adalah data itu sendiri, yang menjelaskan sampel.

Istilah yang lebih dekat dengan statistik adalah parameter, yaitu data-data atau nilai-nilai yang mendeskripsikan keadaan populasi.

Jadi baik statistik dan parameter memiliki kesamaan yaitu menggambarkan data.

Perbedaan antara statistik dengan parameter adalah statistik menjelaskan atau menggambarkan sampel, sedangkan parameter menjelaskan atau menggambarkan populasi.

Dari penjelasan di atas kemudian muncul istilah sampel dan populasi.

Lanjut baca untuk memahaminya.

Populasi (population) dan sampel (sample).

Populasi merupakan semua individu atau unit yang menjadi bagian dari objek penelitian atau ketertarikan. 

Sedangkan sampel merupakan sebagian kecil individu atau unit yang dipilih dari dari populasi.

Kita menggunakan sampel untuk mengambil kesimpulan -dan semoga- kesimpulan tersebut berlaku untuk seluruh populasi.

Mengapa kita membutuhkan sampel?

Karena seringkali, populasi terlalu besar, dan tidak memungkinkan kita untuk melakukan pengukuran satu-persatu. 

Jadi, pengambilan sampel dilakukan dengan metode tertentu agar sampel dapat benar-benar mewakili populasinya.

Tabel contoh populasi dan sampel.

PopulasiSampel
Semua penderita DB di Jakarta
2000 penderita DB di Jakarta yang berobat ke puskesmas
Semua harimau di Taman Nasional Gunung Leuser
Harimau di Taman Nasional Gunung Leuser yang terekam kamera jebak

Estimasi parameter

Statistika juga digunakan untuk melakukan estimasi, yaitu dengan melakukan pendugaan (inferensi) saintifik suatu parameter dalam populasi menggunakan data sampel dari populasi tersebut.

Semua nilai yang mendeskripsikan populasi (rata-rata, proporsi, variasi, hubungan, dll) disebut parameter. 

Di sini, kita tahu bahwa parameter ini adalah “kebenaran”, nilai yang asli, nilai sebenarnya yang dimiliki oleh populasi yang menjadi target kita.

Sedangkan estimasi adalah pendugaan terhadap parameter (disertai error).

Statistik dalam hal ini, digunakan untuk menentukan nilai estimasi terbaik dari parameter, berdasarkan data sampel yang diambil dari populasi.

Pengujian hipotesis

Statistika juga dapat digunakan untuk menguji hipotesis.

Pengujian hipotesis (hypothesis testing) merupakan proses menentukan seberapa dekat (atau jauh) “null hypothesis” kita terhadap populasi “fit” dengan data sampel.

Penjelasan mengenai null hypothesis dan hypothesis testing kita lakukan di tulisan terpisah saja ya!

Data: variable, case, observation, constant.

Seringkali data yang kita dapatkan sudah berbentuk data matriks a.k.a tabel.

BACA JUGA  Download dan Instal Python 3 dan Jupyter Notebook Lewat Anaconda

Bahkan jika kita melakukan pengambilan data sendiri, data tersebut seringkali kita simpan juga dalam bentuk tabel.

Tabel yang memuat data kita itu, memiliki beberapa bagian antara lain variable, case,observation dan constant.

Variabel (variable) merupakan karakteristik setiap unit atau individu.

Kasus (case) adalah individu atau unitnya. Biasa juga disebut subject.

Pengamatan (observation) adalah nilai suatu variabel yang dimiliki oleh kasus (unit data)

Konstan (constant) adalah variabel yang memiliki nilai observasi yang sama pada semua kasus.

Untuk lebih jelasnya, kita gunakan contoh di bawah ini.

4 level of data measurement

Berdasarkan skala pengukurannya, data dapat dibagi menjadi 4 jenis:

  • nominal
  • ordinal
  • interval 
  • rasio

Mari kita lihat satu-persatu.

Nominal

Data berjenis kategorikal, merupakan label atas case pada data kita.

Pada jenis data ini, setiap data memiliki level atau kelas yang sama.Contoh:

  • jenis kelamin: pria, wanita.
  • pekerjaan: peneliti, dokter, pemain sepakbola, dan lain-lain.

Ordinal

Data ordinal memiliki karakteristik yang hampir sama dengan data nominal.

Bedanya, data ordinal memiliki level, di mana satu kelas memiliki nilai yang lebih tinggi daripada kelas yang lain.

Kita bisa melihat adanya perbedaan antar kelas, namun tidak bisa menjelaskan seberapa besar perbedaan tersebut.

Contoh:

  • level pendidikan: pendidikan dasar, pendidikan menengah, pendidikan tinggi.
  • kerapatan vegetasi: vegetasi rapat, vegetasi jarang.

Interval

Data interval (dan rasio) termasuk ke dalam data kuantitatif. 

Cirinya, berupa angka yang memiliki nilai sehingga dapat dibedakan urutan, perbedaan, dan dapat diukur besar perbedaannya.

Data interval dicirikan dengan data yang tidak memiliki nilai nol (0) yang bermakna. Nilai nol dalam data ini tidak berarti bahwa tidak ada ada data, tapi memang nilai datanya seperti itu.

Kita ambil contoh suhu 0 derajat Celcius dan 5 derajat Celcius. Nilai 0 tidak berarti bahwa tidak ada suhu. Meskipun kita bisa melihat selisih dari dua pengukuran tersebut ( selisih 5 derajat), kita tidak bisa mengatakan bahwa suhu 5 derajat lebih panas 5 kali lipat dengan suhu 0 derajat.

Contoh:

  • data temperatur (Celcius, Fahrenheit)

Rasio

Data rasio memiliki karakteristik yang hampir sama dengan data interval.

Bedanya, data rasio memiliki nilai 0 yang bermakna. Nilai nol dalam data ini berupa nilai mutlak, dan tidak ada nilai negatif. 

Berbeda dengan data interval, pada data rasio kita bisa mengatakan bahwa panjang 40cm itu dua kali lipat lebih panjang dari 20cm.

Tahu perbedaannya?

Contoh data rasio:

  • tinggi badan
  • berat badan.

Selanjutnya, untuk data kuantitatif, jenis data dapat dibagi lagi yaitu:

  • Kontinyu (continue): tinggi badan (156.2, 160.23, 160.2345)
  • Hitung (count): jumlah goal yang dicetak seorang pemain bola (1, 5, 10; tidak ada 1.2 goal)
  • Proporsi (proportion): persentase penduduk miskin di suatu kota (25.6%, 76.345%) 
  • Biner (binary); data kehadiran siswa di kelas (1 (hadir), dan 0 (tidak hadir).
BACA JUGA  Belajar Statistika

Data interval dan rasio termasuk ke dalam data kuantitatif. 

Mengapa penting memahami level dan tipe data?

Alasan pertama, karena metode yang kita gunakan untuk melakukan analisis statistika bergantung pada level dan tipe data yang kita punya.

Misal dalam melakukan test klasik (classical test) dan pemodelan linier (linear modeling), kita harus benar-benar memahami kondisi data kita untuk kemudian menentukan metode atau teknik mana yang harus digunakan.

Alasan kedua, memahami level dan tipe data akan memudahkan kita dalam proses visualisasi data.

Contohnya, untuk menampilkan data nominal, kita menggunakan diagram batang atau diagram pie, sedangkan untuk data kuantitatif  kita gunakan boxplot atau histogram. 

Explanatory vs response, dependent vs independent, X vs Y

Salah satu penggunaan statistik yang juga paling banyak dilakukan adalah untuk menghubungkan satu variabel dengan variabel yang lain. 

Proses ini dilakukan dengan menghitung asosiasi antar variabel dan perbedaan diantara grup dalam populasi (atau sampel).

Seringnya, analisis kita lakukan untuk melakukan prediksi nilai satu variabel, berdasarkan variabel-variable yang lain.

Variabel yang kita prediksi ini, disebut dengan variabel respon (response variable), atau variabel terikat (dependent variable) atau variabel Y (Y variable).

Sama saja.

Sedangkan variabel yang digunakan untuk melakukan prediksi kita sebut dengan variabel penjelas (explanatory variable), atau variabel bebas (independent variable) atau variabel X (X variable).

Sama saja.

Satu contoh klasik untuk menjelaskan hal ini adalah percobaan menanam kacang yang kita lakukan waktu SD.

Percobaan itu kita lakukan dengan menanam kacang di beberapa pot berbeda.

Setiap pot kita siram dengan kuantitas air yang berbeda setiap hari.  Lalu kita ukur tinggi pohon semua kacang kita.

Dalam percobaan tersebut variabel responnya adalah tinggi pohon kacang, dan kuantitas air yang disiram menjadi variabel penjelas. 

Contoh: hubungan linear antara umur dan panjang bayi (sumber)

Statistika Deskriptif vs Statistika Inferensial

Statistika dapat dibagi menjadi statistika deskriptif dan statistika inferensial.

Statistika deskriptif kurang lebih merupakan metode untuk merangkum informasi yang telah kita kumpulkan.

Rangkuman informasi biasa ditampilkan dalam bentuk grafik atau dalam bentuk nilai rata-rata, persentase dan yang lainnya.

Statistika inferensial dilakukan dengan membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas.

Proses ini berkaitan erat dengan proses pendugaan estimasi terhadap parameter seperti yang telah dituliskan di bab-bab atas.

Bagikan ke yang lain
  •  
  •  
  •  
  •  
  •  
  •  
  •  

2 thoughts on “Belajar Statistika: Dari alasan perlunya belajar statistika, statistik vs statistika, populasi dan sampel, level pengukuran data, dan statistika deskriptif vs inferensial”

  1. Harashta Vidi

    Terima kasih banyak sudah memberikan pencerahan mengenai Statistika.
    Wahh aku kudu serius belajar kalo gini ceritanya XD. Wkwkwkwkwk

Leave a Comment

Your email address will not be published. Required fields are marked *

Belajar Geographic Object Based Image Analysis (GEOBIA)Pelajari lebih lanjut..