Belajar R langsung dari ahlinya: Kopdar useR Indonesia, Bogor

Kemarin, Rabu 11 September 2019, saya mengikuti Kopdar Komunitas R Indonesia. Kebetulan sekali, acara tersebut bertempat di kantor kami di Bogor.

Tidak tanggung-tanggung, yang datang adalah Mas Muhammad Aswan, inisiator Komunitas R Indonesia, juga beberapa anggota dari komunitas R Indonesia dan R-Ladies Bogor.

Mas Aswan belajar dan bekerja di bidang Sensory Science, sebuah bidang ilmu yang mengaplikasikan desain eksperimental dan analisis statitistikal pada penggunaan indrawi manusia untuk tujuan evaluasi produk. Sebuah cabang ilmu yang benar-benar baru saya dengar pertama kali hari itu.

Pengalaman mengikuti kopdar akan saya bagikan di tulisan ini. Tulisan ini bukan review atau laporan kegiatan, hanya berbagi pengalaman yang tentunya akan sangat subjektif, karena dibuat hanya dalam sudut pandang saya sendiri.

Jalannya Kopdar

Setelah Mas Aswan mengenalkan dirinya, sesi perkenalan dilakukan oleh peserta kopdar satu persatu. Di sini terlihat bahwa latar belakang keilmuan peserta bermacam-macam, dengan pengalaman menggunakan R yang rata-rata masih belum advance.

Di sesi kopdar kali ini, Mas Aswan secara spesifik mengenalkan sebuah kegiatan mingguan komunitas R Indonesia yang bernama Kamis Data.

Kamis Data

Kamis Data sedikit banyak meniru konsep tidytuesday. Kamis Data merupakan sebuah program mingguan, di mana setiap Kamis, R Indonesia akan memberikan dataset tertentu kepada komunitas. Anggota komunitas (atau bukan anggota bisa juga) kemudian melakukan analisis terhadap data tersebut dan membagi hasil dan skrip analisisnya di github R Indonesia.

Git dan Github

Hal pertama yang saya pelajari dalam acara ini adalah saya dapat melihat langsung bagaimana workflow seorang pengguna R yang sudah advance.

BACA JUGA  Cara instal R package di RStudio

Saya benar-benar memperhatikan bagaimana Mas Aswan bekerja saat Mas Aswan memberikan demo bagaimana melakukan analisis data.

Dalam acara ini, saya pada akhirnya memahami bagaimana memanfaatkan git dan github dalam lingkungan R/ R Studio.

Package turunan tidyverse

Hari itu, data yang kami gunakan adalah data film Indonesia dari film pertama tahun 1926, Loetong Kasaroeng karya L. Heuveldrop, hingga film-film terbaru tahun 2019 seperti Bali Paradise karya (ehm) Livi Zheng. Data ini diperoleh melalui proses web scrapping situs filmindonesia.or.id.

Selain menggunakan tidyverse, Mas Aswan juga menggunakan beberapa turunannya yaitu tidygraph, ggraph dan gganimate.

Dalam hitungan menit, Mas Aswan membuat sebuah analisis jaringan yang menunjukkan keterkaitan antar genre yang terjadi di dunia perfilman Indonesia.

Hasilnya sebagai berikut:

Keterkaitan antar genre di perfilman Indonesia

Abaikan dulu visualnya.

Plot yang Mas Aswan tunjukkan adalah untuk menunjukkan bahwa kita bisa ikut berpartisipasi dalam Kamis Data dengan tidak memikirkan terlebih dahulu, ekspektasi yang intimidatif yang membuat kita takut dan menahan diri untuk berpartisipasi.

Mari kita kembali ke grafik.

Grafik menunjukkan bahwa film Indonesia didominasi oleh film dengan genre drama, action dan comedy. Kombinasi yang cukup besar di antaranya antara drama dengan komedi.

Grafik juga menunjukkan bahwa film anak-anak biasanya juga bergenre fantasy, animation, adventure, drama atau musical.

Statistic vs Machine Learning

Sesi kopdar sebenarnya dilanjutkan dengan memberikan waktu kepada peserta untuk kemudian langsung “bermain” dengan data, kemudian menunjukkan hasilnya di depan kelas.

Namun sepertinya para peserta (setidaknya saya) tidak terlalu fokus ke hal itu, dan malah bertanya macam-macam hal tentang R ke Mas Aswan. Mumpung ada ahlinya.

Kebetulan, Mas Aswan memiliki latar belakang yang sama dengan kami peserta kopdar, yaitu seorang saintis yang menggunakan R. Memang di antara yang hadir, tidak ada yang memiliki latar belakang programming atau ilmu komputer.

BACA JUGA  Data-data spasial yang bisa diakses langsung lewat R dan bagaimana cara download-nya

Banyak pertanyaan dan diskusi yang dilakukan. Salah satu yang menarik adalah mengenai machine learning (ML), satu topik yang kemudian menjadi perbincangan hangat.

Mas Aswan menjelaskan (yang diikuti dengan senyum-senyum oleh istrinya), bahwa penggunaan R untuk statistik dan ML memiliki perbedaan bahkan sejak tujuan awal.

Peneliti yang banyak menggunakan R untuk statistik bertujuan untuk menjelaskan sebuah fenomena. Biasanya, datanya berupa sampel dari populasi. Menggunakan data yang terbatas, peneliti menggunakan pemodelan statistik inferensial untuk menjawab pertanyaan penelitian/ membuktikan hipotesis.

Sedangkan ML di R digunakan biasanya untuk analisis prediksi. Datanya biasanya merupakan data yang sangat besar (Big Data) dan dapat dianggap sebagai populasi itu sendiri. Menggunakan data itu, teknik atau metode ML dilakukan untuk melakukan prediksi fenomena apa yang akan terjadi di masa depan. Di ML, biasanya terdapat “black box” perhitungan yang dilakukan komputer yang tidak diketahui analisnya.

Istri Mas Aswan (mohon maaf mbak aku lupa namamu) menambahkan pengalamannya membandingkan dua pendekatan tersebut untuk data meteorologis. Hasinya, ternyata ML tidak memberikan hasil yang lebih baik dibandingkan pemodelan statistik yang mengaplikasikan hukum-hukum fisika di dalamnya.

Selesai diskusi, acara diakhiri dengan foto bersama. Sayangnya pada waktu tersebut banyak peserta yang sudah pulang terlebih dahulu.

Foto bersama

Wrap Up

Banyak ilmu yang saya dapatkan dari kopdar ini.

Hal yang utama adalah kembali menyadarkan kecupuan saya, bahwa di luar sana banyak hal yang belum saya ketahui.

Selanjutnya, saya jadi tahu banyak hal keren yang selanjutnya masuk ke daftar belajar saya.

Mas Aswan juga menunjukkan bagaimana workflow seorang advance user bekerja menggunakan R.

Saya tertarik dengan Kamis Data dan selanjutnya akan mencoba ikut berpartisipasi di dalamnya.

BACA JUGA  Nostalgia Musikal: Jamrud, Dewa, Padi, Sheila on 7

Bagikan ke yang lain
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Leave a Comment

Your email address will not be published. Required fields are marked *

Belajar Geographic Object Based Image Analysis (GEOBIA)Pelajari lebih lanjut..