HINDARI DATA FALLACIES
Ditulis oleh Mohammad Rachmad Ibrahim, CV Pramu Ukir Digital
Tak lama setelah bersilaturahim dengan seorang sahabat, melalui gawai maya. Tersisa beberapa tanya sejak obrolan itu disudahi.
Sambil memperhatikan tukang bangunan yang sedang bekerja di sisi timur studio mungil Pramu Ukir. Satu per satu artikel yang tersebar di internet dijajali.
Menyoal pada pengambilan keputusan atau memberikan penilaian pada suatu permasalahan.
Ya, di setiap hari ada saja keputusan yang harus diambil. Namun tanya yang terbesit adalah apakah keputusan itu minim resiko ?
Informasi dan data yang kita temui di medium digital atau cetak. Betapa sangat memberikan implikasi dalam pikiran kita, semacam ada kekuatan tak terlihat yang berseliweran dalam serebrum kita.
Maka persoalannya bukan pada data atau informasi. Namun lebih pada logika berpikirnya, mencari jawabnya, metode pengujiannya, apakah jernih ataukah justru Fallacy ?
Biasanya, data atau informasi terdekat yang barusan saja kita jumpai. Itu lah yang menjadi dasar pertimbangan kita, namun sangat tidak signifikan jika tidak disandingkan dengan data atau informasi lain agar bisa diperbandingkan satu sama lain.
Kurangnya bahan pertimbangan, kita akan mengalami statistical fallacies yang menciptakan interpretasi data juga analisa yang sesat.
Fallacies adalah jamak dari fallacy. Berasal dari bahasa Latin fallacia; maknanya dalam bahasa Inggris "deceiving". Yang diartikan dalam bahasa Indonesia adalah tipuan atau kebohongan.
Di catatan sederhana ini, Pramu Ukir akan memperkenalkan sebelas jenis penyebab umum terjadinya Data Fallacies yang nantinya berkembang menjadi Statistical Fallacies.
1. Cherry Picking
Kebiasaan memilih suatu data atau informasi yang dirasa cocok dengan selera atau kondisi kita. Lalu data atau informasi lain diabaikan karena berseberangan dengan selera atau kondisi kita.
Seperti memetik buah Cherry, mana yang enak dipandang, itulah yang dipetik.
Kita mengalami Cherry Picking di hampir setiap moment, kadang disengaja untuk mengubah persepsi orang lain terhadap opini kita. Mencomot data tertentu untuk mengalihkan pikiran lawan bicara untuk alasan tertentu.
Kadang tidak disengaja, karena memang tidak memiliki ketersediaan data yang mumpuni, kekurangan preferensi, atau keilmuan yang memadai, illiteracy, dan innumeracy.
Saat bersentuhan dengan bisnis, resiko Cherry Picking bisa berpotensi pada kerugian finansial, efisiensi dan efektifitas. Bisa diantisipasi dengan menghadirkan data-data lain dari sumber berbeda, lalu melakukan perbandingan (komparasi).
2. Data Dredging
Data dredging atau pengerukan data adalah praktek pengujian untuk mempertahankan hipotesis awal, dan mengabaikan fakta bahwa hasil pengujian bertolak belakang dengan hipotesa awal.
Kasus yang sering terjadi adalah manipulasi hasil survey. Misalnya seorang peneliti pemasaran setelah melakukan survey suatu produk pewangi ruangan, ia menemukan fakta bahwa dari 50 korespondensi terdapat 41 orang yang tidak suka dengan produk pewangi ruangan yang diteliti tersebut.
Lalu untuk mempertahankan hipotesa awal, bahwa ia akan membuat senang pemilik perusahaan. Yang secara moril adalah sumber penghasilannya untuk menafkahi keluarga si peneliti tersebut.
Maka si peneliti pemasaran tersebut mengubah perspektif dengan memainkan Nilai Kritis. Bahwa terdapat 9 orang dari 10 korespondensi yang sangat suka dengan produk tersebut.
Data yang digunakan tetap sama, namun hasil pengujian ditampilkan dengan perspektif yang berbeda. Inilah data dredging.
Lebih lanjut tentang data dredging, kita perlu membahas tentang P-Value (Nilai P). Yang sering disematkan sebagai 'angka keramat' dalam statistika.
Untuk hasil pengujian yang signifikan. Nilai P akan dikawinkan dengan Tingkat Alpha dan Nilai Kritis.
3. Survivorship Bias
Survivorship Bias atau Bias Kebertahanan merupakan kealpaan logika karena memusatkan perhatian pada obyek yang berhasil melalui suatu peristiwa dan mengabaikan mereka yang tidak, sehingga mengarahkan pada kesimpulan yang sesat.
Bias ini dapat menimbulkan keyakinan yang terlalu optimistik karena mengabaikan kegagalan.
Misalnya anggapan bahwa lulusan SMP bisa menjadi Menteri, seperti Susi Pudjiastuti.
Padahal pada tahun ajaran 2019/2020 terdapat 38.464.000 anak putus sekolah di jenjang pendidikan SMP.
Logika Survivorship Bias, apabila Susi Pudjiastuti di usia 49 tahun menjadi seorang Menteri. Dengan logika yang sama, maka 34 tahun ke depan atau di tahun 2055, semua anak sejumlah 38 ribu jiwa itu apakah akan menjadi Menteri juga ?
Kasus Survivorship Bias kita temui di ragam kasus, maka untuk menghindari cara berpikir demikian. Kita perlu melatih diri, untuk mengamati suatu kasus secara holistik, menyeluruh.
4. Cobra Effect
Cobra Effect adalah imbalan atau insentif yang justru berlawanan dengan tujuan yang diharapkan.
Istilah ini diperkenalkan oleh pakar ekonomi Jerman yang bernama Horst Siebert. Sebenarnya ia hanya ingin menceritakan anekdot untuk mengkritisi kebijakan publik yang terjadi di era modern. Tapi mirip dengan kebijakan Inggris di India pada pertengahan abad 19.
Cobra Effect, di India pada masa kolonialisme Inggris. Pemerintah saat itu mengeluarkan kebijakan untuk memberikan hadiah kepada semua orang yang berhasil membunuh ular kobra. Karena terjadi banyak kematian oleh sengatan ular kobra.
Pemerintah berharap dengan insentif atau hadiah tersebut maka populasi ular kobra akan menurun, tidak lagi membahayakan masyarakat.
Namun fakta yang terjadi sebaliknya, karena bernilai uang, maka masyarakat menganggap kebijakan itu sebagai pekerjaan yang baru.
Terjadilah budi daya ular kobra di india, populasi ular kobra justru bertambah. Semakin banyak ular kobra, maka semakin banyak hadiah yang bisa diklaim sebagai hadiah.
Horst Siebert menceritakan kembali kejadian itu, yang menurutnya di jaman ini masih terus terjadi.
Cobra Effect adalah bumerang, merumuskan kebijakan tanpa data yang lebih komprehensif akan menghasilkan keputusan yang merugi. Kita sering menemukan kasus seperti ini di lingkup kecil dalam rumah tangga, bahkan hingga ke level kebijakan publik yang lebih luas.
5. False Casuality
False Casuality atau Cocoklogi (gathuk) adalah salah berasumsi bahwa peristiwa yang bersamaan terjadi mengindikasikan bahwa satu peristiwa menyebabkan atau memicu peristiwa lainnya.
Contoh sederhana pada kasus Baby Walker. Begitu banyak orang tua percaya bahwa memasukkan balita mereka ke dalam baby walker membantu buah hatinya bisa belajar cara berjalan.
Cukup logis, karena balita sedang berproses membangun otot-otot kaki yang diperlukan untuk berjalan dan mendapatkan latihan yang baik dalam mendorong diri ke depan dalam posisi tegak di atas kakinya.
Setelah balita ini mulai berjalan, orang tua sering mengaitkan keterampilan kinestetik ini disebabkan oleh alat bantu jalan yaitu Baby Walker.
Namun, di tempat lain ada banyak balita yang berhasil berjalan dengan baik tanpa Baby Walker.
Idealnya, untuk memastikan apakah asumsi itu benar atau tidak. Seharusnya ada pengalaman lain yang juga dijadikan rujukan. Karena secara alamiah, setiap balita dianugerahi kemampuan kinestetik, motorik adaptif, secara naluriah akan terjadi dengan sendirinya.
False Casuality kerap terjadi di bangsa kita, ucapan penuh bangga yang sring kita temui semisal "andai bukan karena _____, maka itu tidak terjadi". Padahal dalam satu rangkaian terdapat komponen dan eksponen, semua bekerja pada satu kesatuan rangkaian.
False Casuality santer beredar di komunikasi pemasaran. Seperti produk elektronik, peralatan mandi, bahkan di kelompok spiritual. Hampir sama semua tujuannya, yaitu pengakuan superlatif, sebagai sesuatu yang paling unggul.
6. Gerrymandering
Gerrymandering adalah praktik manipulasi batas wilayah politik dengan sengaja untuk mempengaruhi hasil pemilihan.
Gerrymandering adalah gabungan kata "Gerry" dan "Salamander". Pada bulan Maret 1812, Harian The Boston Gazette menyuarakan istilah ini sebagai ungkapan satire untuk hasil Pemilu Gubernur Massachusetts.
Calon Gubernur Partai Demokrat, yaitu Elbridge Gerry yang kalah telak, justru menjadi pemenang karena melihat jumlah daerah yang direpresentasikan dengan jumlah kursi. Tanpa memperhatikan sebaran populasi pemilih. Kemenangannya pada banyaknya jumlah daerah yang sejatinya berisikan jumlah penduduk yang sedikit.
Menurut Stewart et al. (2019), Gerrymandering di jaman ini telah menjelma menjadi koptasi informasi, pembagian wilayah dalam bentuk digital di media sosial.
Dengan memanfaaatkan KOL atau Key Opinion Leader, yaitu orang berpengaruh di internet yang merepresentasikan suatu daerah. Menjadi alat pemetaan untuk mendominasi daerah tertentu dengan konsep Gerrymandering versi digital. Efeknya justru lebih bombastis untuk menyebabkan terjadinya perpecahan masyarakat pada suatu negara.
Pada kasus seperti inilah Data Science sangat diandalkan untuk menghentikan praktik manipulasi Gerrymandering. Pada tanggal 13-16 Februari 2020, AAAS Annual Meeting; para pakar matematika berkolaborasi dengan pakar sains sosial untuk mengakhiri Gerrymandering yang terjadi di Amerika.
7. Sampling Bias
Bias pengambilan sampel atau Sampling Bias adalah sampel yang diambil dari variabel stochastic, yang dikumpulkan untuk menentukan distribusi. Namun dalam prosesnya, sample dipilih secara tidak benar dan tidak mewakili distribusi yang sebenarnya karena alasan non-random.
Sampling Bias tetap mempertahankan angka korespondensi, namun mengubah latar belakangnya. Jika 1000 sample yang akan diteliliti, maka angkanya tetap sama. Namun sasaran sample telah diubah sesuai selera yang di atas disebut sebagai alasan non-random.
Maka jangan heran jika hasil survey dari satu obyek yang sama, hasilnya berbeda-beda. Semua pihak menunjukkan data yang akurat.
Untuk membuktikan apakah itu Sampling Bias atau tidak, maka data korespondensi perlu dibuka selaku muara data primer. Memperlihatkan usia, latar belakang pendidikan, bidang pekerjaan, pengambilan sample dilakukan dimana, dan lainnya.
8. Gambler's Fallacy
Gambler's Fallacy atau Tipuan Penjudi. Adalah keyakinan bahwa peristiwa berulang di masa lalu akan berpengaruh secara finansial di masa depan.
Investor atau trader, atau bahkan UMKM dapat dengan mudah menjadi mangsa keyakinan gambler’s fallacy.
Umumnya investor berkeyakinan bahwa harga saham yang sedang menurun pada waktu tertentu akan kembali berbalik arah alias meningkat lagi. Menyebabkan investor terus menahan sahamnya sambil berharap bahwa saham yang dipegang akan meningkat lagi harganya.
Padahal ada faktor lain, seperti guncangan internal perusahaan, yang sedang menghadapi persoalan finansial yang pelik.
Sedari awal Gambler's Fallacy adalah cara mengawinkan finansial dengan firasat.
Di UMKM misalnya, bengkel las.
Seorang tukang las yang sedang membuat kanopi, begitu yakinnya ia naik ke atas ketinggian 5 meter dari permukaan paving blok.
Dengan postur heroik, ia mengarahkan stick lasnya pada besi hollow yang akan disambung. Senyap, tak ada suara cesss, tidak terjadi apa-apa.
Ternyata token listrik sudah habis, tak ada aliran listrik ke mesin las itu. Keterampilannya memanjat dengan mengangkut mesin las di ketinggian itu, seperti satuan intel ninja. Faktanya tak berguna. Sepeleh, lupa untuk top up token listrik.
Kebiasaannya lah yang cerderung berfirasat yang mementahkan usahanya sendiri, karena abai terhadap matematika.
9. Hawthorne Effect
Hawthone Effect adalah disebabkan oleh tindakan pemantauan atau observasi orang, ternyata mengakibatkan orang tersebut mengubah perilakunya sendiri. Biasa juga disebut sebagai Efek Pengamat (Observer Effect).
Eksperimen yang dilakukan di pabrik Western Electric, di Hawthorne, wilayah pinggiran Chicago, di akhir 1920 dan awal 1930.
Dalam eksperimen itu, fokus penelitian adalah untuk menentukan apakah dengan menambah penerangan atau meredupkan cahaya di area pekerja, akankah berpengaruh pada produktifitas pekerja tersebut.
Selama eksperimen berlangsung, produktivitas karyawan drastis berubah lebih meningkat. Sangat terasa perubahan perilaku (behaviour) terjadi karena cahaya penerangan yang ditambahkan.
Namun setelah eksperimen berakhir, setelah tim peneliti pergi dari lokasi pabrik. Perilaku pekerja justru kembali menurun. Meskipun pencahayaan tetap sama terangnya seperti saat eksperimen berlangsung.
Inilah yang dimaksud sebagai Hawthorne Effect. Fallacy, manipulasi perilaku terjadi saat dipantau oleh otoritas tertentu.
10. Simpson's Paradox
Berasal dari karya ilmiah Edward H. Simpson's di tahun 1951. Simpson's Paradox adalah fenomena dimana tren muncul dalam kelompok data yang berbeda, tetapi saat data digabungkan dan melihat data dalam bentuk agregat; justru data menghilang atau berbalik.
Contoh kasus di tahun 1975, ketika UC Berkeley meneliti bisa gender di pendaftaran magister. Pada data gabungan, terlihat gender pria lebih besar peluangnya untuk diterima.
Namun setelah diamati sesuai departemen, data menunjukkan bahwa gender perempuan yang lebih besar peluangnya.
Artinya, tidak semua data summary atau hasil akhir bisa merepresentasikan kejadian aslinya.
Olehnya, untuk mendapatkan hasil yang lebih signifikan. Diperlukan skala, dan sebaiknya menambahkan data pelengkap. Juga tidak mengandalkan satu teknik analisis, tapi menguji dengan teknik lainnya agar lebih komprehensif.
11. McNamara Fallacy
Robert Strange McNamara, seorang tokoh kenamaan di Amerika Serikat. Saat terjadi perang Vietnam, ia menjabat sebagai Menteri Pertahanan.
Robert McNamara begitu terobsesi untuk membuat keputusan-keputusan berdasarkan pertimbangan yang bersifat kuantitatif (metrik).
Hal tersebut membawa pemerintah AS ke berbagai keputusan absurd hingga akhirnya terbukti kalah dalam Perang Vietnam, yang mengorbankan begitu banyak nyawa.
Inilah yang disebut sebagai McNamara Fallacy, yang berasal dari tulisan memoarnya di tahun 1995, berjudul "In Retrospect".
Setelah diamnya sekian tahun paska perang Vietnam, di usianya yang ke-85 tahun. Ia mengatakan “Saya saat ini di usia yang bisa melihat ke masa lalu dan mengambil kesimpulan atas tindakanku di masa lalu. Saya di titik ini mencoba terus belajar dan coba mengerti atas semua yang telah terjadi. Mengembangkan pelajaran dari pengalaman tersebut dan terus melakukan pengembangan lebih lanjut."
McNamara melanjutkan "Saya tidak percaya bahwa ada kontradiksi antara hati yang lembut dan kepala yang keras. Tindakan seseorang tidak pada soal itu, namun tindakan seseorang harus berdasarkan pada kontemplasi (perenungan)”
Data untuk rujukan keputusan atau penilaian tidak selamanya numerik atau statistik (kuantitatif). Di kasus tertentu data dari hasil diskusi wawancara, yang tidak bersifat angka (non statistik) atau kualitatif, juga sarat akan signifikansi.
Sebab rasa belum tentu bisa dicelupkan dalam matrikulasi.
Aspirasi masyarakat contohnya, sulit untuk melakukan numerasi atas "unek-unek" yang diucapkan masyarakat.
Jika data kuantitatif bisa diamati melalui mata, kognitif dan psikomotorik. Maka data kualitatif bisa diamati melalui telinga, afektif dan radar spiritual; karena metode pengumpulan data kualitatif dilakukan secara penuturan lisan.
Ini tidak menyoal memilih yang mana, tapi mengkombinasikan keduanya.
Khilaf Four Point "Oh"
Setiap tulisan diawali helo, dan ditutup dengan sayonara.
Meleset dari perencanaan, peluang itu selalu ada.
Mengulangi kesalahan dalam mengambil keputusan meskipun sudah menggunakan teknologi olah data yang super canggih, juga bukan suatu yang nista.
Sebab manusia selalu menemukan blank spot pada kealpaan kesadarannya di moment tertentu. Ya, itulah fana.
Tapi apa salahnya memperkaya diri dengan wawasan yang baru, ya iya ?
Bukankah nikmatnya kehidupan, saat kita tak sengaja menemukan jawab atas tanya ?
Salam
_______
Kintaka :
https://www.geckoboard.com/best-practice/statistical-fallacies/
https://psychology.binus.ac.id/kamus-psikologi/kamus-psikologi-d/data-dredging/
https://p2k.unkris.ac.id/id3/2-3065-2962/Bias-Kebertahanan_98546_p2k-unkris.html
https://study.com/academy/answer/what-is-false-causality-in-philosophy.html
https://repository.usu.ac.id/bitstream/handle/123456789/69485/Fulltext.pdf?sequence=1&isAllowed=y