Mengapa mesti ANOVA?

Untuk menentukan perbezaan min skor yang signifikan bagi pencapaian Matematik pelajar sebelum dan selepas diberikan intervensi, analisis deskriptif sahaja tidak mencukupi kerana kelemahan analisis deskriptif adalah tidak mengambil kira kemungkinan terdapatnya faktor-faktor luaran yang sepatutnya tidak dikira atau dikenali juga sebagai pemboleh ubah perancu (confounding variables) semasa analisis dilakukan yang boleh mempengaruhi dapatan. Manakala analisis ANOVA pula adalah analisis variance yang boleh menyingkirkan faktor-faktor luaran tersebut secara statistik. Pernyataan akademik ketika melaporkan analisis ANOVA selalunya adalah seperti berikut;

Perbezaan min skor bagi pencapaian Matematik adalah signifikan dengan nilai p kurang daripada 0.05 selepas pelajar diberikan intervensi.

Maka, untuk menentukan perbezaan min skor yang signifikan adalah lebih tepat menggunakan analisis ANOVA berbanding analisis deskriptif.

Saiz sampel bagi eksperimen time series

Dalam konteks kajian yang menggunakan reka bentuk eksperimen Time Series atau Reversal Series, saiz sampel adalah bergantung kpd bagaimana pengukuran dilakukan untuk melihat perubahan sesuatu dependent variable yang disebabkan oleh mediator variable. Ramai penyelidik agak terkeliru tentang sampel yang digunakan dalam sesebuah kajian eksperimen yang sebenarnya bukan subjek semata-mata tetapi ia bergantung kepada bagaimana sesuatu data itu diperhatikan.

Sebagai contoh, eksperimen yang dilakukan oleh seorang doktor perubatan terhadap seorang pesakit yang mengalami demam dengan suhu 39 darjah celcius. Doktor tersebut ingin menguji kesan minum air kelapa terhadap suhu badan pesakit tersebut. Pesakit tersebut dikuarantin dalam wad dan tidak diberikan apa2 ubat melainkan air kelapa yang diberi minum kepadanya pada waktu-waktu tertentu.

  1. Tujuan kuarantin = untuk ‘mengawal proses eksperimen’.
    2. Intervensi = beri minum air kelapa.
    3. Mediator variable = kesan minum air kelapa.
    4. Dependant variable = suhu badan pesakit.

Hipotesis Nul = Tidak terdapat perbezaan suhu yang signifikan sebelum dan selepas pesakit demam diberi minum air kelapa.

Prosedur kajiannya ialah seperti berikut;
Suhu pesakit diambil setiap satu jam bermula daripada pukul 7 pagi hingga 6 petang. Bermakna, ada 12 pengukuran. Manakala air kelapa diberi minum kepada pesakit sebanyak 3 kali iaitu pada pukul 9.30 pagi, pukul 12.30 tengahari dan pukul 3.30 petang.

Maka,
Jumlah intervensi = 3 kali
Saiz sampel = Jumlah pengukuran = 12 (iaitu jumlah berapa kali suhu diambil)

Perlu difahami bahawa.. pesakit itu memanglah peserta kajian, tetapi saiz sampel dalam konteks kajian ini bukanlah pesakit sebaliknya adalah data-data pengukuran iaitu kekerapan pengambilan suhu.

Teknik analisis.
Pemerhatian perubahan tingkah laku atau perubahan suhu yang diambil pada setiap jam diplotkan (deskriptif). Perbezaan suhu pesakit diperhatikan mengikut set seperti berikut. (Kalau lebih dari seorang pesakit, boleh guna analisis anova utk lihat min skor). Terdapat 11 set yang diperhatian perbezaan suhu…

Set 1 = dari jam 7 pagi hingga 8 pagi
Set 2 = dari jam 8 pagi hingga 9 pagi
Set 3 = dari jam 9 pagi hingga 10 pagi – intervensi 1
Set 4 = dari jam 10 pagi hingga 11 pagi
Set 5 = dari jam 11 pagi hingga 12 tgh
Set 6 = dari jam 12 tgh hingga 1 ptg – intervensi 2
Set 7 = dari jam 1 ptg hingga 2 ptg
Set 8 = dari jam 2 ptg hingga 3 ptg
Set 9 = dari jam 3 ptg hingga 4 ptg – intervensi 3
Set 10 = dari jam 4 ptg hingga 5 ptg
Set 11 = dari jam 5 ptg hingga 6 ptg

..dan seandainya perbezaan (penurunan) suhu signifikan pada set 3, 6 dan 9, maka hipotesis nul berjaya ditolak dan dapatan kajian adalah beri minum air kelapa kepada pesakit demam boleh menurunkan suhu badan atau menyembuhkan demam tersebut.

Eksperimen pelbagai bidang

Dalam bidang sains dan kejuruteraan, eksperimen yang dijalankan adalah selalunya melibatkan pemboleh ubah bebas yang dikenali sebagai faktor dan pemboleh ubah bersandar yang dikenali sebagai responses. Faktor yang diambil kira bukanlah satu tetapi banyak.

Selain itu, eksperimen yang dijalankan juga mengambil kira satu lagi variable iaitu “faktor kategori” yang mana eksperimen dijalankan bukan sekali, tetapi banyak kali dan untuk menetapkan berapa banyak kali eksperimen dijalankan perlu menggunakan formula pemfaktoran. Maksudnya, kalau kajian tersebut mempunyai 3 faktor yang nak diuji, bermakna perlu lakukan sebanyak 3 kuasa 2 = 9 kali eksperimen. Istilah mereka guna ialah trial. Kalau 8 faktor yang nak diuji, maka perlu lakukan sebanyak 8 kuasa 2 = 64 kali eksperimen.

Bidang sains dan teknologi berat pada faktor iaitu pemboleh ubah bebas yang diuji untuk mengenal pasti kesan dan akibat terhadap responses (pemboleh ubah bersandar). Selain itu, bagaimana menentukan faktor yang paling signifikan dalam memberi kesan tersebut ialah dengan menggunakan reka bentuk eksperimen Time Series. (Walaupun depa tak sebut time series – yg depa sebut ialah how many trial).

Kaedah menganalisis pula ialah sama dgn sains sosial iaitu menggunakan ANOVA untuk melihat perbezaan min skor yang signifikan.. namun, adalah lebih penting bagi mereka untuk melihat nilai varians antara kategori faktor.. bahasa mudahnya ialah nilai varians yg dibandingkan pada setiap kali eskperimen dijalankan.

Selain itu, eksperimen dalam bidang sains dan kejuruteraan turut menjelaskan sama ada wujudnya interaksi antara faktor atau tidak dan apakah formula persamaan linear (regresi) berjaya dihasilkan melalui hubungan kesan dan akibat tersebut.

Dalam kajian sains sosial pula.. faktor seringkali dikaitkan dengan mediator variable yang dihasilkan melalui intervention dan biasanya hanya ada “SATU”. Manakala responses adalah pemboleh ubah bersandar yang kita ukur sebagai kriteria keberkesanan terhadap intervensi yang telah dijalankan dan biasanya ada banyak tapi taklah banyak sangat.. dalam 3 hingga 4 saje.

Pendek kata, org kejuruteraan susah nak paham eksperimen orang sains sosial.. orang sains sosial pulak bila masuk workshop eksperimen kejuruteraan, mula2 terngaga juga lah.. sib baik takde lalat masuk mulut.

 

graf

Analisis data untuk reka bentuk eksperimen reversal series

Analisis data untuk reka bentuk eksperimen reversal series adalah sama konsep dengan analisis eksperimen yang lain iaitu menentukan sama ada terdapat perbezaan min skor yang signifikan sebelum dan selepas intervensi dilakukan. Cuma yang berbeza adalah reka bentuk eksperimen reversal series mempunyai lebih dari satu set perbezaan min skor yang ingin diketahui kerana kebiasanyaannya intervensi yang dilakukan adalah lebih dari sekali dan plot-plot min skornya diukur berulang kali. Maka, kaedah yang paling mudah untuk melakukan analisis ialah dengan menggunakan analisis Planned Contrasts atau ada juga penyelidik menyebutnya sebagai Planned Comparison. Perisian SPSS boleh menyokong analisis ini, cuma yang perlu ditentukan terlebih dahulu adalah ‘coefficient values’ bagi set-set contrast yang ingin dikenal pasti perbezaan min skornya.

Video 1 – Teori ‘coefficient values’
Video 2 – Bagaimana SPSS menyokong analisis ini.

Video 1 – https://www.youtube.com/watch?v=7aIaXe1oES8
Video 2 – https://www.youtube.com/watch?v=E42jLwhmUPM

 

Kawalan proses eksperimen

Para saintis yang menjalankan eksperimen sains tulen di makmal-makmal sains cukup mementingkan kawalan terhadap parameter-parameter yang mungkin akan mengganggu proses eksperimen atau disebut juga sebagai control variable. Hal ini sama seperti kajian eksperiman dalam bidang sains sosial. Kawalan proses eksperimen sangat penting untuk diberi perhatian termasuklah validity pemeriksa yang terlibat bagi eksperimen yang menggunakan pengujian berkonsepkan soalan terbuka. Justeru, bagaimana nak menentukan pemeriksa yang dilantik adalah valid sebagai pemeriksa dalam kajian tersebut?

 

P/s – Soalan ini adalah soalan salah seorang pemeriksa dari salah sebuah fakulti di UKM untuk seorang candidate phd semasa VIVA.

Pautan untuk bacaan: https://explorable.com/controlled-variables

 

Pemerhatian perubahan tingkah laku

Bagi kajian eksperimen yang melibatkan pemerhatian terhadap perubahan tingkah laku pada ketika berlakunya aktivititi intervensi dan pada ketika tidak berlakunya aktiviti intervensi, beberapa titik pemerhatian akan ditetapkan dan perbezaan antara setiap titik pemerhatian tersebut boleh ditentukan berdasarkan set-set perbezaan. Kaedah ini amat relevan untuk dianalisis menggunakan ujian anova sehala planned comparison.

Salah satu sebab mengapa kaedah analisis planned comparison dilakukan adalah untuk memperbanyakkan set-set perbezaan skor min yang akan diuji signifikan perbezaannya tanpa perlu mengubah nilai alpha…

Set-set perbezaan tersebut pula akan ditetapkan berdasarkan formula pekali perbezaan atau Contrast Coefficients.

 

Bila nak guna one-tail dan two-tail

 

Ada peserta kursus yang bertanya secara PM bila masa kita nak guna one-tail dan bila masa pula nak guna two tail dalam menentukan saiz kesan semasa merujuk jadual cohen.

Ok, formulanya begini.

Apabila kita menjalankan kajian eksperimen dalam sains sosial, kita merancang intervensi yang menyebabkan berlakunya hubungan sebab dan akibat. Hal ini tak sama dengan kajian dalam bidang sains tulen yang mana mereka mengkaji hubungan sebab dan akibat dari faktor-faktor semula jadi.

Dalam erti kata yang lain, kita merancang intervensi yang kita yakin bahawa terdapat hubungan yang positif antara dua pemboleh ubah. Kalau hubungan tu negatif, apa maknanya intervensi kan. Sebab intervensi ni perlu dirancang sebaik mungkin bagai kita mencipta ubat yang paling power dalam mengubati penyakit. Cuma, eksperimen masih perlu dilakukan untuk membuktikan hubungan positif tersebut yang awal-awal telah kita ramalkan (intervensi). Dalam situasi ini, kita boleh memilih untuk menggunakan hipotesis one-tail semasa membaca jadual Cohen. Bahasa mudahnya ialah kita dah tahu dua-dua pemboleh ubah memang ada hubungan, jadi kita uji guna satu arah saja (one-tail).. sebab tujuannya adalah cuma nak buktikan secara saintifik hubungan yang kita dah tahu memang wujud.

So, bila pula nak guna hipotesis two-tail?

Hipotesis two-tail kita boleh gunakan bila kita nak menguji sesuatu hubungan antara 2 pemboleh ubah yang kita sendiri tak tau sama ada hubungannya positif atau negatif. Bahasa mudahnya begitni, analisis kita untuk mengetahui adakah wujudnya hubungan antara dua pemboleh ubah.. jika arahnya negatif maknanya tak wujud hubungan.. jika positif maka wujud hubungan… maka kena lah tengok dua2 arah (two-tail) sebab tak tahu.

Kalau tulis tesis dalam BM, tulislah hipotesis satu arah (one-tail) dan hipotesis 2 arah (two-tail).

14695596_309742872726232_9075083796469850340_n

Memahami cara menentukan saiz kesan untuk mendapatkan saiz sampel

Saiz kesan yang lebih kecil adalah lebih baik daripada saiz kesan sederhana dan besar bagi sesuatu penyelidikan eksperimen, namun kebanyakan penyelidik dalam bidang sains sosial bersetuju bahawa saiz kesan sederhana adalah memadai.

Rule of thumbnya ialah, untuk mendapatkan saiz kesan yang lebih kecil, sampel yg lebih besar diperlukan.. bagi kajian eksperimen dalam bidang sains sosial yang melibatkan manusia sebagai peserta kajian, adalah mustahil untuk melakukan eksperimen ke atas “manusia” dalam kelompok yang ramai.. kerana sifat manusia itu sebagai “human error” boleh menyumbang kepada sukarnya membuat kawalan kepada proses eksperimen.

Justeru, eksperimen dengan kaedah time series atau reversal series dilihat sangat “logik” kerana melibatkan pemilihan peserta kajian yang sedikit tetapi pengukuran dilakukan berulang. Hal ini akan memudahkan untuk kajian mendapat saiz kesan sederhana atau kecil dengan power yang besar, sekurang2nya 0.7 atau 0.8 mengikut Cohen (1988).

– Saya pakai baju saiz XXL

baju

Memilih dan merancang kajian Eksperimen-Kuasi.

Aspek-aspek yang perlu dipertimbangkan adalah;
1. Pilih topik kajian yang melibatkan isu atau parameter yang ingin dikaji.
2. Adakah isu tersebut adalah peristiwa yang memerlukan kajian secara longitudinal, keratan rentas atau melibatkan satu satu tempoh masa?
3. Adakah pengukuran yang akan dilakukan melibatkan ujian pra-pos, atau ujian pos sahaja?
4. Adakah kajian melibatkan perbandingan kumpulan atau perbandingan antara titik pengukuran pada satu tempoh masa?
5. Apakah jangkaan yang diharapkan (hipotesis)?
6. Adakah terdapat kekeliruan yang boleh menjejaskan kesahihan dalaman kajian?
7. Bagaimana menambah baik reka bentuk kajian untuk mengurangkan masalah kekeliruan terhadap kesahihan dalaman kajian?