STATISTIK PENDIDIKAN EDU5950 SEM1 2013-14 STATISTIK INFERENSI: PENGUJIAN HIPOTESIS BAGI PERBANDINGAN LEBIH DARIPADA DUA MIN (UJIAN-F) Rohani Ahmad Tarmizi - EDU5950 1
STATISTIK INFERENSI ATAU PENTAKBIRAN (Inferential Statistics) Bertujuan untuk menerangkan ciri populasi berdasarkan data yang dikumpul daripada sampel. Tujuan ini berkait rapat dengan objektif kajian serta hipotesis atau soalan kajian. Membolehkan penyelidik membuat kesimpulan bahawa terdapat statistik yang signifikan atau statistical significance yang bermaksud boleh diterima pakai dengan meluas, meyakinkan.
LANGKAH PENGUJIAN HIPOTESIS L1. Nyatakan hipotesis hipotesis statistik/sifar (H 0 ) dan hipotesis penyelidikan (H A ) BERARAH ATAU TIDAK BERARAH L2. Tetapkan aras signifikan, taburan persampelan dan statistik pengujian yang akan digunakan ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN z, t, F, r STATISTIK PENGUJIAN (z, t, F, r ) L3. Tentukan nilai kritikal bagi taburan persampelan yang akan digunakan - RUJUK JADUAL z, t, F, r L4. Kirakan statistik pengujian (tests statistics) bagi taburan persampelan tersebut RUJUK FORMULA L5. Buat keputusan, kesimpulan dan tafsiran.
Hipotesis penyelidikan L1. Nyatakan hipotesis Terdapat perbezaan yang signifikan antara min tahap kepimpinan pengajaran Pengetua di Sekolah berprestasi tinggi berbanding dengan sekolah Swasta. Hipotesis nol/sifar Tiada terdapat perbezaan yang signifikan antara min tahap kepimpinan pengajaran Pengetua di sekolah berprestasi tinggi berbanding dengan sekolah Swasta.
L1. Nyatakan hipotesis (dua kumpulan) Hipotesis penyelidikan Terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1. Hipotesis nol/sifar Tiada terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1.
1. Nyata hipotesis nol dan penyelidikan. H O : µ 1 = µ 2 H A : µ 1 µ 2 H O : µ 1 µ 2 H A : µ 1 < µ 2 H O : µ 1 µ 2 H A : µ 1 > µ 2
L2. TETAPKAN ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN, STATISTIK PENGUJIAN Nilai alpha ditetapkan oleh penyelidik. Ia merupakan nilai penetapan bahawa penyelidik akan menerima sebarang ralat semasa membuat keputusan pengujian hipotesis tersebut. Ralat yang sekecil-kecilnya ialah 0.01 (1%), 0.05 (5%) atau 0.10(10%). Nilai ini juga dipanggil nilai signifikan, aras signifikan, atau aras alpha.
L2. Taburan Persampelan Taburan yang bersesuaian dengan analisis yang dijalankan. Ia merupakan model taburan dan mengambil pelbagai bentuk: Taburan persampelan min-min, ujian-z (n>30) Taburan persampelan min-min, ujian-t (n<30) Taburan persampelan perbezaan min-min t bebas Taburan persampelan perbezaan min-min t sandar Taburan persampelan F atau varians
L3. Nilai Kritikal Nilai kritikal adalah nilai yang menjadi sempadan bagi kawasan Ho benar dan Hp benar. Nilai ini merupakan nilai dimana penyelidik meletakkan penetapan sama ada cukup bukti untuk menolak Ho (maka boleh menerima Hp) ataupun tidak cukup bukti menolak Ho (menerima Ho). Nilai ini bergantung kepada nilai alpha dan arah pengujian hipotesis yang dilakukan.
L4. Nilai Statistik Pengujian Ini adalah nilai yang dikira dan dijadikan bukti sama ada hipotesis sifar benar atau salah. Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah salah, ditolak dan Hp diterima Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.
L4. Nilai Statistik Pengujian Z diuji = t diuji =
L5. Membuat Keputusan, Kesimpulan dan tafsiran Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.
L5. Membuat Keputusan, Kesimpulan dan Tafsiran Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah tak benar, maka Ho ditolak dan seterusnya, Hp diterima (bermakna ada bukti Hp adalah benar)
UJIAN-t TAK BERSANDAR Ujian yang digunakan bagi membanding dua kumpulan yang tidak bersandar atau berkait antara satu sama lain. Contohnya, membezakan tahap CGPA, IQ, MOTIVASI antara kumpulan lelaki dan perempuan. Kenal pasti p/u tak bersandar dan juga p/u bersandar. Hanya terdapat dua kumpulan untuk dibandingkan dalam sesuatu analisis.
Terdapat perbezaan prestasi ujian menaakul selepas eksperimen antara dua kumpulan pelajar yang mendapat pengajaran secara SCL dengan pengajaran konvensional S1=2 0 S2=2 5 S3=3 Kumpulan 6 KONV.. S1=2 8 S2=3 5 S3=4 Kumpulan 6 SCL..
4. Kirakan nilai statistik pengujian t = X1 X2 sp² sp² + n1 n2 sp² = (n1-1)s1² + (n2-1)s2² n1 + n2-2 Equal variance formula n 1 adalah bilangan dalam sampel 1 n 2 adalah bilangan dalam sampel 2 S 1 adalah sisihan piawai bagi sampel 1 S 2 adalah sisihan piawai bagi sampel 2
Ujian-t Bersandar (Paired sample t-test) Ujian ini digunakan untuk mengkaji perbezaan bagi satu perkara ia itu p/u bersandar antara dua kumpulan ia itu p/u tak bersandar tetapi berkait, berpadanan atau matched-pair.
4. Kirakan statistik pengujian t d d s d n
Terdapat perbezaan prestasi ujian menaakul sebelum eksperimen berbanding dengan selepas eksperimen. S1=2 0 S2=2 5 S3=3 Sebelum 6 eksperimen.. S1=2 8 S2=3 5 S3=4 Selepas 6 eksperimen..
PENGUJIAN HIPOTESIS PERBANDINGAN LEBIH DARIPADA DUA KUMPULAN ANALISIS VARIANS (ANOVA) Pengujian hipotesis ini adalah lanjutan daripada PH perbandingan dua min. Ia melibatkan perbandingan lebih daripada dua min ia itu membanding min-min antara tiga, empat, lima atau lebih kumpulan atau subpopulasi. Min merupakan asas bagi perbandingan antara kumpulan.
MODEL PENGUJIAN POPULASI SUB-POPULASI 1 SUB-POPULASI 3 SUB-POPULASI 2
Pengujian hipotesis ini telah dikemukakan oleh Sir Ronald Fisher. Oleh itu beliau menamakan taburan persampelan yang digunakan sebagai taburan F. Taburan persampelan F merupakan taburan varians (perbezaan antara skor-skor bagi kumpulan-kumpulan yang dikaji.) Oleh kerana itu pengujian hipotesis ini dipanggil ujian F ataupun ujian ANALISIS VARIANS (Analysis of Variance- ANOVA)
Bentuk taburan persampelan ini adalah pencong kanan oleh kerana ia bukan taburan min-min tetapi varian-varians. Kawasan dikiri menunjukkan bahawa minmin yang dibanding tidak jauh berbeza. Manakala dikanan (kawasan kritikal) menunjukkan bahawa min-min yang dibanding adalah jauh berbeza ia itu statistically ataupun berbeza dengan bererti atau signifikan.
Dengan menggunakan nilai kritikal ini kawasan kritikal dapat ditentukan. Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H 0 ) adalah palsu dan hipotesis penyelidikan (H p / H a ) adalah benar. Jika F uji termasuk dikawasan kritikal maka, terdapat perbezaan yang signifikan antara minmin kumpulan-kumpulan (sub-populasi) tersebut. Seterusnya, buat keputusan, tafsiran dan kesimpulan.
Statistik pengujian bagi ujian ini adalah F uji atau F ratio Nisbah-F Nilai kritikalnya adalah nilai F krit Seperti ujian-t, ujian F melibatkan perbandingan min bagi pembolehubah bersandar. Setiap kumpulan atau sub-populasi merupakan p/u bebas atau p/u tak bersandar. Sebagai contoh, perbandingan min pencapaian antara kumpulan pelajar daripada program Masters Sains BK, PP, dan SS. P/u bebas Program pengajian P/u bersandar min pencapaian
PENGIRAAN NILAI KRITIKAL Tetapkan aras signifikan Kirakan darjah kebebasan Dk antara kumpulan = k-1 Dk dalam kumpulan = n-k k adalah bilangan kumpulan n adalah bilangan cerapan Carikan nilai kritikal yang sepadan di Jadual F
4. Kirakan nilai statistik pengujian (ANOVA) F uji = Variansak = SSak / dkak Variansdk SSdk / dkdk
4. Kirakan nilai statistik pengujian (ANOVA) 1. Kirakan sum of squares (SS) a. SSj = ΣX² - (ΣX)² N b. SSak = [( X 1 )²/ n 1 + ( X 2 )²/ n 2 + ( X 3 )²/ n 3 +.]- ( X)² / n c. SSdk = SST - SSB 2. Determine degrees of freedom (dk) a. dkak = k - 1 b. dkdk = N- k F uji = SSak / dkak c. dkj = N - 1 SSdk / dkdk
Dengan menggunakan nilaik kritikal ini kawasan kritikal dapat ditentukan. Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H 0 ) adalah palsu dan hipotesis penyelidikan (H p / H a ) adalah benar. Jika F uji termasuk dikawasan kritikal maka, terdapat perbezaan yang signifikan antara min-min kumpulan-kumpulan (sub-populasi) tersebut. Seterusnya, buat keputusan, tafsiran dan kesimpulan.
Kes 1: Dr. Durraini ingin menentukan sama ada tahap pengetahuan IT antara guru sekolah bandar, pinggir bandar dan luar bandar berbeza. Beliau telah memilih secara rawak satu sekolah yang telah dikategorikan oleh pihak Kementerian Pendidikan sebagai sekolah bandar, pinggir bandar dan luar bandar. Daripada wakil setiap jenis sekolah tersebut beliau telah mengumpul maklumat tentang aspek IT dalam pengajaran dan pembelajaran. Salah satu aspek yang telah dikaji adalah tahap pengetahuan IT. Bagi mengesahkan perbezaan tahap IT dikalangan guru yang dikaji, Dr. Durraini telah menjalankan satu ujian bagi mengukur tahap pengetahuan IT guru-guru sekolah tersebut.
Nyatakan objektif kajian bagi kes tersebut. Nyatakan persoalan kajian bagi kes tersebut. Jalankan pengujian hipotesis yang sesuai.
Bandar KES 1: DATA Pinggir Bandar Luar banadar x x x 40 33 23 45 39 32 45 51 33 53 40 29 49 42 40 40 25 28 232 245 210
BANDAR PGR BANDAR LUAR BANDAR X 1 X 1 X 2 X 2 X 3 X 3 2 2 2 40 1600 33 1089 23 529 45 2025 39 1521 32 1024 45 2025 51 2601 33 1089 53 2809 40 1600 29 841 49 2401 42 1764 40 1600 40 1600 25 625 28 784 232 10860 245 10175 210 6492
1: Bentuk hipotesis kajian a. Pembolehubah bersandar : Pengetahuan IT guru b. Pembolehubah tak bersandar : Lokasi sekolah c. Ho : Tidak terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza lokasi dalam kalangan guru di Hulu Selangor. Ha : Terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza lokasi dalam kalangan guru di Hulu Selangor. Min pengetahuan IT bagi kumpulan bandar = 46.40 Min pengetahuan IT bagi kumpulan pinggir bandar= 40.83 Min pengetahuan IT bagi kumpulan luar bandar = 30.00
2. Tetapkan tahap alpha, taburan persampelan,statistik pengujian Aras signifikan : α = 0.05 Taburan persampelan : Taburan f Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 3 = 15
3. Tetapkan nilai kritikal dan kawasan kritikal Aras signifikan : α = 0.05 Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 3 = 15 Fk = 3.68 Fk=3.68
4. Kirakan Statistik Pengujian i. Varians Antara kumpulan a. SSak = ( X1)² + ( X2)² + ( X3)² _ ( X)² n1 n2 n3 n = (232)² + (245)² + (210)² _ (687)² 5 6 7 18 = 848.47
b. dk ak = k 1 = 3-1 = 2 c. Varians antara kumpulan = SS ak dk ak = 848.47 = 424.24 2
ii Varians dalam kumpulan a. SS dk = X² _ ( X)² _ SS ak n = (27527 [687] 2 /18) - 848.47 = 1306.5 848.47 = 458.03
b. dk dk = n -k = 18-3 = 15 c. Varians dalam kumpulan = SS dk dk dk = 458.24 15 = 30.54
iv. F uji (Nisbah F) F uji = Varians antara kumpulan Varians dalam kumpulan F uji = SSak / dkak SSdk / dkdk = 424.24 30.54 F uji = 13.89
5. Keputusan, Tafsiran dan cadangan F uji berada dalam kawasan Hp benar. Keputusannya, terima Hp, tolak Ho Oleh itu, dapatan kajian menunjukkan bahawa terdapat perbezaan tahap pengetahuan IT berdasarkan lokasi sekolah dalam kalangan guru di Hulu Selangor dengan signifikan, F (2, 18) = 13.89, p <0.05
Skor min pengetahuan IT bagi guru sekolah bandar adalah 46.40, guru sekolah pinggir bandar adalah 40.83. manakala bagi guru sekolah luar bandar adalah 30.00. Hasil analisis ujian-f menunjukkan bahawa terdapat perbezaan yang signifikan antara ketiga-tiga min pengetahuan IT bagi guru daripada sekolah bandar, pinggir bandar dan luar bandar, F(2,15) = 13.89, p<.05. Dengan itu, dapatan kajian menunjukkan bahawa pengetahuan IT di antara guru yang berlainan lokasi sekolah adalah berbeza dengan signifikan. Analisis deskriptif menunjukkan bahawa guru dari kumpulan bandar adalah lebih mahir dalam pengetahuan IT daripada kumpulan yang lain-lain. Dapatan juga menunjukkan bahawa tahap pengetahuan IT bagi kumpulan guru luar bandar dan pinggir bandar didapati agak rendah.sehubungan dengan itu, dapatan ini menunjukkan bahawa guru di sekolah luar bandar dan pinggir bandar perlu diberi perhatian yang lebih dalam aspek meningkatkan kemahiran IT di kalangan guru.
DUA PERINGKAT ANALISIS DESKRIPTIF DAN INFERENSI Secara deskriptif dihuraikan min-min kumpulan tersebut dan nyatakan terdapat perbezaan min antara kumpulan tersebut jika ada. Secara inferensi perbezaan min ini hendaklah disahkan melalui LIMA LANGKAH - PENGUJIAN HIPOTESIS. Dengan itu pengkaji dapat menghebahkan bahawa terdapat perbezaan yang signifikan antara min-min tersebut ataupun disebaliknya.
UJIAN ANALISIS VARIANS (ANOVA) Ujian yang dikemukakan oleh Sir Ronald Fisher bagi tujuan membanding lebih daripada dua kumpulan. Ujian ini juga dipanggil singkatan ANOVA. Ada beberapa jenis ANOVA: SIMPLE DAN MULTIPLE. Kenal pasti p/u bersandar dan juga p/u tak bersandar bagi setiap analisis. Telitikan nilai F dan nilai signifikan bagi F untuk membuat keputusan.
LATIHAN - ANOVA X 1 X 2 X 3 X 4 0 1 4 1 1 3 3 2 3 2 6 2 1 2 3 0 0 2 4 0
x 1 x 2 1 x 2 x 2 2 x 3 x 2 3 x 4 x 2 4 0 0 1 1 4 16 1 1 1 1 3 9 3 3 2 4 3 9 2 4 6 36 2 4 1 1 2 4 3 9 0 0 0 0 2 4 4 16 0 0 5 11 10 22 20 86 5 9
sum mean x 1 x 1 2 x 2 x 2 2 x 3 x 3 2 2 4 10 100 10 100 3 9 8 64 13 169 7 49 7 49 14 196 2 4 5 25 13 169 6 36 10 100 15 225 N1 =5 N2= 5 N3 =5 20 102 40 338 65 859 4.00 8.00 13.00
Analysis of Variance (ANOVA) can be used to test for the equality of three or more population means. Data obtained from observational or experimental studies can be used for the analysis. We want to use the sample results to test the following hypotheses: H 0 : 1 = 2 = 3 =... = k H a : Not all population means are equal
H 0 : 1 = 2 = 3 =... = k H a : Not all population means are equal If H 0 is rejected, we cannot conclude that all population means are different. Rejecting H 0 means that at least two population means have different values.
SCENARIO 1 Objective: To compare differences between group means Hypothesis: Is there any significant difference in satisfaction between users of the following three computer operating systems. The Variables Type Scale Satisfaction Dependent Interval Operating systems Independent Nominal
SCENARIO 2 Which of the following data sets indicate differences between the two groups? Data 1: A B C 30 21 22 14 28 27 26 14 16 15 31 29 27 16 14 13 12 14 25 27 27 Range Mean Data 2: A B C 13 25 35 12 26 36 15 28 38 14 27 37 15 26 36 12 30 40 17 29 39 Range Mean
Randomized Design Example Factor levels (Treatments) Experimental units (students) Factor (Training Method) Type1 Type2 Type3 Dependent variable (Response)
Analysis of Variance Evaluate the Difference Among the Means of 2 or More Populations e.g., Several Types of Training, Group Settings, Race Assumptions: Samples are randomly and independently drawn (This condition must be met.) Populations are normally distributed or each sample is large (F test is robust to moderate departures from normality.) Populations have equal variances
Assumption Underlying One-way ANOVA 1. The dependent variable is normally distributed for each of the populations as defined by the different levels of the factor (independent variables) 2. The variances of the dependent variable are the same for all populations 3. The cases represent random samples from the populations and the scores on the test variable are independent of each other
Why ANOVA? We could compare the means, one by one using t-tests for difference of means. Problem: each test contains type I error The total type I error is where k is the number of means. 1 1 a k For example, if there are 5 means and you use a=.05, you must make 10 two by two comparisons. Thus, the type I error is 1-(.95) 10, which is.95. That is, 95% of the time you will reject the null hypothesis of equal means in favor of the alternative!
ANOVA S Hypothesis H 0 : 1 = 2 = 3 =... = c All population means are equal No treatment effect (NO variation in means among groups) H 1 : not all the k are equal At least ONE population mean is different (Others may be the same!) There is treatment effect Does NOT mean that all the means are different: 1 2... c
ANOVA: No Treatment Effect H 0 : 1 = 2 = 3 =... = c H 1 : not all the k are equal The Null Hypothesis is True
ANOVA: Treatment Effect Present H 0 : 1 = 2 = 3 =... = c H 1 : not all the k are equal The Null Hypothesis is NOT True
Basis for the Comparison Total variance which is partitioned into Between and Withingroup Between Group Total Variance Within group
Calculation of the test statistic for ANOVA 1. Calculate sum of squares a. SST = ΣX² - (ΣX)² N b. SSB = [( X 1 )²/ n 1 + ( X 2 )²/ n 2 + ( X 3 )²/ n 3 +.]- ( X)² / n c. SSW = SST - SSB 2. Determine degrees of freedom a. dfb = k - 1 b. dfw = N- k c. dft = N - 1
ANOVA Test Statistic F = SSB / dfb = MSB SSW / dfw MSW MSB is Mean Square Between Groups MSW is Mean Square Within Groups
One-Way ANOVA Summary Table The F-statistic is the ratio of the BETWEEN estimate of the variance and the WITHIN estimate of the variance. Therefore, it must always be positive. If the null hypothesis of equal means is true, then this ratio should be 1. The degrees of freedom in the denominator will typically be large, (n-c) while the degrees of freedom in the numerator will be small (c-1). The numerator is expected to be greater than the denominator.
What to expect? Post hoc comparison Test Hypothesis Omega and Eta squares
1. Write the null and alternative hypothesis 2. Identify the sampling distribution alpha level and critical region 3. Determine the critical value 4. Calculate the test statistics - F-ratio 5. Make your decision Interpret your decision
Steps in ANOVA 1. State the null and alternative hypotheses HO : µ1 = µ2 = µ3 HA : Not all means are equal 2. Identify the sampling distribution, alpha level, critical region, test statistics 3. Determine the critical value 4. Calculate the test statistic F ratio 5. Make your decision, conclusion, and implications