Hipotez Testi
Vikipedi, özgür ansiklopedi
[değiştir] Hipotez Testi
Diğer bir deyişle öngörü (tahmin) sınamaları olarak adlandırabiliriz. Hipotez testinin ne olduğunu tam olarak anlayabilmemiz için gerekli olan birkaç tanımı bilmemizdir. Bunlardan ilki hipotez kelimesinin ne anlama geldiği bizim için ne ifade ettiğidir.
Hipotez kısaca doğruluğu bir araştırma ya da deney ile test edilmeye çalışılan öngörülere, denencelere denir.
Hipotez testleri bir örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütle ortalaması etrafındaki farkın anlamlı olup olmadığını (yani önemli bir fark olup olmadığını) araştırmamızı sağlayan testlerdir.
Eğer 2 anakütlenin ortalamaları arasındaki fark ile ilgileniyorsak; bunlardan çekilen örneklemlerin ortalamalar arasındaki farka ait hipotez testleri yaparak, farkın doğru olup olmadığını anlayabiliriz.
[değiştir] Hipotezler
1:) Sıfır Hipotezi(H0) , Null, Yokluk Hipotezi, İstatistiksel Hipotez => Örneklemden elde edilen ortalama ile anakütleye ait ortalamanın farkı "sıfır","0" sayılabilir.
2:) Karşıt Hipotez (H1), Alternatif, Araştırma Hipotezi.
[değiştir] Karşılaşabileceğimiz Durumlar
1:) H0 doğrudur : Hipotez testi sonunda biz doğru olduğunu buluyoruz. Yani "KABUL" ediyoruz. (1 − α)
2:) H0 doğru olmasına karşın hipotez testi sonunda biz onun yanlış olduğunu zannedip H0'ı reddediyoruz.(α)
3:) H0 yanlıştır : Biz onu doğru zannedip kabul ettik. HATA!(β)
4:) H0 yanlıştır : Biz onun yanlış olduğunu bulduk; H0'ı reddettik.(1 − β)
[değiştir] Olasılıklar
α : Hatalı karar, H0 doğru, biz onu yanlış diye reddediyoruz. (I. Tip Hata)
β : Hatalı karar, H0 yanlış, biz onu doğru diye kabul ediyoruz.
(1 − α) : Doğru bir H0 hipotezini kabul etmemiz olasılığı olup buna [[testin güvenilirlik düzeyi]] denir.
(1 − β) : Yanlış bir H0 hipotezini ret etmemiz olasılığı olup buna [[tesin gücü]] denir.
Soru : Hipotez testi yaparken, α ve β hatalarını en aza indirmek için ne yapılmalı? Cevap : Örneklemdeki birim sayısını olabildiğince fazlalaştırmak.
Soru : α hatası yapma olasılığım azalırsa β hatası yapma olasılığı da azalır mı? Cevap : Aksine artar! Bu iki hatadan biri azalırken, diğeri artar.
Önemli : Aynı testte hem α hem de β hatası beraber yapılamaz.
Önemli : Hatasız bir test yapmak mümkün değildir. %100 doğru karar verilemez. Normal eğri x-ekseni ile kesişmediği için çok küçük de olsa bir risk söz konusudur.
[değiştir] Hipotez Testleri İçin Temel Varsayımlar
- Örneğe alınan birimler birbirlerinden bağımsız olarak seçilmiş olmalıdırlar.
- Anakütle normal dağılıma sahip olmalıdır.
- İki anakütle söz konusu ise bunların varyansları eşit olmalıdır.
[değiştir] Hipotez Testinin Aşamaları
1:) Hipotezlerin Oluşturulması
2:) Anlam düzeyinin α belirlenmesi
3:) Örnekleme dağılımının belirlenmesi
4:) Ret alanının ve kritik değerin belirlenmesi
5:) Karşılaştırmalar, sonuç ve yorum
[değiştir] Tek Örneklem Testi
Bir istatistik ile anakütle parametre sinin karşılaştırıması. μ0 (Mü sıfır diye okunur)parametreli bir anakütleden çekilmiş olduğunu düşündüğümüz "n" birimli ve (x bar diye okunur) ortalamalı bir örneklemin söz konusu anakütleden çekilmiş bir örneklem olup olamayacağını ya da o anakütleden çekilmiş olabileceği olasılığının ne olabileceğini ortaya koyan testlerdir.
Örnek:
Alçı dolum makinamız μ0=20kg ortalama ağırlıklı alçı dolumu yaparken arıza yapar. Tamirci getirip tamir ettiririz. Acaba yine μ0=20kglık dolum yapabilecek mi? Deneme yapıp görmek lazım!
Alçı torbaları
X1 = 19,8 kg, X2 = 20,5 kg, X3 = 21,2 kg, X4 = 18,9 kg,..., X40 = 20,8 kg
Örneklem
n = 40 torba = 21,4 kg σ = 3,2 kg
=
--> 21,4±0,506 kg
Şimdi hipotez testine geçebiliriz:
[değiştir] Hipotezler
H0 : Elimizdeki örneklem anakütle ortalaması Mo = 20kg olan bir anakütleden çekilmiş bir rassal örneklem olup, örneklem ortalaması X- değeri amakütle ortalamasına eşit olarak kabul edilebilir. Aradaki 1,4kg lık fark ise tesadüfe bağlanabilecek, önemli olmayan, anlam taşımayan çok küçük bir farktır. Dolayısıyla X- = Mo yazabiliriz. Yani elimizdeki örneklemin ait olduğu anakütle ortalamasını M ile gösteririz.
H1 : Bu örneklem Mo=20kg olan bir anakütleden çekilmiş bir rassal örneklem olamaz. Aradaki 1,4kg lık fark tesadüfe bağlı değil, ayarlamanın yapılmamış olması nedeni ile gerçekleşmiştir. Bu kadarlık farkın tesadüfen ortaya çıkmış olması olasılığı çok küçüktür. Dolayısıyla dolum ayarı iyi olmadığı için istenenden daha hafif ya da daha ağır dolumlarla karşılaşmamız olasıdır. Bu örneklemin çekilmiş olduğu anakütle 20kg olamaz. Örneklemimiz kendine ait başka bir anakütleden çekilmiş olmalıdır.
[değiştir] Anlam Düzeyinin Belirlenmesi
Risk düzeyi, Yanılgı Payı, Hata payı
alfanın saptanması. Hatasız bir test yapamayacağımız için her testte bir miktar yanılma riskimiz vardır. Bunu 0,05 ; 0,01 ; 0,005 ; 0,0001;... gibi bir düzey olarak benimseyebiliriz. Yanılma payımız küçüldükçe, teste olan güven düzeyimiz yükselir. O nedenle istatistikçiler olabildiğince az yanılma ile test yapmak isterler. Yine de alfa=0,05 ve alfa=0,01 düzeyleri en çok kullanılanlardır.
alfa=0,05 olsun. Testin güven düzeyi = 1 - alfa = 0,95 olur.
[değiştir] Örnekleme Dağılımının Belirlenmesi
Elimizdeki veriler tartma yoluyla elde edilmiş sürekli, nitelik, nicel bir değişkene aittir. Bu tip veriler genelde normal dağılım gösterirler. Yani örneklemimiz "normal dağılım" lı bir anakütleden çekilmiştir. Anakütle sonsuz büyüklüktedir. Seçim iadesiz seçimdir ve tamamen rassal bir süreçle yapılmıştır. Yani torbaların ağırlıkları birbirini etkilememiştir. n>30 olduğu için büyük bir örneklem ile çalışıyoruz. Aynı anakütleden n=40 birimli pek çok sayıda örneklem çekmiş olsak, bunların X- ortalama dağılımı bir normal dağılım olur. Bu ortalamaların ortalaması anakütle ortalamasını verir. "kg" biriminden kurtulmak için X- ortalama değerlerini standardize edersek, verilerimiz z değerlerine dönüşür ve dağılımımız bir standart normal dağılım olan z dağılımı na dönüşür.
== Ret Alanının Belirlenmesi ==Kritik değerin saptanması
Ret alanı demek; normal dağılım eğrisi altında seçtiğimiz güven alanı (Ho'ın kabul alanı) dışında kalan Ho'ın reddedilmesini sağlayan küçük alanlardır. Ret alanı çift yönlü olabilir. (eksi taraf, artı taraf) veya tek taraflı olabilir. (Yani ya sol tarafta ya da sağ tarafta) Bunun anlaşılması için H1 hipotezine bakarız.
[değiştir] Test İstatistiği
Elimizdeki örnekleme ait zh değeri örneklemin bir istatistiğidir. Bu istatistik yardımıyla hipotez testini sonuçlandıracağız. O nedenle, zh değerine Test İstatistiği adını veriyoruz.
zh=(|(X-)-(Mo)|)/Sx- = (|21,4-20|)/0,51 = 2,74
[değiştir] Karşılaştırma, Sonuç ve Yorum
Bir hipotez testinde; zh < zalfa ise; Ho kabul edilir. Bu elimizdeki X-in, M ye yakın kabul edilebilecek bir konumda (Ho'ın kabul alanında) bulunduğunu gösterir.
Eğer zh > zalfa ise; Ho reddedilir. Elimizdeki örneklemin, Mo ortalamalı bir anakütleden çekilmiş rassal bir örneklem olmayacağı çünkü böyle bir şeyin gerçekleşmesi olasılığının çok küçük (p<0,05 veya p<0,01) olduğu sonucuna ulaşılır.
SONUÇ : zh = 2,74 > z0,05 = 1,96 --> Ho RET
Bu duruma göre: elimizdeki örneklemin ortalaması, ilgilendiğim anakütlenin ortalamasından çok uzağa düşen bir büyüklüktedir. O nedenle iki ortalama arasındaki farkı z değerine dönüştürdüğümde, bulduğum zh = 2,74 değeri de z0,05 = 1,96 nın ötesine düşmüştür. Yani %5'lik ret alanına düşmüştür. Bu durumda X- = Mo biçiminde ifade ettiğim ve oradan M=Mo düzeyine yükselttiğim Ho hipotezini kabul edemem. Demek ki, bu makine hatalı dolum yapmakta, ortalaması 20kg olan dolumlar gerçekleştirememektedir. Aynı deneyi n=40 olan 100 örneklem ile tekrarlarsam, bunun 95inde gene aynı sonuçla karşılaşmayı beklerim. Belki yalnızca 5inde makinenin ayarı iyiymiş gibi hatalı bir sonuca ulaşabilirim.
Dolayısıyla; verdiğim kararın doğru olması olasılığı %95 iken hatalı olması olasılığı en fazla %5 tir.
[değiştir] Test Sonucundaki Değerlendirmeler ve Yorum
1:) zh<zalfa olduğunda, Ho hipotezini kabul ediyoruz ve;
- Bu iki örneklemin çekilmiş olduğu anakütle ortalamalarının birbirlerine eşit olduklarını,
- Bu iki anakütlenin aynı anakütleden çekilmiş birer rassal örneklem olduğunu,
- İki örneklem ortalaması arasında gözlediğimiz farkın tesadüfün bir eseri olarak ortaya çıkmış, istatistik bakımından anlamlı olmayan, önemli olmayan küçük bir fark olduğunu düşünürüz.
2:) zh>zalfa olduğunda, Ho hipotezini reddediyoruz ve;
- Ho hipotezine ait olan düşüncemizin tersini kabul ediyoruz, yani H1'i kabul ediyoruz.
- Bu büyüklükteki zh değerinin tesadüfe bağlı olarak ortaya çıkmış olması ihtimali(olasılığı) çok düşüktür. Bu olasılık(p değeri) seçtiğimiz alfa dan da küçüktür. Bu kadar küçük bir olasılıkla ortaya çıkan bu z değerini artık tesadüfe değil anakütlenin gerçekten farklı olmasına bağlarız.