Hibák a hipotézisvizsgálat, teljesítmény

általános felmérést

A legtöbb hipotézisek vizsgálandó képest egy csoportja közötti tárgyak, amelyek számos tényező befolyásolja.

Például lehetőség van arra, hogy összehasonlítsuk a hatékonyságát kétféle kezelés csökkenti az 5 éves halálozás emlőrák. Mert ez az eredmény (azaz a halál) összehasonlítása érdekes helyek (pl, a különböző mortalitás 5 év), az úgynevezett hatás, vagy adott esetben, a hatás a kezelés.

A null hipotézist fejezzük hiányában a hatás (például 5 éves halálozási a rák-mo emlőmirigy azonos a két csoportban, kap-nek különböző kezelés); kétoldalas alternatív hipotézis azt jelentené, hogy a különbség a hatás nem nulla.

A kritérium, hogy teszteljék a hipotézis lehetővé teszi, hogy meghatározza, hogy elegendő érv, hogy elvetjük a nullhipotézist. Csak az egyik megoldás lehet venni:

  1. elvetjük a nullhipotézist és elfogadom az alter-natív hipotézis
  2. keretében maradnak a nullhipotézis

Fontos: A szakirodalomban gyakran fogalma megtalálható „fogadja a null hipotézist.” Szeretném világossá tenni, hogy a statisztikai szempontból, hogy elfogadja a nullhipotézis nem lehetséges, mert nullhipotézis kellően szigorú jóváhagyási (például, az átlagos értékek a két csoportban egyenlő).

Ezért a mondat elfogadása a nullhipotézist kell érteni, amit mi csak maradt a hipotézist.

rossz döntések

Lehet, hogy a rossz döntés, amikor elutasította / nem elvetjük a nullhipotézist, mert csak a kiválasztott információkat.

H0 tévesen utasította
(Hiba az első fajta)

H0 igaz elutasították

A hiba az 1. fajtája: elvetjük a nullhipotézist, ha ez igaz, és arra a következtetésre jutott, hogy van ilyen hatás, ha a valóságban nem így van. Legnagyobb esélye (valószínűsége) a hiba az 1. típusú kijelölt alfa (alfa). Ez szignifikanciaszint kritérium; null hipotézist elvetjük, ha a p-érték kisebb, mint a szignifikancia szint, azaz a. e. ha p <α.

Határoznia kell az értékeket, és mielőtt az adatgyűjtés; általában előírt alapértelmezett értéke 0,05, bár lehetséges, hogy válassza ki több, mint a határérték, például 0,01.

Egy esélyt, hogy hibázik az 1. típusú soha nem haladja meg a választott szignifikanciaszint, mondjuk α = 0,05, mint a null hipotézist elvetjük, ha p <0,05. Если обнаружено, что p> 0,05, a nullhipotézist nem kerül elutasításra, és ezért nem teszi lehetővé a hiba az 1. fajta.

Hiba 2. fajtája: nem elvetjük a nullhipotézist, ha hamis, és arra a következtetésre jutott, hogy nincs hatása, mivel a valóságban létezik. Annak az esélye egy hiba a 2. típusú kijelölt β (béta); és az értéket (1-β) nevű teljesítmény kritérium.

Következésképpen, a hatalom - ez a valószínűsége elutasítása a null hipotézist, ha hamis, azaz ez egy esély (általában százalékban kifejezve) felismerni a valódi hatása a kezelés egy adott térfogatú mintát, hogy statisztikailag szignifikáns.

Ideális esetben szeretnék hatalom a teszt 100% volt; de ez lehetetlen, hiszen mindig fennáll az esélye, jóllehet nem tévedhet 2. fajta.

Szerencsére tudjuk, hogy milyen tényezők befolyásolják kimenet, és így lehetőség van arra, hogy ellenőrizzék a teljesítmény kritérium, figyelembe véve azokat.

Teljesítmény és kapcsolódó tényezők

A tervezés a vizsgálat, meg kell tudni, hogy a hatalom a javasolt vizsgálatot. Nyilvánvaló, hogy akkor kezdődik, hogy tanulmányozza, ha van egy „jó” lehetőséget, hogy felfedezzék releváns hatást, ha létezik (a „jó” azt jelenti, hogy az energia legyen legalább 70-80%).

Etikailag felelőtlen kezdeni egy tanulmány, amely, mondjuk, csak 40% esély, hogy felfedezzék az igazi hatása a kezelés; ez egy kidobott idő és pénz.

Számos tényező van közvetlen összefüggésben a teljesítmény kritérium.

Minta mérete: mérőteljesítményt növekszik a minta térfogata. Ez azt jelenti, hogy egy nagyobb mintára több lehetőséget, mint a kicsi, fontosnak értelemben, ha létezik.

Amikor a minta térfogata kicsi pillanat kritérium elégtelen lehet erő detektálására egyetlen hatása. Ezek a módszerek is használhatók a teljesítmény becslésére kritérium pontos beállítása a minta térfogata.

Változékonyság megfigyelések: teljesítmény növekszik, a variabilitás a megfigyelések csökken.

A kamat a kutatók hatás: a hatalom a teszt több nagyobb hatást. A kritérium hipotézisek tesztelésére inkább észleli a jelentős tényleges hatást, mint egy enyhe.

Szignifikanciaszint: teljesítmény nagyobb lesz, ha a fontossági szint magasabb (ez megegyezik a növekvő a hibákat az 1. típusú, α, és a hibákat a 2. típusú, β, csökken).

Így a legvalószínűbb, a kutatók találtak egy valós hatása, ha úgy dönt, a tervezési szakaszban, amely tekinthető jelentős p-érték, ha valószínűsíthető, hogy kevesebb, mint 0,05, kevesebb, mint 0,01.

Felhívjuk figyelmét, hogy ellenőrzése VIR kamatváltozás hatása jelzi, hogy megfelelő mennyiségű energiát. Nagy megbízhatósági intervallum legyen egy kis minta és / vagy az adathalmaz egy jelentős változékonyság és jelzi az elégtelen kapacitás.

Ellenőrzése több hipotézisek

Gyakran kell végezni a kritérium, hogy teszteljék a jelentőségét több hipotézis az adatbázisba számos változó, és több mint két fajta kezelést.

A hiba az 1. típusú drámai módon megnöveli a összehasonlítások száma, ami a hamis következtetéseket a hipotézisek. Ezért érdemes megnézni csak kis számú hipotézis választjuk meg, hogy az eredeti célok a tanulmány és pontosan meghatározott a priori.

Akkor használja bármilyen utólagos finomítás P értékeket. figyelembe véve a számos elvégzett vizsgálatok hipotéziseket.

Például, amikor a Bonferroni-megközelítést (ez gyakran tekintik egy meglehetősen konzervatív) megszorozza minden egyes értékére p száma elvégzett vizsgálatok; mivel minden olyan döntést, ami a jelentősége ennek alapján kerül sor a közeli p értékét.