Kétmintás t-próba

A kétmintás t-próba azt vizsgálja, hogy két külön mintában egy-egy valószínűségi változó átlagai egymástól szignifikánsan különböznek-e.

További lehetőséget nyújt ez a próba arra vonatkozóan, hogy két vizsgált eloszlás egyesíthető-e; azaz: feltételezhető-e, hogy azonos eloszlásból származnak.

A próba alkalmazásának feltételei

a vizsgált valószínűségi változók

A próba nullhipotézise

Nullhipotézis: a két vizsgált változó átlaga statisztikai szempontból megegyezik.

Alternatív hipotézis: a két vizsgált változó átlaga statisztikai szempontból nem egyezik meg.

A "statisztikai szempontból" kifejezés itt arra utal, hogy az eltérés a két átlag között olyan minimális, hogy pusztán csak a véletlen ingadozásnak tulajdonítható (ekkor a két átlag statisztikai szempontból azonosnak tekinthető), vagy jelentősen nagyobb, mint ami a véletlennel magyarázható (ekkor a két átlag statisztikai szempontból nem tekinthető azonosnak).

Valójában a fenti két hipotézis precíz matematikai megfogalmazása a következő.

  • H0: Az X és Y valószínűségi változók várható értékei megegyeznek, (E(X) = E(Y)).
  • H1: Az X és Y valószínűségi változók várható értékei nem egyeznek meg, (E(X) ≠ E(Y)).

A próbastatisztika

A kétmintás t-próba próbastatisztikája

ahol

  • az egyik valószínűségi változó átlaga a mintájában,
  • a másik valószínűségi változó átlaga a mintájában,
  • sx* az egyik valószínűségi változó korrigált szórása,
  • sy* a másik valószínűségi változó korrigált szórása,
  • n az egyik minta elemszáma és
  • m a másik minta elemszáma.

A próba végrehajtásának lépései

  1. A próba alkalmazhatóságának feltétele a szórások egyezése, amit külön statisztikai próba, az F-próba segítségével ellenőrzünk. Csak akkor alkalmazhatjuk a kétmintás t-próbát ha az F-próba a szórások között szignifikáns különbséget nem tud kimutatni. Ha szignifikáns különbséget mutat ki, akkor a kétmintás t-próbát nem lehet alkalmazni, de helyette alkalmazható az ugyanezt a nullhipotézist vizsgáló Welch-próba, ami nem igényli a szórások egyezését.
  2. Az t próbastatisztika értékének kiszámítása.
  3. A p szignifikanciaszint megválasztása. (Ez a legtöbb vizsgálat esetén 0,05 vagy 0,01.)
  4. A p szignifikanciaszinttől függő tp érték kiválasztása a próbának megfelelő táblázatból. A táblázat jelen esetben a t-eloszlás táblázata, mely eloszlásra szoktak úgy is utalni, mint Student-eloszlás, illetve Student-féle t-eloszlás. A táblázat kétdimenziós, a p szignifikanciaszint és az f szabadsági fok ismeretében azonnal megkapjuk a táblázatbeli tp értéket. Az f szabadsági fokot a kétmintás t-próba esetén az f = n + m – 2 képlettel számítjuk.[* 1]
  5. A nullhipotézisre vonatkozó döntés meghozása.
    • Ha |t| ≥ tp, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy a két mintában a valószínűségi változók átlagai szignifikánsan eltérnek egymástól (p szignifikanciaszint mellett).
    • Ha |t| < tp, akkor a nullhipotézist megtartjuk, amit úgy interpretálunk, hogy a kétmintás t-próba nem mutat ki szignifikáns különbséget a két mintában a valószínűségi változók átlagai között (p szignifikanciaszint mellett).

Példa

Biológusok egy vizsgálatban azzal a feltételezéssel élnek, hogy a sivatagi iramszarvas számára kedvezőbb életkörülményeket jelent ha van lehetőségük hűs vízben lubickolni, amikor csak kedvük tartja, mint ha ugyanerre nincs lehetőségük. Ennek a hipotézisnek a tesztelésére 19 iramszarvast különítenek el egy hatalmas csordából, és két csoportba sorolják be őket. Az egyik csoportba 8 a másikba 11 egyed kerül. A két csoport egyedeit minden életfeltétel tekintetében azonos körülmények között tartják, attól eltekintve, hogy az egyik csoportnak rendelkezésére áll egy kellemes kis medence is, melyben bármikor fürdőzhetnek, a másiknak pedig nem.[* 2] Három hónapnyi elkülönítés után a sivatagi iramszarvasok súlyát lemérik. Azzal a feltételezéssel élnek, hogy a medence mellett tartott szarvasok testsúlya jobban gyarapodott, mint a másik csoporté. (Köztudott, hogy a sivatagi iramszarvasok erőnlétének egyik legpontosabb jelzője a testsúlyuk: a súlyosabb iramszarvasok mindig egészségesebbek és erősebbek.)

A medencés csoport szarvasainak testsúlya (tömege) kg-ban:

52; 57; 62; 55; 64; 57; 56; 55.

A medencét nélkülöző csoport szarvasainak testsúlya (tömege) kg-ban:

41; 34; 33; 36; 40; 25; 31; 37; 34; 30; 38.

Arra kíváncsiak a biológus kutatók, hogy a két csoport átlagos testtömege közötti különbség szignifikánsan nagynak mondható, vagy nem nagyobb annál, mint amit a puszta véletlennel is magyarázni lehet. Felteszik, hogy a szarvasok testtömege normális eloszlást követ. Ez – bár igen reálisnak hangzik – ellenőrizhető más statisztikai próbákkal, úgynevezett normalitásvizsgálatokkal. Az átlagsúlyok összehasonlítására kétmintás t-próbát alkalmaznak.

Első lépésben ellenőrzik, hogy a két mintában a testtömeg szórása azonosnak tekinthető-e. Erre F-próbát alkalmaznak, amely nem mutat ki szignifikáns különbséget a szórások között (ld. F-próba példája), így a kétmintás t-próbát kell alkalmaznunk. Az F-próbához is a korrigált szórások négyzetét kell kiszámítani, ami ebben a két mintában sx*2 = 15,36, és sy*2 = 21,87. A "medencés" iramszarvasok testtömegének átlaga = 57,25, míg a másik csoportnál ugyanez a paraméter = 34,45, a minták nagysága n = 8 és m = 11. A próbastatisztika értéke ennek megfelelően

A szignifikanciaszintet p = 0,05-nek véve és az f = n + m – 2 = 17 szabadsági fok ismeretében a t-táblázatban a t0,05 = 1,740 értéket találják a kutatók, így

t ≈ 11,12 miatt t > 11,11 > 1,74 = t0,05

azaz |t| ≥ t0,05 teljesül.

Tehát a nullhipotézist elvetik, a kétmintás t-próba szerint a medencés környezetben tartott sivatagi iramszarvasok átlagos testtömege 3 hónap alatt szignifikánsan magasabb lett (p = 0,05-ös szignifikanciaszint mellett), mint az ugyanolyan körülmények között tartott, de medencét nélkülöző iramszarvasoké.

A próba matematikai háttere

A próba matematikai hátterének legfontosabb gondolata, hogy bármely X és Y független, normális eloszlású valószínűségi változóra vett X1, X2, … Xn illetve Y1, Y2, … Xm minták esetén az

valamint az

jelölésekkel élve megmutatható, hogy a

valószínűségi változó (n + m – 2) szabadsági fokú t-eloszlást követ.

Emiatt az (n + m – 2) szabadsági fokú t-eloszlás ismeretében bármilyen 1 > p > 0 esetén meg lehet határozni azt az tp értéket, melyre

.

Ez azt jelenti, hogy ha igaz a nullhipotézis, akkor a t próbastatisztika értéke 1-p valószínűséggel a (-tp, tp) intervallumba esik.

Megjegyzések

  • A kétmintás t-próba bizonyos tekintetben az kétmintás u-próba párja, mindkettő ugyanazt a nullhipotézist vizsgálja ugyanolyan adottságok mellett. Ugyanakkor az alkalmazás feltételeiben nem esik teljesen egybe a két próba és a próbastatisztikák képletei is nagy különbséget mutatnak. A kétmintás t-próba és a kétmintás u-próba között tehát nem olyan nagy a hasonlóság, mint a egy egymintás t- és u-próba között volt.
  • A szakirodalom nem teljesen egységes annak tekintetében, hogy a nullhipotézis elvetéséről vagy megtartásáról szóló döntésben az |t| és tp közötti két egyenlőtlenség közül melyiknél engedi meg az egyenlőséget. Ennek gyakorlati jelentősége nem igazán van, az alkalmazások során nagyon ritkán adódik, hogy a kiszámított próbastatisztika pontosan egybeessen a táblázatbeli értékkel. Ha esetleg mégis így alakul, akkor az eredmény úgy interpretálható, hogy a nullhipotézis elvetése esetén a kockázat pontosan megegyezik a szignifikanciaszinttel, s innen a kutató (és a tudós társadalom) szája ízétől függ, hogy ebben inkább a nullhipotézis elvetésének, vagy inkább a nullhipotézis megtartásának zálogát látja.
  • Érdemes megfigyelni az óvatos fogalmazást a nullhipotézis megtartása esetén. Az általunk meghatározott p szignifikanciaszint az elsőfajú hiba elkövetésének valószínűségét adja meg. Ha el tudom vetni a nullhipotézist, akkor ekkora kockázatot vállalok arra nézve, hogy esetleg hiba elvetni. Amennyiben viszont nem tudom elvetni a nullhipotézist, akkor elsőfajú hibát biztosan nem fogok elkövetni, ám elkövethetek másodfajú hibát, melynek kockázatáról semmit nem mond a próba. Ez indokolja, hogy ha a nullhipotézist megtartjuk, akkor nem azt mondjuk, hogy nincs szignifikáns különbség a két átlag között, hanem hogy a kétmintás t-próba nem tudott szignifikáns különbséget kimutatni (ami ettől még lehet, hogy van).
  • A próbastatisztika képletét szokták a következő formában is megadni.
Ez a fenti képlettel ekvivalens.

Jegyzetek

  1. Az eredeti adatok szétszórtságát csökkentettük azáltal, hogy átlagot számítottunk belőle. Ezt fejezi ki a szabadsági fok. Jelen esetben az X és az Y változónál is szökkent eggyel a szabadsági fok, összesen tehát kettővel.
  2. A két csoportnak egyetlen tényezőt kivéve tökéletesen azonosnak kell lennie (fajta, táplálkozás, életkor, stb.) Az egyetlen különbség közöttük az állattartás módja (a fürdési lehetőség). Ezt a statisztikában kezelésnek nevezzük.

Források

  • Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
  • Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
  • Michaletzky Gy. – Mogyoródi J. (1995): Matematikai statisztika, Nemzeti Tankönyvkiadó, Budapest.
  • Michelberger P. – Szeidl L. – Várlaki P. (2001): Alkalmazott folyamatstatisztika és idősor-analízis. Typotex Kiadó, Budapest.
  • Vargha A. (2000): Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, Budapest.

Kapcsolódó szócikk

Read other articles:

Запрос «Роулинг» перенаправляется сюда; о новозеландском премьер-министре см. Роулинг, Билл. Джоан Роулингангл. Joanne Rowling Джоан Роулинг на катании яиц на лужайке перед Белым домом в 2010 году Имя при рождении англ. Joanne Rowling[4] Псевдонимы Дж. К. Роулинг,Кеннилуорти У...

 

У Вікіпедії є статті про інших людей із прізвищем Тарасов. Альберт ТарасовАльберт Валерійович Тарасов  Солдат Загальна інформаціяНародження 11 липня 1999(1999-07-11)м. Ланівці, Тернопільська область, УкраїнаСмерть 26 лютого 2022(2022-02-26) (22 роки)Херсонська область, УкраїнаПохованн

 

Х. Р. Міллар. Ілюстрація до уладського циклу скел. 1905. Руйнування Дому Да Хока - (ірл. - Togail Bruidne Da Choca) - давня ірландська скела (сага). Збереглась у двох рукописах з Триніті коледжу в Дубліні (копії відповідно XVI та XVII століть). Скела без сумніву була складена у стародавні часи і б

Este artigo carece de caixa informativa ou a usada não é a mais adequada. Esta é uma lista de IDH dos bairros da Zona Norte do município do Rio de Janeiro.[1] Critérios O índice varia de zero até 1, sendo considerado: baixo, entre 0 e 0,499 médio, de 0,500 a 0,799 elevado, quando maior ou igual a 0,800 Classificação Nº Bairro ou grupo de bairros Esperançade vidaao nascer(em anos) Taxa de alfabe-tização de adultos (%) Taxa bruta defrequência escolar (%) Renda per capita (em R$ d...

 

ShockSingle by Beastfrom the album Shock of the New Era ReleasedFebruary 28, 2010 (2010-02-28)Recorded2010GenreDance-pop, electropop, hip hopLength3:47LabelCube EntertainmentSongwriter(s)Ho Yang-lee, Sang Ho-lee & Yong Jun-hyngBeast Korean singles chronology Mystery (2009) Shock (2010) Take Care of My Girlfriend (Say No) (2010) Music videoShock (Korean) on YouTube Shock (Japanese Version)Limited Edition A CoverSingle by Beastfrom the album So Beast ReleasedMarch 16...

 

PnPSat-1PnPSat computer modelMission typeTechnologyOperatorAFRL Spacecraft propertiesManufacturerSpaceWorks Inc   PnPSat-1 initiated in 2004 (also known as Plug-and-Play Satellite[1]) is an experimental satellite built by the United States Air Force Research Laboratory. The spacecraft was the first choice for the third flight of the Falcon 1 rocket in August 2008, but was not selected because it was not completed at that time.[2] Mission description The primary mission is...

Pandemi COVID-19 di MainePeta penyebaran di Maine menurut persen orang yang terinfeksi (pada 11 Oktober)   10.00%+ terkonfirmasi terinfeksi   3.00%-10.00% terkonfirmasi terinfeksi   1.00%-3.00% terkonfirmasi terinfeksi   0.30%-1.00% terkonfirmasi terinfeksi   0.10%-0.30% terkonfirmasi terinfeksi   0.03%-0.10% terkonfirmasi terinfeksi   0.00%-0.03% terkonfirmasi terinfeksiPenyakitCOVID-19Galur virusSARS-CoV-2LokasiMaineKasus...

 

Hospital Regional de Malabo LocalizaciónPaís  Guinea EcuatorialLocalidad Malabo Guinea EcuatorialDatos generalesFinanciamiento públicoTipo general[editar datos en Wikidata] El Hospital Regional de Malabo[1]​ o simplemente el «Hospital de Malabo» es un centro de salud localizado en la ciudad de Malabo, capital del país africano de Guinea Ecuatorial, en el norte de la isla de Bioko. En 2013 el hospital se destacó por ser el primer lugar en el país donde se real...

 

390-та навчально-польова дивізія (Третій Рейх)390. Feldausbildungs-Division Німецький артилерійський тягач Sd.Kfz 11 проводить інженерні роботи з побудови лінії оборони. Зима 1944На службі 4 вересня 1942 — 19 липня 1944Країна  Третій РейхНалежність  ВермахтВид  Сухопутні військаТип пі...

Minicomputer by Digital Equipment Corporation VAX 6220 The VAX 6000 is a discontinued family of minicomputers developed and manufactured by Digital Equipment Corporation (DEC) using processors implementing the VAX instruction set architecture (ISA). Originally, the VAX 6000 was intended to be a mid-range VAX product line complementing the VAX 8000, but with the introduction of the VAX 6000 Model 400 series, the older VAX 8000 was discontinued in favor of the VAX 6000, which offered slightly h...

 

Historic house in New Hampshire, United States United States historic placeGov. Meshech Weare HouseU.S. National Register of Historic Places Show map of New HampshireShow map of the United StatesLocationExeter Rd. (NH 88), Hampton Falls, New HampshireCoordinates42°55′02″N 70°52′01″W / 42.91721°N 70.86692°W / 42.91721; -70.86692Area3 acres (1.2 ha)Built1776 (1776)NRHP reference No.73000174[1]Added to NRHPJune 29, 1973 The Gov. Mes...

 

Indian Kannada-language soap opera This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Sevanthi TV series – news · newspapers · books · scholar · JSTOR (August 2019) (Learn how and when to remove this template message) SevanthiGenre Soap opera Romance Created byManjunath MangalapuraScreenplay byR G ShekarSt...

 История ПольшиДоисторический периодСредние века Гнезненское государство Королевство Польское Польские княжества 1320—1386 Новое время Речь Посполитая Саксонский период 1764—1795 Великое Герцогство Варшавское Царство Польское Вольный город Краков Вольный город Гданьс...

 

Formula One 2002 beralih ke halaman ini. Untuk permainan video games, lihat Formula One 2002 (permainan video) dan F1 2002 (permainan video. Kejuaraan DuniaFormula Satu FIA 2002 Juara Dunia Pembalap: Michael Schumacher Juara Dunia Konstruktor: Ferrari Sebelum: 2001 Sesudah: 2003 Balapan menurut negaraBalapan menurut musimSeri pendukung: Formula 3000Porsche Supercup Michael Schumacher berhasil memenangkan gelar juara dunia untuk yang ketiga kalinya secara berturut-turut bersama dengan tim Ferr...

 

This article is missing information about nineteenth-century and post-Crimean crisis maps. Please expand the article to include this information. Further details may exist on the talk page. (August 2014) Map of the Odessa Military District (1866) The cartography of Ukraine involves the history of surveying and the construction of maps of Ukraine. Early maps Maps of Ukraine have been produced since the late mediaeval period. During the Turkish wars between 1568 and 1918, high-quality French ma...

Outlet store in Wuqi, Taichung, Taiwan Mitsui Outlet Park Taichung PortMitsui Outlet Park 台中港LocationWuqi, Taichung, TaiwanCoordinates24°15′27.9″N 120°31′06.7″E / 24.257750°N 120.518528°E / 24.257750; 120.518528Opening date12 December 2018DeveloperSan Zhong Gang Outlet Co., Ltd.ManagementMitsui & Co. Taiwan Ltd.OwnerMitsui & Co. Taiwan Ltd.Architectoutlet storeNo. of stores and services170Total retail floor area6 hectaresNo. of floors2Public t...

 

Protein-coding gene in the species Homo sapiens UBE2MAvailable structuresPDBOrtholog search: PDBe RCSB List of PDB id codes1TT5, 1Y8X, 2NVU, 3TDU, 3TDZ, 4GAO, 4P5OIdentifiersAliasesUBE2M, UBC-RS2, UBC12, hUbc12, ubiquitin conjugating enzyme E2 MExternal IDsOMIM: 603173 MGI: 108278 HomoloGene: 2952 GeneCards: UBE2M Gene location (Human)Chr.Chromosome 19 (human)[1]Band19q13.43Start58,555,712 bp[1]End58,558,954 bp[1]Gene location (Mouse)Chr.Chromosome 7 (mouse)[2]...

 

British palaeontologist Michael BentonOBE FRS FRSEMichael Benton at the Royal Society admissions day in London in 2014BornMichael James Benton (1956-04-08) 8 April 1956 (age 67)[2]ScotlandNationalityBritishEducationRobert Gordon's CollegeAlma mater University of Aberdeen (BSc)[2] Newcastle University (PhD) Known forBentonyxAwardsLyell Medal (2005)Scientific careerFields Palaeobiology Palaeontology Macroevolution[1] InstitutionsUniversity of Brist...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: The Supremes Produced and Arranged by Jimmy Webb – news · newspapers · books · scholar · JSTOR (January 2023) (Learn how and when to remove this template message) 1972 studio album by The SupremesThe Supremes Produced and Arranged by Jimmy WebbStudio album&...

 

Ця стаття не містить посилань на джерела. Ви можете допомогти поліпшити цю статтю, додавши посилання на надійні (авторитетні) джерела. Матеріал без джерел може бути піддано сумніву та вилучено. (грудень 2023) Сморгонський район Смаргонскі раён Герб[d] Прапор[d] Район ...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!