Contrast d'hipòtesi
procediment d'inferència estadística / From Wikipedia, the free encyclopedia
Un contrast d'hipòtesi,[1] test d'hipòtesi o prova de significació és una metodologia d'inferència estadística per jutjar si una propietat que se suposa certa per a una població estadística és compatible amb l'observat en una mostra d'aquesta població. Va ser iniciada per Ronald Fisher i fonamentada posteriorment per Jerzy Neyman i Karl Pearson. Mitjançant aquesta teoria, s'aborda el problema estadístic considerant una hipòtesi determinada i una hipòtesi alternativa , i s'intenta dirimir quina de les dues és la hipòtesi veritable, després d'aplicar el problema estadístic a un cert nombre de experiments. Està fortament associada als errors de tipus I i de tipus II en estadística, que defineixen respectivament, la possibilitat de prendre un succés vertader com fals, o un fals com a veritable. Hi ha diversos mètodes per a desenvolupar aquest test, minimitzant els errors de tipus I i II, i trobant per tant amb una determinada potència, la hipòtesi amb més probabilitat de ser correcta. Els tipus més importants són els tests centrats, d'hipòtesis i alternativa simple, aleatoritzats... Dins dels tests no paramètrics, el més estès és probablement el test U de Mann-Whitney.
Per exemple, si se sospita que una moneda ha estat trucada perquè es produeixin més cares que creus al llançar a l'aire, es poden realitzar 30 llançaments, prenent nota del nombre de cares obtingudes. Si s'obté un valor massa alt, per exemple 25 o més, hom podria considerar que el resultat és poc compatible amb la hipòtesi que la moneda no està trucada, i conclouria que les observacions contradiuen aquesta hipòtesi. L'aplicació de càlculs probabilístics permet determinar a partir de quin valor s'ha de rebutjar la hipòtesi garantint que la probabilitat de cometre un error és un valor conegut a priori. Les hipòtesis es poden classificar en dos grups, segons:
- Introduïu un valor concret o un interval per als paràmetres del model.
- Determinen el tipus de distribució de probabilitat que ha generat les dades.
Un exemple del primer grup és la hipòtesi que la mitjana d'una variable és 10, i del segon que la distribució de probabilitat és la distribució normal.
Encara que la metodologia per a realitzar el contrast d'hipòtesi és anàloga en ambdós casos, distingir dos tipus d'hipòtesi és important, ja que molts problemes de contrast d'hipòtesi respecte a un paràmetre són, en realitat, problemes d'estimació, que tenen una resposta complementària donant un interval de confiança (o conjunt d'intervals de confiança) per a aquest paràmetre. No obstant això, les hipòtesis respecte a la forma de la distribució se solen utilitzar per validar un model estadístic per a un fenomen aleatori que s'està estudiant.