Contrast d'hipòtesi

Un contrast d'hipòtesi,^[1] test d'hipòtesi o prova de significació és una metodologia d'inferència estadística per jutjar si una propietat que se suposa certa per a una població estadística és compatible amb l'observat en una mostra d'aquesta població. Va ser iniciada per Ronald Fisher i fonamentada posteriorment per Jerzy Neyman i Karl Pearson. Mitjançant aquesta teoria, s'aborda el problema estadístic considerant una hipòtesi determinada $H_{0}\,$ i una hipòtesi alternativa $H_{1}\,$ , i s'intenta dirimir quina de les dues és la hipòtesi veritable, després d'aplicar el problema estadístic a un cert nombre de experiments. Està fortament associada als errors de tipus I i de tipus II en estadística, que defineixen respectivament, la possibilitat de prendre un succés vertader com fals, o un fals com a veritable. Hi ha diversos mètodes per a desenvolupar aquest test, minimitzant els errors de tipus I i II, i trobant per tant amb una determinada potència, la hipòtesi amb més probabilitat de ser correcta. Els tipus més importants són els tests centrats, d'hipòtesis i alternativa simple, aleatoritzats... Dins dels tests no paramètrics, el més estès és probablement el test U de Mann-Whitney.

Per exemple, si se sospita que una moneda ha estat trucada perquè es produeixin més cares que creus al llançar a l'aire, es poden realitzar 30 llançaments, prenent nota del nombre de cares obtingudes. Si s'obté un valor massa alt, per exemple 25 o més, hom podria considerar que el resultat és poc compatible amb la hipòtesi que la moneda no està trucada, i conclouria que les observacions contradiuen aquesta hipòtesi. L'aplicació de càlculs probabilístics permet determinar a partir de quin valor s'ha de rebutjar la hipòtesi garantint que la probabilitat de cometre un error és un valor conegut a priori. Les hipòtesis es poden classificar en dos grups, segons:

Introduïu un valor concret o un interval per als paràmetres del model.
Determinen el tipus de distribució de probabilitat que ha generat les dades.

Un exemple del primer grup és la hipòtesi que la mitjana d'una variable és 10, i del segon que la distribució de probabilitat és la distribució normal.

Encara que la metodologia per a realitzar el contrast d'hipòtesi és anàloga en ambdós casos, distingir dos tipus d'hipòtesi és important, ja que molts problemes de contrast d'hipòtesi respecte a un paràmetre són, en realitat, problemes d'estimació, que tenen una resposta complementària donant un interval de confiança (o conjunt d'intervals de confiança) per a aquest paràmetre. No obstant això, les hipòtesis respecte a la forma de la distribució se solen utilitzar per validar un model estadístic per a un fenomen aleatori que s'està estudiant.

[1]