Una hipótesis estadística es una asunción relativa a una o
varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se
pueden contrastar con la información extraída de las muestras y tanto si se
aceptan como si se rechazan se puede cometer un error.
La hipótesis formulada con intención de
rechazarla se llama hipótesis nulay se representa por H0.
Rechazar H0 implica aceptar una hipótesis alternativa (H1).
La
situación se puede esquematizar:
(*) Decisión correcta que se busca
a = p(rechazar H0|H0 cierta)
b = p(aceptar H0|H0 falsa)
Potencia =1-b = p(rechazar H0|H0 falsa)
Detalles a tener en cuenta
1 a y b están inversamente
relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.
Los pasos necesarios para realizar un contraste relativo a un
parámetroq son:
1. Establecer
la hipótesis nula en términos de igualdad
2. Establecer
la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del
interés del investigador
en el primer caso se habla de contraste bilateral o
de dos colas, y en los otros dos de lateral (derecho en
el 2º caso, o izquierdo en el 3º) o una cola.
3. Elegir
un nivel de significación: nivel crítico para a
4. Elegir
un estadístico de contraste: estadístico cuya distribución muestral
se conozca en H0 y que esté relacionado con q y
establecer, en base a dicha distribución, la región crítica: región
en la que el estadístico tiene una probabilidad menor que a si H0 fuera
cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría
H0.
Obsérvese
que, de esta manera, se está más seguro cuando se rechaza una hipótesis que
cuando no. Por eso se fija como H0 lo que se quiere rechazar.
Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido
rechazar. Por otro lado, la decisión se toma en base a la distribución muestral
en H0, por eso es necesario que tenga la igualdad.
5. Calcular
el estadístico para una muestra aleatoria y compararlo con la región crítica, o
equivalentemente, calcular el "valor p" del estadístico (probabilidad
de obtener ese valor, u otro más alejado de la H0, si H0 fuera
cierta) y compararlo con a.
Ejemplo:
Estamos
estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es
que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm
de Hg. Estudiamos una muestra de 36 sujetos y encontramos
1. Se
trata de un contraste sobre medias. La hipótesis nula (lo que queremos
rechazar) es:
2. la
hipótesis alternativa
es un contraste lateral derecho.
3. Fijamos
"a priori" el nivel de significación en 0,05 (el habitual en
Biología).
4. El
estadístico para el contraste es
y la región crítica T>ta
Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a
y si hubiera sido bilateral T<t1- a/2 o
T>t a/2
En este ejemplo t(35)0,05=1,69.
5. Calculamos
el valor de t en la muestra
no está en la región crítica (no es mayor que
1,69), por tanto no rechazamos H0.
Otra manera
equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es
buscar en las tablas el "valor p" que corresponde a T=0,833, que para
35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta,
la probabilidad de encontrar un valor de T como el que hemos encontrado o
mayor (¿por qué mayor? Porque la H1 es
que m es mayor , lo que produciría una media muestral mayor y por
tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de
equivocarnos si rechazamos H0 es 0,20, como la frontera se
establece en 0,05 no la rechazamos.
Este valor crítico de
0,05 es arbitrario pero es la convención habitual. ¿Cuán
razonable es?
Problema al
respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la
probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey
de bastos es 1/40 x 1/39=0,000833.
Si hacemos la
experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el
mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de
hipótesis?
Volvamos al problema
del estrés. Como no se rechaza H0, se puede cometer un error tipo
II. ¿Cuál es b ?. De hecho, sería la información relevante a
comunicar en este estudio (la probabilidad del error que se pude cometer en
él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no
la calculan.
Para calcularla se debe concretar H1, p.e. m = 20 (el
criterio para este valor no es estadístico)
Cibergrafía
Subido por:: Rodrigo
Solis Rueda