jueves, 9 de mayo de 2013

Estadistica descriptiva e inferencial en Excel


¿Cómo agregar a Excel la opción de análisis de datos?

Si tienes Windows Vista o 7:

1.- seleccionar mas comandos
2.- complementos
3.- herramientas para análisis
4.-ir
5.- elegir herramientas para análisis
6.-aceptar

Si se tiene XP:

1.- herramientas
2.- complementos
3.-analisis
4.-aceptar (se encontrara el botón en la pestaña de datos)
Los botones a utilizar son:




















Subido por: Navarro Luna Pedro

Formulario de estadística inferencial


Estas fórmulas las vimos en clase para la resolución de problemas estadísticos de hipótesis simplehipótesis independiente, hipótesis pareada e hipótesis anova. Subo este formulario con la finalidad de ayudar a quien corresponda a entender y usar mejor las fórmulas que a continuación se presentan.
Las pruebas de hipótesis consisten en procedimientos o pasos que nos permiten probar las mismas sobre una o varias muestras y/o poblaciones con relación a alguna característica o interés.

Son 4 pasos principales para pruebas de hipótesis:
1.-Consiste en la formulación de las hipótesis  Ho: ¿ ? - Ha: ¿ ?
2.-Después procede al cálculo del estadístico de prueba
3.-Luego se tiene que establecer algún nivel de significancia y áreas de rechazo de la hipótesis

  
Nota: si la hipótesis refiere hacer diferencia o igualdad la hipótesis es bilateral, pero si la hipótesis refiere datos de mayor que (>) o menor que (<) la hipótesis es unilateral, si la hipótesis resulto ser bilateral es necesario dividir el α/2 


Formula de hipótesis PAREADA:
El pareo es la comparación de un mismo grupo antes y después. Este tipo de hipótesis solo trabaja con muestras por lo tanto solo se usa “t”:


Fórmulas para hipótesis de ANOVA:
Este tipo de hipótesis se utiliza cuando se tienen 3 o más grupos y consta de 3 formulas y son:




miércoles, 8 de mayo de 2013

Formulación de Hipótesis



Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nulay se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
La situación se puede esquematizar:


(*) Decisión correcta que se busca
a = p(rechazar H0|H0 cierta)
b = p(aceptar H0|H0 falsa)
Potencia =1-b = p(rechazar H0|H0 falsa)
Detalles a tener en cuenta
1 a y b están inversamente relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.
Los pasos necesarios para realizar un contraste relativo a un parámetroq son:
1. Establecer la hipótesis nula en términos de igualdad


2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador


en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.
3. Elegir un nivel de significación: nivel crítico para a
4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H0.
Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H0, por eso es necesario que tenga la igualdad.
5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H0, si H0 fuera cierta) y compararlo con a.
Ejemplo:
Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es:


2. la hipótesis alternativa
es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).

4. El estadístico para el contraste es
y la región crítica T>ta
Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a
y si hubiera sido bilateral T<t1- a/2 o T>t a/2
En este ejemplo t(35)0,05=1,69.

5. Calculamos el valor de t en la muestra 

no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H1 es que m es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0,05 no la rechazamos.
Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es?
Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.
Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis?
Volvamos al problema del estrés. Como no se rechaza H0, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan.
Para calcularla se debe concretar H1, p.e. m = 20 (el criterio para este valor no es estadístico)

Cibergrafía
Hospital Universitario Ramón y Cajal. Madrid, España. Consutado el 8 de mayo del 2003 a las 7:50 p.m. [http://www.hrc.es/bioest/tamano.html]

Subido por:: Rodrigo Solis Rueda




















Ejercicios de T y Z (Simples e independientes)


Los siguientes ejercicios fueron vistos en la clase del 7 de mayo del 2013 


EJERCICIODE t SIMPLE

Se desea saber si las mujeres con menopausia tienen disminuida su secreción lagrimal. En un muestreo se obtuvo que de 25 mujeres  con menopausia  todas tuvieron 3mm de shirmer  con una desviación estándar de 1.5, siendo  que las mujeres adultas  antes de la menopausia tienen 5mm de secreción ¿se puede inferir que las mujeres con menopausia  tienen disminuida la secreción lagrimal?       α= 0.05
PASOS:
1.- FORMULACION DE HIPOTESIS
2.- CALCULO ESTADISTICO DE LA PRUEBA
3.- ESTABLECER NIVELES DE SIGNIFICANCIA Y AREAS DE RECHAZO DE LA HIPOTESIS
4.- CONCLUSION



























3.-  se dibuja la campana de gauss en donde pondremos una línea vertical de cada lado de la campana en donde se dividen la panza de la cola, este será nuestro valor critico en donde colocaremos el valor obtenido en los grados de libertad y α en este caso 1.711 y nuestro valor de t también lo representamos en la gráfica.
4.- la hipótesis se lee tal cual quedo en la campana, ya sea en el área de Ha o Ho
En este caso quedaría: como t cae en el área de aceptación de Ha  podemos inferir que las mujeres con menopausia tienen disminuida la secreción lagrimal y lo podemos afirmar con u 95% de confiabilidad.

EJERCICIO DE z SIMPLE

PASOS:
1.- FORMULACION DE HIPOTESIS
2.- CALCULO ESTADISTICO DE LA PRUEBA
3.- ESTABLECER NIVELES DE SIGNIFICANCIA Y AREAS DE RECHAZO DE LA HIPOTESIS
4.- CONCLUSION

Se supondrá que la PIO en jóvenes normales es de 16mmHg, con una desviación estándar de 1.3mmHg. La PIO media en 15 jóvenes con síndrome de Down es 14mmHg. ¿Tomando estos datos podemos inferir que la PIO en pacientes con síndrome de Down esta disminuida?          α= 0.05










































3.-  se dibuja la campana de gauss en donde pondremos una línea vertical de cada lado de la campana en donde se dividen la panza de la cola, este será nuestro valor critico en donde colocaremos el valor obtenido de restarle a 0.5 el valor de α en este caso es .4500 y nuestro valor de z también lo representamos en la gráfica.

4.- la hipótesis se lee tal cual quedo en la campana, ya sea en el área de Ha o Ho
En este caso quedaría: como z cae en el área de aceptación de Ha  podemos inferir que los pacientes con síndrome de down tienen una PIO menor a los pacientes normales  y lo podemos afirmar con un 95% de confiabilidad


EJERCICIO DE t INDEPENDIENTE
PASOS:
1.- FORMULACION DE HIPOTESIS
2.- CALCULO ESTADISTICO DE LA PRUEBA
3.- ESTABLECER NIVELES DE SIGNIFICANCIA Y AREAS DE RECHAZO DE LA HIPOTESIS
4.- CONCLUSION

El siguiente tabulador muestra la disminución de Pterigion en promedio que corresponde a 16 pacientes a los que se les administro pterigion (gotas) , así como 13 pacientes control que se les aplico diclofenaco

                           n          s               disminución promedio
Pterigion          16        2                            2
Diclofenaco      13        2.1                        2.5
¿hay evidencia suficiente para inferir que la disminución promedio de pterigion es distinta en ambos grupos?         α= 0.01






































El valor críticose obtiene: restándole α a 0.5 que es el valor de la mitad de la campana de gauss, ese resultado lo buscamos en la tabla de Z y obtendremos las coordenadas, en este caso es1.96
 
3.-  se dibuja la campana de gauss en donde pondremos una línea vertical de cada lado de la campana en donde se dividen la panza de la cola, este será nuestro valor critico en donde colocaremos el valor obtenido de las coordenadas de α dividida entre 2  y la formula de gl en este
caso es 2.711 y nuestro valor de t también lo representamos en la gráfica.

4.- la hipótesis se lee tal cual quedo en la campana, ya sea en el área de Ha o Ho





En este caso quedaría: como t cae en el área de aceptación de Ho  podemos inferir que la disminución promedio entre las gotas de pterigion y diclofenaco es igual y lo podemos afirmar con un 99% de confiabilidad




EJERCICIO DE  z INDEPENDIENTE
PASOS:
1.- FORMULACION DE HIPOTESIS
2.- CALCULO ESTADISTICO DE LA PRUEBA
3.- ESTABLECER NIVELES DE SIGNIFICANCIA Y AREAS DE RECHAZO DE LA HIPOTESIS
4.- CONCLUSION

Se determinaron las PIO  en  5 diabéticos y 7 hipertensos, que son las únicas personas   que viven en una isla desierta, teniendo ambas poblaciones  una desviación estándar de 1.9 ¿es posible inferir que  la PIO es diferente en ambos grupos?        α= 0.025










3.-  se dibuja la campana de gauss en donde pondremos una línea vertical de cada lado de la campana en donde se dividen la panza de la cola, este será nuestro valor critico en donde colocaremos el valor obtenido de las coordenadas de restar a 0.5 el valor de α dividida entre 2, en este caso es 0.4875 que lo buscamos en la tabla de Z y las coordenadas son: 2.24  y nuestro valor de z también lo representamos en la gráfica


4.- la hipótesis se lee tal cual quedo en la campana, ya sea en el área de Ha o Ho
En este caso quedaría: como z cae en el área de aceptación de Ho  podemos inferir que la PIO de los dos grupos es igual  y lo podemos afirmar con  97.5% de confiabilidad




Subido por: Zitlali Heredia González

Prueba de hipótesis


Si queremos decidir entre dos hipótesis que afectan a un cierto parámetro de la población, a partir de la información de la muestra usaremos el contraste de hipótesis, cuando optemos por una de estas dos hipótesis, hemos de conocer una medida del error cometido, es decir, cuantas veces de cada cien nos equivocamos.
En primer lugar, veremos cómo se escribirían las hipótesis que queremos contrastar:
H0 se llama hipótesis nula y es lo contrario de lo que sospechamos que va a ocurrir (suele llevar los signos igual, mayor o igual y menor o igual)
H1 se llama hipótesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar los signos distinto, mayor y menor)
Los contrastes de hipótesis pueden ser de dos tipos:
Bilateral: En la hipótesis alternativa aparece el signo distinto.
Unilateral: En la hipótesis alternativa aparece o el signo > o el signo <.
Podemos aceptar una hipótesis cuando en realidad no es cierta, entonces cometeremos unos errores, que podrán ser de dos tipos:
Error de tipo I: Consiste en aceptar la hipótesis alternativa cuando la cierta es la nula.
Error de tipo II: Consiste en aceptar la hipótesis nula cuando la cierta es la alternativa.
Estos errores los aceptaremos si no son muy grandes o si no nos importa que sean muy grandes.
alfa: Es la probabilidad de cometer un error de tipo I.
beta: Es la probabilidad de cometer un error de tipo II.
De los dos, el más importante es alfa que llamaremos nivel de significación y nos informa de la probabilidad que tenemos de estar equivocados si aceptamos la hipótesis alternativa.
Debido a que los dos errores anteriores a la vez son imposibles de controlar, vamos a fijarnos solamente en el nivel de significación, este es el que nos interesa ya que la hipótesis alternativa que estamos interesados en probar y no queremos
aceptarla si en realidad no es cierta, es decir, si aceptamos la hipótesis alternativa queremos equivocarnos con un margen de error muy pequeño.
El nivel de significación lo marcamos nosotros. Si es grande es más fácil aceptar la hipótesis alternativa cuando en realidad es falsa. El valor del nivel de significación suele ser un 5%, lo que significa que 5 de cada 100 veces aceptamos la hipótesis alternativa cuando la cierta es la nula.
Solamente vamos a estudiar el contraste bilateral para la media.

Bibliografía: http://recursostic.educacion.es/descartes/web/materiales_didacticos/Muestreo_Inferencia_Estadistica.html
Adaptación de María Vicenta Cabalgante Perera de la unidad:
http://recursostic.educacion.es/descartes/web/materiales_didacticos/inferencia_estadistica/index_inferencia.htm


De: María José García Cebrian

Subido  por: Mendoza Cruz Roberto Alan G.




Análisis de la varianza ANOVA



 La prueba ANOVA es una prueba paramétrica y como tal requiere una serie de supuestos para poder ser aplicada correctamente. Denominada ANOVA o análisis de la varianza, en realidad nos va a servir no solo para estudiar las dispersiones o varianzas de los grupos, sino para estudiar sus medias y la posibilidad de crear subconjuntos de grupos con medias iguales. Se puede decir que la prueba ANOVA es la generalización de la t de Student, ya que si realizamos una prueba ANOVA en la comparación de solo dos grupos, obtenemos los mismos resultados.
Al igual que la t de Student, se requiere que cada uno de los grupos a comparar tenga distribuciones normales, o lo que es más exacto, que lo sean sus residuales. Los residuales son las diferencias entre cada valor y la media de su grupo. Además debemos estudiar la dispersión o varianzas de los grupos, es decir estudiar su homogeneidad. Cuando mayor sean los tamaños de los grupos, menos importante es asegurar estos dos supuestos, ya que el ANOVA suele ser una técnica bastante “robusta” comportándose bien respecto a transgresiones de la normalidad. No obstante, si tenemos grupos de tamaño inferior a 30, es importante estudiar la normalidad de los residuos para ver la conveniencia o no de utilizar el análisis de la varianza. Si no fuera posible utilizar directamente el ANOVA, podemos recurrir al uso de pruebas no paramétricas, como la de Kruskal-Wallis.
Como ya hemos dicho, el ANOVA es la generalización de la t de Student, y sus hipótesis nula y alternativa se pueden formular del siguiente modo:
· Hipótesis nula (Ho): µ1= µ2=…= µk
Las medias de los k grupos son iguales y por tanto las diferencias encontradas pueden explicarse por el azar. Dicho de otro modo, los grupos proceden de poblaciones con medias iguales.
· Hipótesis alternativa (H1): al menos uno de los grupos tiene una media distinta del resto de grupos.
En la prueba ANOVA las comparaciones son siempre bilaterales (a dos colas) ya que estudiamos globalmente si los grupos tienen medias distintas, y no si un grupo tiene una media menor o mayor que otro por separado. Si se rechaza la hipótesis nula, no sabremos entre qué grupos están las diferencias.
La variabilidad o varianza total que podemos tener en nuestros datos se puede descomponer a su vez en:
-Varianza entre grupos. Mide la variabilidad entre las medias de cada grupo respecto a la media total de todas las observaciones. Denominada también como variabilidad o varianza inter-grupos.
-Varianza dentro de los grupos. Mide la variabilidad de cada observación respecto a la media de su grupo. Podemos encontrarla bajo el nombre de residual, error o varianza intra-grupos.
Del mismo modo que se hace en la t de Student y con otras pruebas estadísticas, se divide un efecto observado respecto a un error aleatorio. En nuestro caso se divide el efecto debido a la pertenencia de los grupos (varianza entre grupos) respecto a la dispersión debida al azar o error aleatorio (varianza dentro de los grupos). A este cociente se le denomina F, o F de Fisher-Snedecor. Si sobrepasa cierto valor crítico, entonces podremos afirmar que el efecto observado es demasiado grande para poder ser explicado por el azar (error aleatorio) y que por tanto no todos los grupos estudiados tienen la misma media.

Bibliografía
Prueba ANOVA: comparación de las medias de tres o más grupos, JOSÉ MARÍABELLÓN
Consulta do el 5 de abril del 2013 http://epidemiologiamolecular.com/prueba-anova-comparacion-medias-grupos/]

Subido por: Alan Acevedo