Este blog se centrará en la asignatura "Estadística y Tecnología de la Información y Comunicación".
Lo usaré para poner entradas acerca del temario que demos en las clases o acerca de otros temas que sean de interés y tengan relación con la estadística.

jueves, 13 de junio de 2013

Despedida

Ya va terminando el curso, de modo que esta va a ser la última entrada de este blog basado en la estadística y sus aplicaciones.
 
Nunca había hecho un blog, así que esto era algo nuevo para mí. Al principio me costó arrancar (más que nada porque me echaba para atrás la idea de gastar el tiempo en algo así) pero, a medida que ha pasado el tiempo, me he acostumbrado y le he pillado el truco. También he llegado a la conclusión de que hacer un blog puede resultar muy útil, no sólo para quien lo lee, sino para quien lo hace, ya que a la vez que lo hacía he ido aprendiendo muchas cosas de la asignatura y del funcionamiento de esta página.
 
Quizás, un día de estos vuelva por aquí y haga otro blog sobre cualquier otra cosa que se me ocurra, ¿quién sabe?
 
Nada más, con esto me despido:
 
 
¡Hasta otra!
 

miércoles, 12 de junio de 2013

Seminario nº 4. Presentación del trabajo de investigación.

Poco he hablado en el blog acerca del trabajo de investigación que debemos realizar para poder aprobar la asignatura. Por ello, voy a utilizar esta entrada para explicar por encima de qué iba el trabajo de mi grupo y qué tal nos fue la presentación de éste en clase (la cual se realizó en el seminario nº 4 de la asignatura).
 
Después de varios días debatiendo el tema que íbamos a escoger, finalmente nos decidimos por hacer un estudio analítico en el que relacionamos el tener fobia a la sangre, inyecciones y heridas (SIH) con el sexo en niños y niñas de entre 10 y 14 años de un colegio de Sevilla (elegimos esta edad porque este tipo de fobia se empieza a dar sobre los 8 años aproximadamente).
 
A continuación podéis ver nuestro cronograma de trabajo:
 
 
Nos pusimos como objetivos analizar la relación entre el sexo, la edad y el curso escolar con las distintas fobias a la SIH y después de realizar los tests de hipótesis correspondientes y obtener unos resultados, llegamos a las siguientes conclusiones:
  • La edad NO tiene relación con tener o no fobia a la SIH.
  • El curso escolar en el que se encuentre la persona NO tiene relación con tener o no fobia a la SIH.
  • El sexo NO tiene relación con tener fobia a la sangre propia, a los desmayos y a lesionarse y el dolor propio.
  • El sexo SÍ tiene relación con tener fobia a los hospitales, a la sangre y el dolor ajeno y con tener fobia a las inyecciones.
 
 
En el último seminario presentamos nuestro trabajo, centrándonos sobre todo en los resultados obtenidos y la discusión de los datos. Tenemos muchas cosas que mejorar, así que para la próxima vez ya sabemos lo que tenemos que hacer, pero después de todo no nos fue demasiado mal.
 
 
Esperemos que las horas de trabajo tengan su recompensa.
 

lunes, 10 de junio de 2013

Seminario nº 3. Análisis de datos.

En esta entrada resumiré lo que estuvimos haciendo durante el seminario nº 3, el cual nos ha servido posteriormente para saber analizar los datos de nuestro trabajo de investigación y poder plasmarlos en los resultados, la discusión de los datos y la conclusión a la que hayamos llegado con la elaboración de éste.
 
 
 
  1. En primer lugar pinchamos en analizar datos y entramos en el apartado "Abrir" (read), a continuación le dimos a importar y seleccionamos nuestra vista, que en este caso recibía el nombre de "ViewOswego".
  2. En el apartado de "Medias", pinchamos en "Means of" e introdujimos la variable edad "AGE" para ver que nos salía.
  3. Construimos una serie de tablas de frecuencia en la que relacionamos las distintas variables (en este caso para saber con qué edad se había consumido cada alimento y saber cuál de estos alimentos provocó que la gente enfermara). En la tabla de contingencia en la que relacionamos la enfermedad con el sexo (% fila = porcentaje sobre mujeres u hombres y % columna = porcentaje sobre el nº total de enfermos) veíamos que si un recuadro destaca sobre otro, quiere decir que hay más casos en ese cuadro que destaca.
  4. Por último, observamos el test de hipótesis de Chi cuadrado para saber si rechazar o aceptar la hipótesis nula del estudio. Al realizar la relación entre el helado de vainilla y la enfermedad, comprobamos que la vainilla fue el alimento que provocó el cuadro diarreico ya que existía relación estadísticamente significativa (p<0,05) entre la vainilla y la enfermedad.
     
 


domingo, 9 de junio de 2013

Ejercicios estadística inferencial y test de hipótesis

En este caso, tuvimos que realizar otros 3 ejercicios para entregar en el campus de enseñanza virtual. Son los siguientes (en cursiva se encuentra lo que pide el problema):

1. Predeterminar el tamaño de la muestra necesaria para estudiar los niveles de glucosa plasmática de la población de una zona básica de salud. Aceptamos un riesgo de error del 1% y pretendemos una precisión de 5 mg. En una muestra reducida, la desviación típica es de 15.

2. A partir de ciertos estudios se tiene la idea de que, operando inmediatamente a enfermos que ingresan en estado de shock en un determinado servicio de un hospital, existe mayor posibilidad de que el enfermo reaccione favorablemente. Para comprobar esta hipótesis, se toman dos grupos de pacientes, a uno de los cuales se le opera inmediatamente y al otro se espera a que se recupere del estado de shock, obteniéndose los siguientes resultados:

 
Recuperación completa
Mejoría
Muerte
Operado inmediatamente
10
7
3
Operado después de recuperación
5
3
2

A la vista del experimento ¿qué se puede decir respecto a la hipótesis inicial? Identifica para ello la hipótesis, las variables en estudio, el test adecuado y su resultado y conclusión final.

3. Un investigador pretende saber si las condiciones socioeconómicas influyen sobre la talla infantil. Para ello, ha obtenido la talla de 20 niños de 5 años de edad, de dos condiciones socioeconómicas contrastantes (alta y baja), que se exponen en la siguiente tabla. Plantea la hipótesis pertinente, realiza la elección del test oportuno y toma la decisión que proceda respecto a la hipótesis planteada.
 

Nivel socioeconómico bajo
Nivel socioeconómico alto
(x1- x‾1)
(x1- x‾1)2
(x2- x‾2)
(x2- x‾2)2
101
103
0.1
0.01
-2
4
102
105
11,1
1,21
0
0
100
104
-0,9
0,81
-1
1
104
106
3,1
9,61
1
1
102
108
1,1
1,21
3
9
99
100
-1,9
3,61
-5
25
102
108
1,1
1,21
3
9
103
104
2,1
4,41
-1
1
97
105
-3,9
15,21
0
0
99
107
-1,9
3,61
2
4
x‾1=100,9
x‾1=105
 
Σ (x1- x‾1)2 = 40,9
 
Σ(x2 - x‾2)2 = 54

 

Tests de hipótesis.

En el tema 10 de la asignatura hemos dado los siguientes tests de hipótesis:
Test de hipótesis de Chi Cuadrado (x2): Indica cuánto se acercan o se alejan los valores observados de los valores obtenidos. Se usa para dos variables cualitativas dicotómicas. La fórmula que se usa para calcularla es la siguiente:


Según el grado de libertad y el nivel de confianza, la significación estadística varía. En una tabla de 2x2 el grado de libertad sería 1 y si tenemos un nivel de confianza del 95%, chi cuadrado debe ser mayor que 3,84 ( x2 > 3,84) para poder rechazar la hipótesis nula. Esto se puede saber mirando la tabla de valores de x2 que podemos ver a continuación:


Test de hipótesis t de Student (t): Se usa para una variable cualitativa y otra cuantitativa. Si tenemos 2 grupos, usaremos la media de cada uno de ellos. La fórmula para calcula la t de Student es la siguiente:
La tabla de distribución t de Student es la que vemos a continuación:
Para saber qué valor es el que tiene que superar la t para que la hipótesis nula sea rechazada, se debe contar los grados de libertad que correspondan y saber cuál es el nivel de confianza. Por ejemplo, si tenemos 10 grados de libertad y el nivel de confianza es del 95%, el valor mínimo que debe alcanzar la t es de 1, 812 (t > 1,812) para que exista relación estadísticamente significativa y poder rechazar la hipótesis nula y aceptar la hipótesis alternativa correspondiente.

Personalmente, este tema me ha parecido sencillo. Es uno de los que mejor he entendido.

sábado, 8 de junio de 2013

Ejercicios estadística inferencial.

Aquí os dejo tres ejercicios (con sus soluciones) que hicimos para mandar al campus virtual y posteriormente ser corregidos por el profesor:

1. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos de Centros de Bachillerato de nuestra localidad. Seleccionada una muestra aleatoria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho consumo medio con un nivel de confianza del 95%.

Solución: IC (95%) = (7.22, 8.87)

2. Se desea hacer una estimación sobre la edad media de una determinada población. Calcula el tamaño de la muestra necesario para poder realizar dicha estimación con un error menor de medio año a un nivel de confianza del 99,73%. Se conoce de estudios previos que la edad media de dicha población tiene una desviación típica igual a 3.

Solución: De 324 personas, al menos, debe estar compuesta la muestra.

3. Tomada al azar, una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos hablaban inglés. Halle, con un nivel de confianza del 95%, un intervalo de confianza para estimar la proporción de estudiantes que hablan el idioma inglés entre los estudiantes de esa Universidad.

Solución: IC (95%) = (0.36, 0.54)

 
 

Intervalo de confianza y tipos de muestreo.

Esta entrada es la continuación de la última entrada, que correspondía al tema 9. En esta ocasión voy a definir qué es el intervalo de confianza, el nivel de confianza y el muestreo, y mostraré un esquema de los tipos de muestreo que hay.
  • Intervalo de confianza: Es un medio para conocer el parámetro en una población midiendo el error aleatorio. Está formado por un par de nºs entre los que se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Se calcula considerando que el estimador muestral sigue una distribución normal, como se establece en la teoría central del límite.
  • Nivel de confianza: Es la probabilidad de éxito en la estimación. Se representa por 1 - alfa.
El nivel de confianza y la amplitud del intervalo varían conjuntamente. Cuanto más amplio sea un intervalo, más posibilidades de acierto (mayor nivel de confianza) habrá.
  • Muestreo: Método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características que estamos estudiando.
En el siguiente esquema podemos ver los tipos de muestreo: