Este blog se centrará en la asignatura "Estadística y Tecnología de la Información y Comunicación".
Lo usaré para poner entradas acerca del temario que demos en las clases o acerca de otros temas que sean de interés y tengan relación con la estadística.

martes, 4 de junio de 2013

Medidas de tendencia central, de posición y de dispersión.

En esta nueva entrada comentaré los aspectos que para mí son más importantes de la primera parte del tema 8 de la asignatura, haciendo un pequeño resumen de éste.
 
MEDIDAS DE TENDENCIA CENTRAL: Son los valores típicos o representativos de un conjunto de datos. Me centraré en 3 de ellas:
  • Media (media aritmética): Es el centro de gravedad de nuestros datos y se calcula para variables cuantitativas. Considera todos los valores de la variable.
  • Mediana (Me): Es el punto para el que la distancia media a los valores de la muestra es mínima. Se calcula para variables cuantitativas. Sólo tiene en cuenta la posición de los valores en la muestra. Si hay más de una mediada, se toma el punto medio entre la mediana mayor y la más pequeña.
  • Moda (Mo): Es el valor con mayor frecuencia, es decir, el que se repite más veces. Si hay más de una se dice que la variable es multimodal. Se calcula para cualquier tipo de variable.
 
MEDIDAS DE POSICIÓN: Se calculan para variables cuantitativas y sólo tienen en cuenta la posición de los valores en la muestra. Son los llamados "cuantiles" y pueden ser:
  • Cuartiles: Ordenan la muestra en 4 partes:
    • Q1 (primer cuartil): al menos el 25% de los datos son menores o iguales que él.
    • Q2 (segundo cuartil): al menos 50% de los datos menos o iguales que él (corresponde a la mediana).
    • Q3 (tercer cuartil): al menos el 75% de los datos son menores o iguales que él.
    • Q4 (cuarto cuartil): es el mayor valor que se alcanza en la muestra.
  • Deciles: Dividen la muestra ordenada en 10 partes.
  • Percentiles: Ordenan la muestra en 100 partes. En este caso, Q1 = P25 y Q3 = P75.
 
MEDIDAS DE DISPERSIÓN: Se usan para variables cuantitativas y se definen para variables no agrupadas. Hablaré de 3 de ellas:
  • Rango o recorrido (R): Es la diferencia entre el mayor y el menor valor de la muestra.
  • Desviación típica (S): Cuantifica el error que cometemos si representamos una muestra únicamente por su media.
  • Varianza muestral: Desviación típica al cuadrado.
 
 
Y esto es todo. Próximamente me centraré en la segunda parte de este tema 8.


 
(A partir de ahora publicaré las entradas más seguidas, ya que el plazo que tenemos para hacer el blog es hasta el 14 de Junio).

No hay comentarios:

Publicar un comentario