Estadísticas descriptivas
Utilice este módulo para calcular un conjunto de estadísticas descriptivas para una o varias variables, cualitativas o cuantitativas, y producir representaciones gráficas o semigráficas utilizadas en análisis exploratorio de datos.
Lista de las estadísticas calculadas en el caso de datos cuantitativos (los descriptores que tienen en cuenta los eventuales pesos, son señalados en negrita):
Núm. de valores utilizados: número de valores efectivamente utilizados en los cálculos, es decir, los valores que no faltan y de peso diferente a 0,
- Núm. de valores ignorados: número de valores ignorados durante los cálculos, es decir, valores que faltan o de peso nulo,
- Núm. de valor Min. : número de valores iguales al valor mínimo,
- % de valor Min. : porcentaje del número de valores iguales al valor mínimo,
- Mínimo : valor mínimo,
- El primer cuartil: valor por debajo del cual se encuentran el 25 % de los datos,
- Mediana : valor por debajo del cual se encuentran el 50 % de los datos,
- El tercer cuartil: valor por debajo del cual se encuentran el 75 % de los datos,
- Máximo : valor máximo,
- Recorrido : diferencia entre el máximo y el mínimo,
- Suma de peso: en el caso de datos ponderados, indica la suma de los pesos de valores utilizados en los cálculos,
- Total : suma de los valores, eventualmente ponderado,
- Media : suma de los valores, eventualmente ponderado, dividido por el número de valores utilizados, o por la suma de los pesos si los datos son ponderados,
- Media geométrica: media apenas influida por los valores elevados. La media geométrica no está definida para los datos que contienen valores negativos o nulos,
- Media armónica: media apenas influida por algunos valores mucho más elevados que el conjunto de los otros valores, pero sensible a los valores mucho más pequeños. La media armónica no está definida para los datos que contiene valores nulos,
- Aplastamiento (Pearson): coeficiente que caracteriza la forma del pico o el aplastamiento de una distribución con respecto a una distribución gaussiana. Para una distribución gaussiana (ley normal), el aplastamiento vale 0. Un valor negativo corresponde a una distribución más aplanada que la ley normal (distribución platicúrtica) mientras que un valor positivo corresponde a una distribución más picuda que la ley normal (distribución leptocúrtica),
- Asimetría (Pearson): coeficiente que caracteriza el grado de asimetría de una distribución con respecto a su media. Para una distribución gaussiana (ley normal), la asimetría vale 0. Un valor negativo corresponde a la presencia de una cola de distribución hacia la izquierda mientras que un valor positivo corresponde a una cola de distribución hacia la derecha,
- Aplastamiento: coeficiente de aplastamiento tal como está calculado por Excel,
- Asimetría : coeficiente de asimetría tal como está calculado por Excel,
- CV (Desviación típica / media): coeficiente de variación que mide la dispersión relativa obtenida dividiendo la desviación típica por la media. Este coeficiente permite comparar la dispersión de variables cuyas unidades son diferentes, o que tienen medias muy diferentes,
- Varianza de una muestra: varianza de datos,
- Varianza estimada: estimación de la varianza de una población cuyos datos constituyen una muestra (estimador sin sesgo),
- Desviación típica de una muestra: raíz cuadrada de la varianza de datos,
- Desviación típica estimada: raíz cuadrada de la estimación de la varianza de la población de origen de datos,
- Desviación absoluta media: medida de dispersión que indica la media de valores absolutos de las desviaciones de cada valor con respecto a la media,
- Varianza de la media: raíz cuadrada de la relación de la varianza estimada por el número de valores utilizados en los cálculos. Esta estimación de la varianza de la media es valida que si los datos constituyen una muestra conseguida al azar (y sin reemplazo) en el seno de una población infinita (muestra aleatoria simple de una población infinita / total).
Gráficos productos en el caso de variables cuantitativas:
- gráficos " caja y bigote " o box plots,
- nubes de puntos univariadas o scattergrams,
- colección de nubes de puntos bivariadas,
- gráficos " Cuantile-Cuantile " o Q-Q plots,
- gráficos " probabilidad-probabilidad " o p-p plots,
- diagramas " tallo y hoja " o stem and leaf plots.
Lista de las estadísticas calculadas en el caso de datos cualitativos
Síntesis para todas las variables:
- Núm. de modalidades: número de modalidades de la variable,
- Moda: la moda es la modalidad cuyo efectivo es el más elevado o cuyo peso es el más elevado (si los datos son ponderados),
- Frecuencia moda: en el caso de datos no ponderados, efectivo de la moda,
- Peso moda: en el caso de datos ponderados, peso de la moda,
- % moda: porcentaje de la moda,
- Frec. rel. moda : frecuencia relativa de la moda.
Tabla de las estadísticas para cada variable:
- Frecuencia : en el caso de datos no ponderados, frecuencia de la modalidad,
- Peso : en el caso de datos ponderados, peso de la modalidad,
- % : porcentaje de la modalidad,
- Frec. rel. : frecuencia relativa de la modalidad.
Gráficos productos en el caso de variables cualitativas: