Representación gráfica de los parámetros de localización y dispersión

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Gráfico Boxplot (Box-Whisker-Plot)

A diferencia del diagrama tronco-hoja,  el boxplot no contiene información acerca de los valores observados.  Solamente muestra la información más importante sobre la distribución de frecuencia. Especificamente,  el “boxplot” contiene el mayor y el menor de los valores observados x_{(1)} y x_{(n)} y tres cuartiles x_{0.25},x_{0.5}ax_{0.75}. El segundo cuartil x_{0.5} es de hecho la mediana. Los cuartiles se denotan mediante una linea y el primer y tercer cuartil se unen de tal forma que generan una caja. Las lineas dentro de esta caja representan la mediana . La altura de esta caja es el . que es la diferencia entre el tercer y primer cuartil: x_{0.75} y x_{0.25}. Dentro de esta caja, se encuentran los valores centrales que son el 50 % de todos los valores. Los gráficos whiskers muestran el valor mayor y menor entre 1.5multiplicado por el rango intercuartílico calculado a partir del límite de la caja. Los límites x_{0.25}-1.5\cdot QA y x_{0.75}+1.5\cdot QA son denominados la valla superior e inferior respectivamente. Los valores que caen fuera de esta valla son marcados como valores extremos con un símbolo diferente. Normalmente, el boxplot también da la media mediante una línea discontinua. El boxplot proporciona una compresión respecto a la localización, dispersión, forma y estructura de los datos. Boxplot:

Es folnode3 g 01.gif

Ejemplo: Salarios estudiantiles en USD:

x_{min} 1 x_{min} 1 x_{min} 1.74997
x_{max} 44.5005 x_{max} 26.2903 x_{max} 44.5005
R 43.5005 R 25.2903 R 42.7505
x_{0.25} 5.24985 x_{0.25} 6.00024 x_{0.25} 4.74979
x_{0.5} 7.77801 x_{0.5} 8.92985 x_{0.5} 6.79985
x_{0.75} 11.2504 x_{0.75} 12.9994 x_{0.75} 10.0001
QA 6.00065 QA 9.99916 QA 5.25031
\bar{x} 9.02395 \bar{x} 9.99479 \bar{x} 7.87874
s^{2} 26.408 s^{2} 27.9377 s^{2} 22.2774
s 5.13887 s 5.28562 s 4.7199
v 0.57 v 0.53 v 0.60

Total:

Es folnode3 g 02.gif

Hombres y mujeres separadamente:

Es folnode3 g 03.gif

Este ejemplo interactivo nos permite representar la distribución unidimensional de una variable elegida (puedes elegir entre dos bases de datos) en la forma de una nube de puntos, un boxplot y un histograma. También se calculan los parámetros de localización y dispersión más importantes.

Datos de criminalidad en USA

Datos de varios tipos de crimenes cometidos en USA fueron recogidos para el año 1985:

Es folnode4 b k 1 3.gif

X1 - area territorial
X2 - población
X3 - asesinato
X4 - violación
X5 - robo
X6 - asalto
X7 - allanamiento
X8 - latrocinio
X9 - robo de coche
X10 - número región del estado de US
X11 - número división del estado de US

Los valores de las variables X10 y X11 son:

X10 número región del estado X11 número división del estado
1 Northeast 1 New England
2 Midwest 2 Mid Atlantic
3 South 3 E N Central
4 West 4 W N Central
5 S Atlantic
6 E S Central
7 W S Central
8 Mountain
9 Pacific

Datos de automóviles

Los siguientes datos fueron recogidos para 74 tipos de coches:

X1 - precio
X2 - mpg (millas por galón)
X3 - altura (en pulgadas)
X4 - distancia entre asientos (distancia entre asiento delantero y trasero, en pulgadas)
X5 - espacio del maletero (en pies cúbicos)
X6 - peso (en libras)
X7 - longitud (en pulgadas)
X8 - diámetro de giro(distancia requerida para hacer un giro en U, en pies)
X9
- desplazamiento (en pulgadas cúbicas)

Es folnode3 d k 1 2.gif

Se obtuvieron los precios de 74 tipos de coches para el año 1983. Los resultados se muestran en los siguientes gráficos:

Es folnode3 g k 1.gif

Los paneles superiores contienen los gráficos de puntos, o nube de puntos. Los paneles inferiores muestran los boxplots. Los valores que caen fuera del 1.5 por el rango intercuartílico se les denomina observaciones extremas. Estas observaciones extremas producen grandes diferencias entre la mediana (línea continua) y la media (línea discontinua).