Website TemplatesJoomla TemplatesWeb Hosting
Inicio Estadística probabilidad y conteo Manejo de la Información Diagramas de Caja o Diagramas de Bigotes

Diagramas de Caja o Diagramas de Bigotes

Usar puntuación: / 2
MaloBueno 

Las TIC han tenido en los últimos años un gran impacto social, incrementando de forma considerable la información disponible, alterando la metodología para su tratamiento estadístico y transformando la educación en muchos lugares del mundo.

A la escuela han llegado como un conjunto de innovaciones tecnológicas y herramientas computacionales con múltiples funciones: fuentes de información, canales de comunicación interpersonal para el trabajo colaborativo y para el intercambio de información e ideas, como medio de expresión, también como instrumento cognitivo para procesar la información y para la gestión, ya que automatizan diversos trabajos de la gestión de los centros educativos.

Si bien no existen estudios concluyentes que permitan afirmar que la utilización de los medios informáticos en la educación han servido para mejorar los resultados académicos, se ha observado que las tecnologías de la información suscitan la colaboración en los alumnos, mejoran la motivación y el interés, favorecen el espíritu de búsqueda, y promueven cambios significativos en los procesos de comunicación, interacción y colaboración entre el binomio estudiante-docente, en la forma de entender el conocimiento y el acceso a la información y en la forma de evaluar los procesos de aprendizaje.

En este documento vamos a utilizar una escena realizada con Geogebra, un software libre de geometría dinámica, para explorar e interpretar una serie de datos numéricos a través de diagramas de caja o diagramas de bigotes, un tipo de gráfica poco utilizada en nuestro medio y muy útil para representar visualmente un conjunto datos numéricos y comparar distribuciones.

Un diagrama de caja es una manera de resumir un conjunto de datos numéricos, se utiliza a menudo en el análisis exploratorio de datos para mostrar la forma y simetría de la distribución, su valor central y su variabilidad. La imagen producida se compone de los valores más extremos en el conjunto de datos (los valores máximo y mínimo), los cuartiles inferior y superior, y la mediana.

El término “cuartiles” se refiere a los tres valores que dividen a un conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados generalmente por Q1, Q2, Q3:

  • El primer cuartil, es el valor debajo del cual queda la cuarta parte (25%) de todos los valores de la sucesión.
  • El segundo cuartil es precisamente la mediana (valor que divide al conjunto en dos partes iguales).
  • El tercer cuartil, es el valor por debajo del cual quedan las tres cuartas partes (75%) de los datos.

La escena que sigue muestra la distribución de las edades de un grupo de estudiantes de séptimo grado. La figura muestra un diagrama de caja correspondiente a la Tabla de la derecha, dicha caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo (min) y máximo de las estaturas. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.


... Sorry, the GeoGebra Applet could not be started. Please make sure that Java 1.4.2 (or later) is installed and active in your browser (Click here to install Java now)


Los cinco parámetros básicos del diagrama de bigotes son:

  1. la estatura mínima de la distribución (141 cm)
  2. el primer cuartil (Q1) equivalente a 149 cm quien deja un 25% de la distribución a su izquierda
  3. la mediana 157 cm quien deja a cada lado el mismo número de datos
  4. el tercer cuartil (Q3) igual a 160 cm, este parámetro deja un 75% de la distribución a su izquierda.
  5. Y finalmente la estatura máxima 174 cm.

De la escena se deduce que:

  • El rectángulo contiene el 50% de los datos. Esto es la mitad de los estudiantes tienen estaturas comprendidas entre 149-160 centímetros.
  • La ubicación de la mediana sugiere una distribución asimétrica sesgada a la izquierda. La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las estaturas comprendidas entre el 25% y el 50% de la población están más dispersas que entre el 50% y el 75%.
  • El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más bajos están más concentrados que el 25% de los mayores.
  • El rango intercualitico (Q3-Q1) igual a 11 cm, nos da una franja en la que se encuentra el 50% de la población.
  • El tamaño de las cajas sugiere la existencia de datos homogéneos, cercanos a la estatura media del grupo, con valores atípicos de 141 y 174 cms.
  • Las estaturas varían de 141cms a 174 cm, lo cual da un rango de 33 cm que en asuntos de estatura es una gran diferencia.
  • El primer cuartil se lee como 149 cms lo que significa que el 75% de las estaturas son mayores a 149 centímetros.
  • El cuartil 3 nos indica que el 25% de las estaturas mide 160 cms o más. La mediana divide la distribución de los datos en mitades. La mediana es de 157 cms. Por lo tanto la mitad de los estudiantes presentan estaturas iguales o mayores a 157 cms.

Utiliza la escena de arriba para explorar el comportamiento de la gráfica modificando algunas de las estaturas o ingresando sus propios datos.  Saque sus propias conclusiones.