BH | JC | MJ |
---|---|---|
11 | 19 | 10 |
Hanwen Zhang, Ph.D.
2022-II
Cuando se disponen de un conjunto de datos, la forma más directa de presentarlos es por medio de una gráfica, pues permite conocer de manera rápida la información contenida en los datos y entender su dinámica.
Al momento de elaborar una gráfica, hay que tener en cuenta:
Representación de una variable categórica
Suponga que la oficina de talentos humanos elabora un informe para caracterizar los 40 empleados en una sucursal de una empresa.
Consideramos por ahora el tipo de contrato que tiene cada empleado, los posibles tipos de contratos son: jornada completa (JC), media jornada (MJ), boleta de honorarios (BH).
Así, los datos para el tipo de contrato de los 40 empleados serían: JC, JC, BH, MJ, MJ, …, BH, JC.
Los datos están en el archivo datos gráfica.xlsx en canvas, hoja Contrato
🚀 Variable cualitativa nominal
🔑 Posibles valores: JC, MJ, BH
👩🏻💼👨🏻💼 Unidad de observación: 40 empleados
Una de las formas más sencillas de visualizar una variable categórica es con una gráfica de barras 📊, donde cada barra representa la frecuencia de cada posible valor.
Una forma de representar gráficamente un conjunto de datos o valores mediante barras rectangulares de longitud proporcional a los valores representados. Wikipedia
Hay dos tipos de frecuencias:
Una tabla de es donde se resume el número o el porcentaje de veces que aparece cada posible valor de una variable.
Para la variable “tipo de contrato” de 40 empleados, la tabla de frecuencias es:
BH | JC | MJ |
---|---|---|
11 | 19 | 10 |
👀 La suma de las frecuencias absolutas es igual al número total de datos (\(n\)).
\[11+19+10=40\]
Una frecuencias relativa (\(FR\)) se calcula como:
\[FR=\frac{FA}{n}\]
Cada FR debe estar entre 0 y 1
Las FR pueden ser representadas con %.
Una tabla de frecuencias relativas es donde se resume el porcentaje de veces que aparece cada posible valor de una variable.
BH | JC | MJ |
---|---|---|
0.275 | 0.475 | 0.25 |
La suma de las frecuencias relativas es igual al 1 o el 100%.
\[0.275+0.475+0.25=1\]
Pasos a seguir:
Preparar los datos
Tabular (calcular \(FR\) o \(FA\))
Elaborar la gráfica de barras
Para un conjunto de datos de una variable categórica
gráfica de frecuencias relativas = gráfica de frecuencias absolutas
Diseñado para representar composición de un conjunto de elementos.
Permite mostrar los resultados de una variable categórica.
Amado por unos 😇 y odiado por otros 😈
John Tukey (padre del análisis exploratorio de datos) afirma que:
There is no data that can be displayed in a pie chart that cannot be displayed better in some other type of chart.
Para la variable TIPO DE CONTRATO en excel.
Los posibles valores tienen un orden natural.
Las barras deben respetar dicho orden, con el fin de facilitar la interpretación.
Elaborar la gráfica de barras para la variable el grado de satisfacción en excel. Descargar el arcyivo “Satisfacción.xlsx” de aula virtual.
Objetivo: Caracterizar el mercado de autos usados con datos provenientes de la página Chileautos - Caso Jeep
Fuente de información
Información disponible: variables (descripción y clasificación de cada una) y unidades de observación