Conceptos básicos de datos

Hanwen Zhang, Ph.D.

2023-II

Variable

Una variable es un fenómeno o comportamiento de interés de cierta población.

Ejemplos:

  • 🇨🇱 Producto Interno Bruto de un país
  • 🏡 Ingreso bruto de un hogar
  • 🏧 El número de cajeros de un banco
  • 🌤️ El clima en una ciudad

Tu turno

Encuentra 2 variables en tu vida profesional/diaria.


¿Varían?


¿Por qué crees que varían?

Para entender una variable

👨‍👩‍👧‍👧 Unidad de observación

  • El individuo sobre el cual se mide(n) variable(s) de interés.

  • Puede ser una persona, un hogar, un edificio, una organización, un país, etc.

📏 Unidad de medición

  • Una cantidad estandarizada de una determinada magnitud.

  • Ejemplo: pesos, personas, metros, etc.

Tu turno

Para las 2 variables que encontraste antes …

Diga cuál es la unidad de observación y la unidad de medición.

¿Qué son los datos?

Mediciones (valores) de una variables en diferentes individuos (unidades de observación)

  • 💰 Ingreso mensual en 3 hogares (CLP): 585 mil, 824 mil, 610 mil.

  • 📅 Año de constitución de 4 empresas: 2014, 2015, 2012, 2008

  • 🌤️ Clima de Santiago en los 3 días pasados: Sol, Sol, Lluvia

  • ⚽ Número de goles a favor de 4 equipos en un torneo de futbol: 2, 0, -3, 6.
  • ⚧ Sexo de 4 personas: Hombre, Mujer, Mujer, Hombre
  • 🚗 Patente de 3 autos: KFEI25, FIWQ13, VNZP87

Base de datos

Una base de datos es un conjunto de datos organizados donde:

  • las filas representan unidades de observación (casos) 👨‍👩‍👧‍👦
  • las columnas representan variables (atributos) 🧬

Solo piensan en una hoja de Excel.

Bases de datos reales

Revisaremos en Canvas:

  • jeep.limpio.xlsx

  • Transacciones.xlsx

  • Datos_Venta_Propiedades.xlsx

  • Covid_regiones.csv

  • Censo_Personas_RM.Rda

¡Los datos pueden ser de cualquier forma!

¿Todos los datos tienen unidad de medición? 🤔

Tipos de variables/datos

De acuerdo a los valores de toma una variable, puede ser clasificada como:

Numéricos (cuantitativos)

  • Los valores son y representan números

  • Ingreso, número de XXX, tasa de interés, etc.

Categóricos (cualitativos)

  • Los valores son etiquetas, categorías o palabras

  • Estado civil, nivel educativo, tenencia de vivenda propia, etc.

¡Cuidado!

¡No todos los números son números!

Es común codificar datos categóricos con números, para la variable sexo, 1 denota HOMBRE y 2 denota MUJER. Pero NO son datos numéricos.

Tipos de datos categóricos

Los datos categóricos a su vez se clasifican en

Escala nominal

  • Valores que únicamente identifiquen a los valores de una variable.

  • No hay ningún orden o relación entre los valores.

  • Sexo, estado civil, variable Dummy.

Escala ordinal

  • Los valores establecen un orden

  • La diferencia entre los valores no tienen interpretación

  • Medición de satisfacción, nivel educativo, clasificación de películas según el tipo de público

Tipos de datos categóricos

Tipos de datos numéricos

Los datos numéricos a su vez se clasifican en

Discretos

  • Los posibles valores son valores concretos, enumerables.

  • Ejemplo: número de XXXXX.

Continuos

  • Los posibles valores están en un intervalo

  • Ejemplo: indicadores económicos, tasas, porcentajes, mediciones físicas.

Tipos de datos numéricos

Tipo de datos

Los datos pueden ser clasificados según el momento de la medición:

Datos transversales: mediciones de una o más variables en un mismo punto de tiempo

Datos temporales: mediciones en el tiempo (diarios, semanales, mensuales, trimestrales, anuales, o irregulares)

Tu turno

Para las bases de datos revisadas anteriormente:

  • diga si corresponden a datos transversales o temporales

  • clasifica cada variable de la base

Tarea

  • Organizar en grupos (hogares), asigna a una persona como el jefe de hogar
  • Diligenciar por grupo el cuestionario del censo 2017.
  • ¿La mayoría de las preguntas del censo corresponden a variables numéricas o categóricas?
  • ¿Puedes clasificar las variables del censo?