Hanwen Zhang, Ph.D.
2023-II
Una variable es un fenómeno o comportamiento de interés de cierta población.
Ejemplos:
Encuentra 2 variables en tu vida profesional/diaria.
¿Varían?
¿Por qué crees que varían?
👨👩👧👧 Unidad de observación
El individuo sobre el cual se mide(n) variable(s) de interés.
Puede ser una persona, un hogar, un edificio, una organización, un país, etc.
📏 Unidad de medición
Una cantidad estandarizada de una determinada magnitud.
Ejemplo: pesos, personas, metros, etc.
Para las 2 variables que encontraste antes …
Diga cuál es la unidad de observación y la unidad de medición.
Mediciones (valores) de una variables en diferentes individuos (unidades de observación)
💰 Ingreso mensual en 3 hogares (CLP): 585 mil, 824 mil, 610 mil.
📅 Año de constitución de 4 empresas: 2014, 2015, 2012, 2008
🌤️ Clima de Santiago en los 3 días pasados: Sol, Sol, Lluvia
Una base de datos es un conjunto de datos organizados donde:
Solo piensan en una hoja de Excel.
Revisaremos en Canvas:
jeep.limpio.xlsx
Transacciones.xlsx
Datos_Venta_Propiedades.xlsx
Covid_regiones.csv
Censo_Personas_RM.Rda
¿Todos los datos tienen unidad de medición? 🤔
De acuerdo a los valores de toma una variable, puede ser clasificada como:
Numéricos (cuantitativos)
Los valores son y representan números
Ingreso, número de XXX, tasa de interés, etc.
Categóricos (cualitativos)
Los valores son etiquetas, categorías o palabras
Estado civil, nivel educativo, tenencia de vivenda propia, etc.
¡No todos los números son números!
Es común codificar datos categóricos con números, para la variable sexo, 1 denota HOMBRE y 2 denota MUJER. Pero NO son datos numéricos.
Los datos categóricos a su vez se clasifican en
Escala nominal
Valores que únicamente identifiquen a los valores de una variable.
No hay ningún orden o relación entre los valores.
Sexo, estado civil, variable Dummy.
Escala ordinal
Los valores establecen un orden
La diferencia entre los valores no tienen interpretación
Medición de satisfacción, nivel educativo, clasificación de películas según el tipo de público
Los datos numéricos a su vez se clasifican en
Discretos
Los posibles valores son valores concretos, enumerables.
Ejemplo: número de XXXXX.
Continuos
Los posibles valores están en un intervalo
Ejemplo: indicadores económicos, tasas, porcentajes, mediciones físicas.
Los datos pueden ser clasificados según el momento de la medición:
Datos transversales: mediciones de una o más variables en un mismo punto de tiempo
Datos temporales: mediciones en el tiempo (diarios, semanales, mensuales, trimestrales, anuales, o irregulares)
Para las bases de datos revisadas anteriormente:
diga si corresponden a datos transversales o temporales
clasifica cada variable de la base