Variable aleatoria continua

Hanwen Zhang, Ph.D.

2022-II

Variable aleatoria continua

Una variable aleatoria es continua si toma valores en un intervalo

  • Una v.a. continua toma infinitos valores.

  • El intervalo puede ser de forma \((a,b)\), \([a,b]\), \((-\infty, a)\), \((b,\infty)\), entre otros.

Ejemplo: \(Y\) denota el precio de dólar de mañana: \(Y\) puede tomar cualquier valor entre: 800 pesos chilenos y 900 pesos chilenos.

Ejemplo: \(Z\) denota los cambios de un índice bursátil, \(Z\) puede tomar cualquier valor entre: -15% y 20%.

Comportamiento de una v.a. continua

No se puede conocer de antemano el valor que vaya a tomar una v.a., pero sí podemos calcular las probabilidades.

Estas probabilidades se representan por medio de la función de densidad \(f(x)\).

En la gráfica de \(f(x)\), los valores de la variable están en el eje horizontal, los valores de \(f(x)\) están en el eje vertical.

Función de densidad continua

Función de densidad continua

Función de densidad continua

Función de densidad continua

En general, para una v.a. continua \(X\), la función de densidad \(f(x)\) cumple:

  • \(f(x)\geq 0\)
  • \(\int_{-\infty}^\infty f(x)dx=1\) (el área bajo la curva de la función \(f(x)\) es 1)

Función de densidad continua

Función de densidad continua

Función de densidad continua

Uso de \(f(x)\) continua

\[Pr(a<X<b)=\int_a^b f(x)dx=\text{Área bajo curva de $f(x)$}\]

Uso de \(f(x)\) continua

Uso de \(f(x)\) continua

Uso de \(f(x)\) continua

Ejercicio 1. Para esta función de densidad, represente gráficamente las siguientes probabilidades:

  • \(Pr(X>5)\)
  • \(Pr(1<X<4)\)
  • \(Pr(X<8)\)
  • \(Pr(X=1)\)

Uso de \(f(x)\) continua

Ejercicio 2. Para la siguiente función de densidad donde los diferentes valores indica áreas correspondientes

Uso de \(f(x)\) continua

  1. Expresar los 4 valores en términos de las probabilidades:
  • \(0.16=Pr(\hspace{2cm})\)
  • \(0.34=Pr(\hspace{2cm})\)
  • \(0.48=Pr(\hspace{2cm})\)
  • \(0.02=Pr(\hspace{2cm})\)
  1. Calcular las siguientes probabilidades:
  • \(Pr(X<0)=\)
  • \(Pr(X>0)=\)
  • \(Pr(X<2)=\)
  • \(Pr(X>-1)=\)
  • \(Pr(-1<X<2)=\)

Interpretación de \(f(x)\)

Densidad de la variable ingreso mensual por persona: Línea verde (país A), línea azaul (país B)

Interpretación de \(f(x)\)

  • Se puede ver que la mayoría de las personas del país A tienen ingreso entre 500 y 1500 pesos. ¿Qué se puede decir del país B?
  • ¿Si una persona con ingreso menos de 1000 dólares mensuales se clasifica como pobre, en qué país hay más pobres?
  • En qué país hay mayor porcentaje de personas con ingreso mayor a 2500 dólares mensuales?
  • ¿En general cuál país tiene mayor ingreso?

Distribución uniforme continua

Una v.a. continua tiene distribución uniforme sobre un intervalo \((a,b)\) si su función de densidad está dada por \[f(x)=\begin{cases} \dfrac{1}{b-a} & \text{si $a<x<b$}\\ 0 & \text{si no} \end{cases}\]

La función de densidad es una constante, y su gráfica es una línea horizontal en el intervalo \((a,b)\).

Se usará la notación \(X\sim Unif(a,b)\).

Distribución uniforme continua

Diferentes distribuciones exponencial.

Distribución Exponencial

Una v.a. continua \(X\) tiene distribución exponencial con parámetro de escala \(\theta>0\) si su función de densidad está dada por: \[f(x)=\begin{cases}\dfrac{1}{\theta}e^{-\frac{x}{\theta}}&\text{si $x>0$}\\ 0&\text{si no} \end{cases}\]

Se usará la notación \(X\sim Exp(\theta)\).

Distribución Exponencial

Uso de Distribución Exponencial

La distribución exponencial toma valores positivos, y puede ser utilizado para describir el tiempo necesario para la ocurrencia de algún evento.

Ejemplo: tiempo de sobrevivencia de pacientes, la vida útil de algún equipo.

En la anterior gráfica, se puede ver que la distribución \(Exp(2)\) está más concentrada en valores pequeños de \(X\), comparada con \(Exp(3)\) y \(Exp(5)\).

En \(Exp(\theta)\), entre menor sea \(\theta\), más tiende \(X\) a tomar valores pequeños.

Distribución Exponencial

Comparación de \(f(x)\) para la vida útil (en años) de dos marcas de lavadoras (marca verde y marca azul)

  1. ¿Cuál lavadora tiene mayor probabilidad de dañar antes de 3 años?
  2. ¿Cuál lavadora tiene mayor probabilidad de durar más de 10 años?
  3. ¿Cuál lavadora es mejor en términos de duración?

Distribución Exponencial

Propiedades: Si \(X\sim Exp(\theta)\) entonces

\[E(X)=\theta\]

\[Var(X)=\theta^2\]

La esperanza de la distribución coincide con el parámetro \(\theta\). Por lo tanto, entre menor sea \(\theta\), más tiende \(X\) a tomar valores pequeños.

Distribución Exponencial

Suponga que \(X\) denota el tiempo transcurrido entre 2 temblores en Chile, y \(X\sim Exp(\theta=3.5\text{ meses})\), y \(Y\) denota la misma variable para Colombia con \(Y\sim Exp(\theta=6.7\text{ meses})\).

En una misma gráfica representa la función de densidad de \(X\) y \(Y\).

Probabilidades de \(Exp(\theta)\)

Recuerden: \[Pr(a<X<b)=\int_a^b f(x)dx\]

Ejercicio \(Exp(\theta)\)

Suponga que \(X\) denota la vida útil de una cierta marca de lavadora, y \(X\sim Exp(\theta=\ 5.7\ años)\).

  1. ¿En promedio cuánto tiempo dura una lavadora de esta marca?

  2. ¿Cuál es la probabilidad de que una lavadora de esta marca dure menos de 3 años?

  3. ¿Cuál es la probabilidad de que una lavadora de esta marca dure más de 10 años?

  4. Usted compra una lavadora de esta marca usada con 3 años de uso, ¿cuál es la probabilidad de que dure 4 años más?

Ejercicio \(Exp(\theta)\)

  1. ¿En promedio cuánto tiempo dura una lavadora de esta marca?

\(E(X)=?\)

Respuesta: En promedio una lavadora de esta marca dura 5.7 años, esto es, aproximadamente 5 años y 8 meses.

Ejercicio \(Exp(\theta)\)

  1. ¿Cuál es la probabilidad de que una lavadora de esta marca dure menos de 3 años? \(Pr(X<3)\)

En Excel, usar la función EXPON.DIST

Respuesta: La probabilidad de que una lavadora de esta marca dure menos de 3 años es de 40.92%.

Ejercicio \(Exp(\theta)\)

  1. ¿Cuál es la probabilidad de que una lavadora de esta marca dure menos de 3 años? \(Pr(X<3)\)

En R, usar la función pexp

pexp(3, 1/5.7)
[1] 0.4092225

Ejercicio \(Exp(\theta)\)

Ejercicio \(Exp(\theta)\)

  1. ¿Cuál es la probabilidad de que una lavadora de esta marca dure más de 10 años?

\[Pr(X>10)=1-Pr(X<10)\]

Respuesta: la probabilidad de que una lavadora de esta marca dure más de 10 años es de 17.30%.

Ejercicio \(Exp(\theta)\)

  1. ¿Cuál es la probabilidad de que una lavadora de esta marca dure más de 10 años?

\[Pr(X>10)=1-Pr(X<10)\]

En R,

1 - pexp(10, 1/5.7)
[1] 0.1730134

Ejercicio \(Exp(\theta)\)

Ejercicio \(Exp(\theta)\)

  1. Usted compra una lavadora de esta marca usada con 3 años de uso, ¿cuál es la probabilidad de que dure 4 años más?

\[Pr(X>7|X>3)=\dfrac{Pr(X>7\ y\ X>3)}{Pr(X>3)}=\dfrac{Pr(X>7)}{Pr(X>3)}\] \[=\dfrac{0.2929}{0.5908}=0.4957=49.57\%\]

Distribución Normal

Dentro de todas las distribuciones de probabilidad, la más importante es la distribución normal.

  • Presentada por primera vez en el 1733.
  • También conocida como la distribución gaussiana por el matemático, físico y astrónomo Carl Friedrich Gauss. (https://es.wikipedia.org/wiki/Ley_de_Stigler).
  • Tiene muchas propiedades que otras distribuciones no tienen.
  • La mayoría de modelos estadísticos se formulan primero para la distribución normal, y después se extiende a las otras distribuciones.

Distribución Normal

Una v.a. \(X\) sigue una distribución normal con parámetros \(\mu\) y \(\sigma^2\) si su función de densidad está dada por: \[\begin{equation} f_X(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{1}{2\sigma^2}(x-\mu)^2\right\} \end{equation}\] donde \(\sigma>0\).

  • \(X\) toma valores desde \(-\infty\) hasta \(\infty\)
  • Notación: \(X\sim N(\mu,\sigma^2)\).

Distribución Normal

Densidad Normal

La forma de la función de densidad es definida por los dos parámetros: \(\mu\) y \(\sigma\)

Distribución Normal

\(\mu\) corresponde al eje de simetría de \(f(x)\)

Distribución Normal

La mayor probabilidad está concentrada alrededor de \(\mu\).

Distribución Normal

Propiedad de la distribución \(X\sim N(\mu,\sigma^2)\):

\[E(X)=\mu\]

Distribución Normal

El segundo parámetro \(\sigma\) determina qué tan concentrada está la variable alrededor de \(\mu\).

Distribución Normal

En ambas gráficas, los valores de \(X\) están concentrados alrededor de 1, pero los de \(\sigma=1\) están más concentrados que \(\sigma=2\)

Distribución Normal

Propiedad de la distribución \(X\sim N(\mu,\sigma^2)\):

\[Var(X)=\sigma^2\] Entre más pequeño sea \(\sigma\), más concetrados están los valores de \(X\) alrededor de \(\mu\).

Ejemplo Normal

Suponga que el número de ventas diarias de un almacén sigue la distribución \(N(\mu=23,\ \sigma=5)\)

La función de densidad es:

  • El número promedio de ventas diarias es de 23 ventas.

  • La diferencia promedia entre distintos días es de aproximadamente 5 ventas.

Probabilidades Distribución Normal

\[Pr(a<X<b)=\text{Área bajo curva de $f(x)$}\]

\[Pr(a<X<b)=\int_a^b f(x)dx=\int_a^b\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{1}{2\sigma^2}(x-\mu)^2\right\}\]

Este integral no tiene solución analítica, sino que se calcula con métodos numéricos (aproximaciones).

Ejemplo Normal

Suponga que el número de ventas diarias de un almacén sigue la distribución \(N(\mu=23,\ \sigma=5)\), calcular probabilidad de que en un día determinado

  1. haga menos de 10 ventas
  2. haga más de 30 ventas
  3. haga entre 10 y 40 ventas

Ejemplo Normal

\(X\) denota el número de ventas en un día, entonces \(X\sim N(\mu=23,\ \sigma=5)\) ó \(X\sim N(\mu=23,\ \sigma^2=25)\)

  1. Probabilidad de que en un día determinado haga menos de 10 ventas: \(Pr(X<10)\)

En Excel, usar la función NORM.DIST

Ejemplo Normal

En R, usar la función pnorm

pnorm(10, 23, 5)
[1] 0.004661188

Ejemplo Normal

  1. probabilidad de que en un día determinado haga más de 30 ventas: \(Pr(X>30)=1-Pr(X<30)\)

En Excel,

Ejemplo Normal

En R,

1 - pnorm(30, 23, 5)
[1] 0.08075666

Ejemplo Normal

  1. Probabilidad de que en un día determinado haga entre 10 y 40 ventas: \(Pr(10<X<40)=Pr(X<40)-Pr(X<10)\)

En Excel,

Ejemplo Normal

En R,

pnorm(40, 23, 5) - pnorm(10, 23, 5)
[1] 0.9950019

Ejemplo Normal

Distribución Normal Estándar

En una distribución normal, cuando \(\mu=0\) y \(\sigma=1\), la distribución se conoce como la distribución Normal Estándar. (\(Z\sim N(0,\ 1)\))

Distribución Normal Estándar

Cualquier distribución normal se puede convertir a una distribución normal estándar (estandarización)

Si \(X\sim N(\mu,\sigma^2)\), entonces \[Z=\dfrac{X-\mu}{\sigma}\sim N(0,\ 1)\]

Antiguamente, el cálculo sobre cualquier distribución normal se realiza por medio de la \(N(0,1)\).

Distribución Normal Estándar

Existen 3 tipos “tablas” de la distribución normal estándar que permiten cálculo de probabilidades:

  1. probabilidades acumuladas
  2. probabilidades complementarias
  3. probabilidades acumuladas desde la media

Tabla Normal Estándar (probabilidades acumuladas)

Los valores de tabla corresponden a \(Pr(Z<z)\).

\[Pr(Z< -2.14)=0.0162=1.62\%\]

\[Pr(Z< -0.8)=0.2119=21.19\%\]

\[Pr(Z< -1.35)=??\]

\[Pr(Z< 0.92)=??\]

Tabla Normal Estándar (probabilidades complementarias)

Los valores de tabla corresponden a \(Pr(Z>z)\)

\[Pr(Z> 1.23)=0.1093\] \[Pr(Z> -0.75)=1-0.2266=0.7734\] \[Pr(-0.35<Z< 0.66)=??\]

Tabla Normal Estándar (probabilidades acumuladas desde la media)

Los valores de tabla corresponden a \(Pr(0<Z<z)\)

\[Pr(0<Z< 1.35)=0.4115\] \[Pr(0<Z< 0.72)=0.2642\] \[Pr(0<Z< 0.66)=??\] \[Pr(Z< 1.36)=??\] \[Pr(Z< -0.52)=??\] \[Pr(Z> 1.03)=??\] \[Pr(Z> -0.93)=??\]

Probabilidades en Distribución Normal

Ejemplo: Suponga que el número de ventas diarias de un almacén sigue la distribución \(N(\mu=23,\ \sigma=5)\), calcular probabilidad de que en un día determinado

  1. haga menos de 10 ventas
  2. haga más de 30 ventas
  3. haga entre 10 y 40 ventas

Probabilidades en Distribución Normal

\(X\sim N(\mu=23,\ \sigma=5)\)

  1. \(Pr(X<10)=??\) \[Pr(X<10)=Pr(\dfrac{X-23}{5}<\dfrac{10-23}{5})=Pr(Z<-2.6)=0.0047\]

  2. \(Pr(X>30)=??\)

Probabilidades en Distribución Normal

En una distribución \(N(\mu,\sigma^2)\) \[Pr(\mu-2\sigma <X<\mu+2\sigma)=Pr(-2<Z<2)\approx 95\%\]

Con probabilidad \(95\%\), los valores de una v.a. normal está alrededor de su media \(\mu\) más y menos 2 desviaciones.

Probabilidades en Distribución Normal

Ej: Número de ventas diarias \(\sim N(\mu=23,\sigma=5)\), entonces con probabilidad \(95\%\), se vende diariamente entre \(23-2*5=13\) y \(23+2*5=33\) libros

Ej: El precio de boleta de avión desde Santiago a Bogotá \(\sim N(\mu=1500USD,\sigma=400USD)\), entonces con probabilidad \(95\%\), el precio está entre _______ USD y ______ USD

Percentiles normal

Definición: el percentil \(p\) de una distribución es el valor de la variable que tenga probabilidad acumulada (hacia la izquierda) \(p\).

Percentiles normal

El concepto de los percentiles es muy importante en la estadística, porque se usan en diferentes cálculos casi todas las ramas de la estadística.

Percentiles de la \(N(0,1)\)

En Excel: usar la función NORM.S.INV

Percentiles normal

Percentiles de la \(N(0,1)\)

En R: usar la función qnorm:

qnorm(0.975)
[1] 1.959964

Decimos que 1.96 es el percentil 97.5% de la distribución \(N(0,1)\)

\(z_{0.975}=1.96\)

¿Con probabilidad ___%, la \(Z\) está entre -1.96 y 1.96?

Percentiles normal

Encuentra los percentiles 50% y 95% de la distribución \(N(0,1)\).

\[z_{\ \ \ \ }=\] \[z_{\ \ \ \ }=\]

Percentiles normal

Percentiles de cualquier normal

En Excel: usar la función NORM.INV.

Percentil 97.5% de la distribución \(N(\mu=23,\sigma=5)\)

Percentiles normal

Percentiles de cualquier normal

En R: usar la función qnorm

qnorm(0.975, 23, 5)
[1] 32.79982

33 es el percentil 97.5% de \(N(\mu=23,\sigma=5)\)