
Hanwen Zhang, Ph.D.
2022-II
Experimento aleatorio (\(\Omega\)): Cualquier experimento cuyo resultado no se puede conocer de antemano.
Variable aleatoria (v.a.): Una medición numérica que describe los resultados del experimento aleatorio (\(\Omega\)).
Una v.a. toma diferentes valores de acuerdo con los diferentes resultados.
No se puede conocer de antemano qué valor vaya a tomar la v.a., pero sí cuáles son los posibles valores.
Las variables aleatorias se denotan con letras mayúsculas como \(X, Y, Z\).
Lanzar una moneda: \(\Omega=\{Cara,\ Sello\}\)
\[X=\begin{cases} 1 &\text{si el resultado es Cara}\\ 0 &\text{si el resultado es Sello}\\ \end{cases}\]
$$Y= \[\begin{cases} 1 &\text{si el resultado es Sello}\\ 0 &\text{si el resultado es Cara}\\ \end{cases}\]$$
\[Z=\begin{cases} 4 &\text{si el resultado es Cara}\\ 2 &\text{si el resultado es Sello}\\ \end{cases}\]
Lanzar 🎲 y definir \(X\) como el resultado. \(X\) toma valores: 1, 2, 3, 4, 5, 6.
Lanzar 🎲🎲 y definir \(X\) como la suma de los dos resultados. \(X\) toma valores: 2, 3, …, 12.
Lanzar 🪙 3 veces y definir \(X\) como el número veces que se obtiene Cara. \(X\) toma valores: 0, 1, 2, 3.
Un hospital realizará 5 operaciones corazón abierto ❤️🩹,\(X=\) número de operaciones exitosas. \(X\) toma valores: 0, 1, 2, 3, 4, 5.
Durante una epidemia por un nuevo virus, \(Y=\) número de pacientes que llegan a 🏥 en un determinado día. \(Y\) toma valores: 0, 1, 2, 3, 4, 5, …
\(Y\) denota el crecimiento económico del próximo mes: \(Y\) puede tomar cualquier valor entre: 0% y 10%
\(Y\) denota el precio de dólar de mañana: \(Y\) puede tomar cualquier valor entre: 900 y 1000 pesos chilenos.
\(Z\) denota los cambios de un índice bursátil, \(Z\) puede tomar cualquier valor entre: -15% y 20%.
Generalmente las variables aleatorias pueden clasificar en discretas y continuas.
No se puede conocer de antemano el valor que vaya a tomar una v.a., pero sí podemos calcular las probabilidades.
Estas probabilidades se representan por medio de la función de densidad \(f(x)\).
Lanzar 🎲 y definir \(X\) como el resultado. \(X\) toma valores: 1, …, 6.
\[Pr(X=i)=1/6\ \ \ \text{para $i=1,...,6$}\] $$f(x)= \[\begin{cases} 1/6 &\text{si }x=1,2,...,6\\ 0 &\text{si no}\\ \end{cases}\]$$

Ejemplo: Extraer una carta de una barja (sin Joker) y se define \(X\) como el número de la carta extraída, \(X\) toma valores: 1, 2, …, 13.
\[Pr(X=i)=1/13\ \ \ \text{para todo $i=1,...,13$}\]
\[f(x)=\begin{cases} 1/13 &\text{si }x=1,2,...,13\\ 0 &\text{si no}\\ \end{cases}\]
Una v.a. \(X\) tiene distribución uniforme discreta sobre el conjunto de valores \(\{1,2,...,N\}\) si la función de densidad está dada por \[f(x)=\begin{cases} 1/N &\text{si }x=1,2,...,N\\ 0 &\text{si no}\\ \end{cases}\]
Principal característica: Todos los valores de \(X\) tienen la misma probabilidad.
Una inmobiliaria tiene vendedores para un nuevo proyecto de casas, \(X\) y \(Y\) es el número de casas que vende en un mes Ana y Carolina, respectivamente,
\(f(x)=\begin{cases} 0.25 &\text{si }x=0\\ 0.30 &\text{si }x=1\\ 0.20 &\text{si }x=2\\ 0.15 &\text{si }x=3\\ 0.10 &\text{si }x=4\\ \end{cases}\), \(f(y)=\begin{cases} 0.15 &\text{si }y=0\\ 0.30 &\text{si }y=1\\ 0.30 &\text{si }y=2\\ 0.25 &\text{si }y=3 \end{cases}\)
¿Cuál de las dos es mejor vendedora?
La pregunta clave es:
¿En promedio, cuántas casas vende al mes Ana y Carolina?
“Promedio” de Ana: \(0,25*0 + 0,3*1 + 0,2*2 + 0,15*3 + 0,1*4 = 1,55\)
“Promedio” de Carolina: \(0,15*0 + 0,3*1 + 0,3*2 + 0,25*3=1,65\)
En promedio, (a la larga, en términos generales) Carolina vende más que Ana.
Corresponde al promedio de los valores de una v.a., ponderado por las probabilidades de ocurrencia.
\[\mu=E(X)=\sum x_iPr(X=x_i)\] . . .
\(E(X)\) representa el promedio de los valores de \(X\) después de repetir muchas veces el experimento.
¡Similar a cómo se computa la nota final de un ramo!
Ejemplo, \(X=\) el resultado de lanzar un dado. \[E(X)=1*\frac{1}{6}+2*\frac{1}{6}+...+6*\frac{1}{6}=3.5\] . . .
Lancemos un dado muchas veces, y vemos el promedio de los resultados:
| Lanzamiento | 1 | 2 | 3 | 4 | 5 | … |
|---|---|---|---|---|---|---|
| Resultado | 3 | 5 | 3 | 1 | 6 | … |
Promediar los resultados después de 5, 10, 20 y 50 lanzamientos. Los promedios obtenidos son aproximadamente 3.5?
Corresponde a la varianza de los valores de una v.a., ponderado por las probabilidades de ocurrencia. \[\sigma^2=Var(X)=\sum (x_i-\mu)^2Pr(X=x_i)\]
\(Var(X)\) representa la varianza de los valores de \(X\) después de repetir muchas veces el experimento.
\[Var(X)=E(X-\mu)^2=E(X^2)-\mu^2\]
\(X=\) el resultado de lanzar un dado. \[Var(X)=(1-3.5)^2*\frac{1}{6}+(2-3.5)^2*\frac{1}{6}+...+(6-3.5)^2*\frac{1}{6}=2.9167\] . . .
Lancemos un dado muchas veces, y vemos el promedio de los resultados:
| Lanzamiento | 1 | 2 | 3 | 4 | 5 | … |
|---|---|---|---|---|---|---|
| Resultado | 3 | 5 | 3 | 1 | 6 | … |
Sacar varianza a los resultados después de 5, 10, 20 y 30 lanzamientos. Las varianzas obtenidas son aproximadamente 2.9167?
Una v.a. \(X\) tiene distribución uniforme discreta sobre el conjunto de valores \(\{1,2,...,N\}\) si la función de densidad está dada por \[f(x)=\begin{cases} 1/N &\text{si }x=1,2,...,N\\ 0 &\text{si no}\\ \end{cases}\]
\[E(X)=\frac{N+1}{2}\] \[Var(X)=\frac{N^2-1}{12}\]
Esta distribución denota el resultado de un experimento con solo dos posibles resultados, etiquetados como éxito y fracaso.
La probabilidad de resultar éxito se denota por \(p\), y la de fracaso, \(1-p\).
La v.a. \(Ber(p)\) denota el éxito con 1 y el fracaso con 0.
\[f(x)=\begin{cases} p &\text{si }x=1\\ 1-p &\text{si }x=0\\ \end{cases}\]
En una pandemia, el contagio de la enfermedad en una persona de cierto grupo etario sigue una distribución \(Ber(0.25)\).
Cada persona puede presentar dos posibles situaciones: contagiarse o no.
La probabilidad de que una persona de este grupo etario se contagie es de 0.25, ó 25%.
La probabilidad de que una persona de este grupo etario no se contagie es de 0.75, ó 75%.
Si \(X\sim Ber(p)\), entonces: \[E(X)=p\] \[Var(X)=p(1-p)\]
Situación: repetición de un experimento Bernoulli (éxito o fracaso): \(n\) repeticiones o una serie de \(n\) experimentos Bernoulli. La distribución Binomial denota el número total de éxitos.
Ejemplo: Un asesor de un banco llama a 15 clientes para ofrecer un seguro anti fraude, la probabilidad de que en una llamada logre vender el seguro es de 17%, \(n=15\), \(p=0.17\)
Ejemplo: En un supermercado chico de 20 empleados, cada empleado tiene probabilidad de 10% de contagiarse de cierta enfermedad \(n=20\), \(p=0.1\)
Notación: \(X\sim Binom(n,p)\), donde \(p\) es la probabilidad de éxito del ensayo Bernoulli.
Valores: \(X\) toma valores: 0, 1, …, \(n\)
Situación: Una empresa de seguros de autos en una semana vende 10 seguros contra todo riesgo para un mismo tipo de autos, si la probabilidad de presentar siniestro de un auto es de 15%, se quiere conocer el comportamiento de autos que presenten siniestro.
Notaciones: \(X\) denota el número de autos que presenten siniestro, posibles valores de \(X\): 0, 1, …, 10.
\(X\sim Binom(10, 0.15)\).
Preguntas:
Función de densidad: \[f(x)=\begin{cases} \binom{n}{x}p^x(1-p)^{(n-x)} &\text{si }x=0,1,...,n\\ 0 &\text{si no}\\ \end{cases}\]
Función de densidad \(Ber(10, 0.15)\): \[f(x)=\begin{cases} \binom{10}{x}0.15^x(1-0.15)^{(10-x)} &\text{si }x=0,1,...,10\\ 0 &\text{si no}\\ \end{cases}\]
Uso de \(f(x)\): Cálculo de probabilidades: \(Pr(X=k)=f(k)\).
Gráfica de la función de densidad \(Binom(10, 0.15)\)
Probabilidad que ningún auto presente siniestro: \(Pr(X=0)=\binom{10}{0}0.15^0(1-0.15)^{(10-0)}=0.1969=19.69\%\)
Probabilidad que 2 autos presenten siniestro: \(Pr(X=2)=\binom{10}{2}0.15^2(1-0.15)^{(10-2)}=0.2759=27.59\%\)
Cálculo de probabilides en Excel, usar la función BINOM.DIST
Ustedes calcular \(Pr(X=2)\)
Cálculo de probabilides en R, dbinom equivale a \(f(x)\).
Probabilidad que a lo más 3 de los 10 autos presenten siniestro:
\[Pr(X\leq3)=Pr(X=0)+Pr(X=1)+Pr(X=2)+Pr(X=3)\] \[=0.9500302=95.\%\]
En R, usamos pbinom para las probabilidaes acumulativas
Probabilidad de que más de 4 de los 10 autos presenten siniestro: \(Pr(X>4) = Pr(X=5)+Pr(X=6)+...+Pr(X=10)=0.009874=0.9874\%\)
\(Pr(X>4) = 1-Pr(X\leq4)=0.009874=0.9874\%\)
En Excel, usar la función BINOM.DIST 
En R
Si \(X\sim Binom(n,p)\), entonces \[E(X)=np\] \[Var(X)=np(1-p)\]
En el ejemplo de seguros de autos, \(E(X)=10*0.15=1.5\) autos, coincide lo observado en la gráfica de \(f(x)\): los valores más probables son: 0, 1, 2, y 3.
Situación: La distribución Poisson es comúnmente utilizado para describir el número de sucesos en un determinado intervalo de tiempo y/o espacio geográfico.
Número de accidentes diarios de autos en una ciudad
Número de personas que llegan a la urgencia de un hospital en un día.
Notación \(X\sim Poisson(\lambda)\) (\(\lambda\) se lee lambda): \(X\) tiene distribución Poisson con parámetro \(\lambda\).
Valores de \(X\): \(X\) toma valores 0, 1, 2, … . No tiene un límite superior.
\(X\) es una variable aleatoria discreta.
Si \(X\sim Poisson(\lambda)\), entonces \[f(x)=\begin{cases} \dfrac{e^{-\lambda}\lambda^x}{x!} &\text{si }x=0,1,2,...,\\ 0 &\text{si no}\\ \end{cases}\]
De las gráficas anteriores, se observan que:
En la densidad de \(Poisson(4)\), los valores más probabiles de \(X\) están alrededor de 4.
En la densidad de \(Poisson(7)\), los valores más probabiles de \(X\) están alrededor de 7.
Se puede concluir que:
El parámetro \(\lambda\) indica dónde están los valores más probables de la variable \(X\)
\(E(X)=\lambda\)
El número de peticiones que llegan diariamente a una oficina de ministerio público sigue una distribución Poisson con parámetro 10, calcular probabilidad de que:
Desarrollo: \(X\sim Poisson(10)\),
\[\begin{equation*} f(x)=\begin{cases} \dfrac{e^{-10}10^x}{x!} &\text{si }x=0,1,2,...,\\ 0 &\text{si no}\\ \end{cases} \end{equation*}\]En Excel: usar la función POISSON.DIST 
La respuesta correcta es: 0.0189166
Escribir la probilidad en términos de \(\leq\): \(Pr(X>20)=1-Pr(X\leq 20)\)
En Excel: usar la función POISSON.DIST 