Estadística I (451769–451837) Unidad IV: Variables Aleatorias
Ingeniería Comercial Universidad de Concepción Dpto. de Gestión Empresarial Campus Los Ángeles
Tipos de Espacio Muestral
Un espacio muestral Ω se dice:
Discreto, si Ω es un conjunto finito o infinito numerable.
Continuo, si Ω es un conjunto infinito no numerable.
Si lanzamos dos monedas perfectas, entonces el espacio muestral es Ω = {CC , CS , SC , SS } el cual resulta ser un espacio muestral discreto, pues es finito.
Tipos de Espacio Muestral
Si observamos la cantidad de automóviles que llegan a una intersección específica en un lapso de 30 minutos, entonces Ω = {0, 1, 2, 3, 4, . . .} = N0 así, Ω es un conjunto infinito numerable y por ende un espacio muestral discreto.
Si anotamos la vida útil, en horas, de un modelo cualquiera de una determinada marca de automóviles, entonces Ω = {t ∈ R : t > 0 } = [0, +∞[ de este modo, Ω es un espacio muestral continuo, por ser infinito no numerable.
Variables Aleatorias
Una función X , que a cada elemento de un espacio muestral Ω le asigna un número real, se conoce como variable aleatoria (v.a.). Es decir, una variable aleatoria es una función de la forma X : Ω −→ R
(1)
En el concepto de variable aleatoria está implícito el concepto de experimento aleatorio. Experimento
Lanzar dos dados Lanzar una moneda 30 veces Contar vehículos en una esquina
Variable Aleatoria X = suma de las caras X = no de caras obtenidas X = n vehículos hora o
Variables Aleatorias
El conjunto de todos los valores que puede tomar una v.a. X se conoce como recorrido de X y se denota por Rec (X ). Suponga que Ω = {s 1 , s 2 , . . . , s n } es el espacio muestral para un determinado experimento aleatorio y que X es una variable aleatoria definida sobre Ω con recorrido Rec (X ) = {x 1 , x 2 , . . . , x m }. Podemos observar que X = x i si y solo si el resultado del experimento aleatorio es un punto muestral s j ∈ Ω, de tal forma que X (s j ) = x i
Además, podemos definir una función de probabilidad P X sobre Rec (X ) en el siguiente sentido
P (X = x ) = P {s ∈ Ω : X (s ) = x } X
i
j
j
i
Variables Aleatorias
P X (X = x i ) debe entenderse como: la probabilidad de que la variable aleatoria X tome el valor x i .
Notemos que P X define una función de probabilidad para la variable aleatoria X . Además, se tiene que P X satisface los Axiomas de Kolmogorov. Por simpleza, escribimos P (X = x i ) en vez de P X (X = x i ) Las variables aleatorias siempre se denotan con letras mayúsculas, mientras que los valores que ellas pueden tomar, se denotan con letras minúsculas.
Variables Aleatorias
Consideremos el experimento de lanzar tres veces una moneda perfecta. Definamos la variable aleatoria X como el número de caras obtenidas en los tres lanzamientos. s X (s )
CCC 3
CCS 2
CSC 2
SCC 2
SSC 2
SCS 1
CSS 1
SSS 0
Observamos que el recorrido de la variable X es Rec (X ) = {0, 1, 2, 3}. Asumiendo que cada punto muestral s i tiene la misma probabilidad de ocurrir, podemos construir fácilmente la función de probabilidad P asociada a X .
Variables Aleatorias
Por ejemplo, podemos calcular la probabilidad de que el n o de caras obtenidas en los tres lanzamientos sea igual a 1
P (X = 1) = P {CSS , SCS , SSC } = 3/8
En general, se tiene que 0 x P (X = x ) 1/8
1 3/8
2 3/8
3 1/8
Variables Aleatorias
Con cada variable aleatoria X , podemos asociar una función llamada función de distribución acumulada de X . La función de distribución acumuluda (cdf por sus siglas en inglés) de una variable aleatoria X , denotada por F X (x ), está definida por F X (x ) = P (X ≤ x ),
∀ x
La cdf para el ejemplo de las monedas es
0 1/8 F (x ) = 1/2 7/8 1 X
si si si si si
− ∞ < x < 0 0 ≤ x < 1 1 ≤ x < 2 2 ≤ x < 3 3 ≤ x < ∞
Variables Aleatorias
La gráfica de F X (x ) nos dice que se trata de una función por tramos, definida para todos los valores x , no solo los que viven es Rec (X ) = {0, 1, 2, 3}. A modo de ejemplo, la probabilidad acumulada hasta el valor x = 2.5 viene dada por F X (2.5) = P (X ≤ 2.5) = P (X = 0, 1, o 2) =
7 8
Theorem
La función F es una función de distribución acumulada si y solo si se cumplen las siguientes tres condiciones: 1. lim F (x ) = 0 y lim F (x ) = 1. x →−∞
x →∞
2. F es una función no decreciente de x . 3. F es una función continua por la derecha; es decir,
∀x 0 : lim F (x ) = F (x 0 ) x →x 0+
Variables Aleatorias
Como ejemplo, consideremos el experimento de lanzar una moneda hasta que aparezca la primera cara. Sea p la probabilidad de obtener cara en un lanzamiento cualquiera y definamos la v.a. X como el número de lanzamientos realizados hasta obtener la primera cara. Luego, la función de probabilidad asociada a X es P (X = x ) = p (1 − p )x −1 ,
x = 1, 2, . . .
Lo anterior pues de deben obtener x − 1 sellos antes de obtener la primera cara. La cdf asociada es x
x
F (x ) = P (X ≤ x ) = P (X = i ) = p (1 − p )
i −1
X
i =1
i =1
Variables Aleatorias
De donde obtenemos que F X (x ) = P (X ≤ x ) x
= p (1 − p )
i −1
i =1
1 − (1 − p )x = p · 1 − (1 − p ) = 1 − (1 − p )x
La función anterior es la cdf de una distribución llamada distribución geométrica, cuya función de probabilidad viene dada por P (X = x ) = p (1 − p )x −1 ,
para x = 1, 2, . . .
x = 1, 2, . . .
Notemos que las funciones involucradas en el ejemplo anterior son todas discretas .
Variables Aleatorias
Un ejemplo de cdf continua es la función F X (x ) =
1 1 + e
−
x
La función anterior corresponde a la cdf de una variable aleatoria que sigue una distribución logística de probabilidades. Se puede probar fácilmente que la función anterior corresponde a una cdf .
Variables Aleatorias
Una variable aleatoria X es continua si F X (x ) es una función continua de x . Por su parte, X será discreta si F X (x ) es una función discreta de x . Se dice que dos variables aleatorias X e Y están idénticamente distribuidas si poseen la misma distribución de probabilidades. Para el experimento de lanzar tres veces una moneda perfecta. Sean X = no de caras obtenidas e Y = no de sello obtenidos, entonces X e Y están idénticamente distribuidas, pero X no es igual a Y .
Theorem
Las siguientes proposiciones son equivalentes: Las v.a. X e Y están idénticamente distribuidas. F (x ) = F (x ), para todo x . X Y
PMF y PDF
Asociada a cada v.a. X y a su respectiva cdf F X también existe otra función: la función de masa de probabilidad (pmf por sus siglas en inglés) o función de densidad de probabilidad (pdf por sus siglas en inglés). Los términos pmf y pdf se refieren, respectivamente, a los casos discreto y continuo. La función de masa de probabilidad o pmf de una variable aleatoria discreta X viene dada por f X (x ) = P (X = x ),
∀ x
Notemos que la pmf nos sirve para calcular probabilidades en el caso discreto, ya que
P (a ≤ X ≤ b )
P (X ≤ b )
=
=
b k =k 0
b
f X (k )
k =a
f X (k )
= F X (b ), siendo k 0 el primer elemento de Rec (X ).
PMF y PDF
La función de densidad de probabilidad o pdf de una v.a. continua X es la función f X (x ) que satisface la siguiente propiedad x
F X (x ) =
f X (t ) dt ,
∀ x
−∞
Como f X (x ) en este caso es continua, usando el Primer Teorema Fundamental del Cálculo resulta la relación d F X (x ) = f X (x ) dx
En el caso continuo no tiene sentido calcular probabilidad puntual pues P (X = x ) = 0 si X es continua. En este caso solo tiene sentido calcular probabilidades para un intervalo según la expresión b
P (a ≤ X ≤ b ) =
a
f X (x ) dx
PMF y PDF
De la expresión anterior se desprende que P (a ≤ X ≤ b ) = F X (b ) − F X (a)
Notemos que P (a < X < b ) = P (a < X ≤ b ) = P (a ≤ X < b ) = P (a ≤ X ≤ b )
Con todo lo anterior podemos probar que para la distribución logística descrita anteriormente, su función de densidad de probabilidad viene dada por e −x f X (x ) = (1 + e −x )2
PMF y PDF Theorem
Una función f X (x ) es una pmf (o una pdf) de una variable aleatoria X si y solo si:
f X (x ) ≥ 0 para todo x . ∞
f (x ) = 1 (pmf), o bien X
x
f X (x ) dx = 1 (pdf)
−∞
La expresión “ X tiene una distribución de probabilidad dada por f X (x )” suele abreviarse simbólicamente como “ X ∼ f X (x )”. De igual forma puede interpretarse “ X ∼ F X (x )”. Para indicar que X e Y están idénticamente distribuidas, suele anotarse “ X ∼ Y ”.