Tema 63 – Frecuencia y probabilidad. Leyes del azar. Espacio probabilístico.

Tema 63 – Frecuencia y probabilidad. Leyes del azar. Espacio probabilístico.

1. Introducción.

2. Probabilidad Clásica o A Priori.

3. Probabilidad a Posteriori o Frecuencial.

4. Modelos de Probabilidad.

5. Conjuntos de Puntos.

6. Desarrollo Axiomático de Probabilidad.

7. Espacio Muestral Discreto con un Número Finito de Puntos.

8. Primeras Propiedades de la Familia de sucesos S.

9. Límites en S.

10. Propiedades de la Función de Probabilidad P.

11. Propiedades de Límite. Bibliografía Recomendada.

1. INTRODUCCIÓN.

Uno de los instrumentos fundamentales de la Estadística es la Probabilidad, que tuvo sus orígenes en los juegos de azar, en el siglo XVII.

Los juegos de azar, como implica su nombre, incluyen acciones tales como girar la rueda de una ruleta, lanzar dados, tirar al aire una moneda, extraer una carta, etc., en las cuales el resultado es incierto. Sin embargo, es sabido que, aun cuando el resultado de una prueba en particular sea incierto, existe un resultado que se puede predecir a largo plazo.

En la ciencia experimental se presenta también un tipo similar de incertidumbre y regularidad a largo plazo. Así, por ejemplo, en genética es incierto saber si un descendiente será macho o hembra, pero en un plazo largo se conoce aproximadamente el porcentaje de descendientes que serán machos y el de aquellos que serán hembras.

Examinaremos en primer lugar la teoría clásica de la probabilidad, o sea de la probabilidad a priori, luego expondremos la teoría frecuencial y, finalmente, desarrollaremos un modelo axiomático.

2. PROBABILIDAD CLÁSICA O A PRIORI.

La relación entre la probabilidad y los juegos de azar sugirió la definición clásica. Así, por ejemplo, supongamos que queremos hallar la probabilidad de obtener cara en el lanzamiento de una moneda ideal. Razonamos de la siguiente forma: puesto que sólo existen dos resultados posibles, cara y cruz, y dado que la moneda está bien equilibrada, cabe esperar obtener cara y cruz con la misma frecuencia, aproximadamente; por tanto, en un gran número de pruebas, es de esperar que se obtendrá cara alrededor de la mitad de las veces, y así, la probabilidad del suceso “obtener cara” estará dada por el valor ½. Esta clase de razonamiento sugirió la definición:

DEF Si un suceso puede ocurrir de n maneras mutuamente excluyentes e igualmente verosímiles y si nA de éstas poseen un atributo A, la probabilidad de A es la fracción

clip_image002nA .

n

La aplicación de esta definición no siempre resulta inmediata. Veamos que significa eso de “mutuamente excluyentes” y de “igualmente verosímiles”. Supongamos que deseamos calcular la probabilidad de obtener dos caras lanzando una moneda dos veces. Podría razonarse que los resultados posibles son: Dos caras, dos cruces o una cara y una cruz. Pero este razonamiento es falso porque los tres resultados no son igualmente verosímiles o probables. El último de los tres puede obtenerse de dos formas diferentes. La probabilidad buscada es, por tanto, ¼ y no 1/3.

Si queremos calcular la probabilidad de obtener un As o una espada al extraer una carta de una baraja española, podemos razonar que tenemos 4 ases y 10 espadas, luego

la probabilidad sería

1 . Pero este razonamiento tampoco es correcto ya que los 14

clip_image003sucesos no son mutuamente excluyentes, puesto que existe un As de Espadas.

nA

clip_image004Observemos que la probabilidad es un número del intervalo [0,1], La razón

n

debe ser una fracción propia, ya que el total de resultados posibles no puede ser menor que el número de resultados con un determinado atributo. Si un suceso ha de ocurrir con seguridad, su probabilidad es 1. En cambio, si es seguro que no va a ocurrir, su probabilidad es cero.

Las probabilidades determinadas mediante la definición clásica se denominan probabilidades a priori. Como en cualquier otra rama de las matemáticas, trabajaremos con objetos ideales: monedas equilibradas, líneas de anchura cero, círculos perfectos, etc.

Existen varios inconvenientes en esta manera clásica de abordar el problema. Es obvio que la definición dada de probabilidad tendremos que modificarla de alguna manera cuando el total de resultados posibles sea infinito.

Por ejemplo, supongamos queremos calcular la probabilidad de que un número natural extraído al azar sea par. La respuesta intuitiva a esta cuestión es ½. Para justificar este resultado, tomaríamos los diez primeros naturales y calcularíamos la probabilidad, la cual sale ½. Luego lo haríamos con los 100 primeros, Después con los

1.000 primeros. Al final, lo hacemos con los 2N primeros naturales y tomamos límites en N. La razón seguiría siendo ½.

El argumento anterior y su respuesta son plausibles, pero su justificación rigurosa no es algo sencillo. Podemos darnos cuenta que el razonamiento anterior se basa en la ordenación de los números naturales. Si tuviésemos una ordenación diferente, no podríamos llegar a dicha respuesta.

La definición clásica de probabilidad suscita otra dificultad más grave aún que la que se presenta en el caso de un número infinito de resultados posibles. Supongamos que tenemos una moneda con una distribución de su masa tal que existe un sesgo a favor de las caras. Los dos resultados posibles al lanzar dicha moneda no son igualmente probables. ¿Cuál es entonces la probabilidad de obtener cara? La definición anterior no nos permite responder la pregunta.

Nos encontramos aún con otra dificultad al tratar de responder preguntas tales como

¿Cuál es la probabilidad de que un niño nacido en Madrid sea varón? ¿Cuál es la probabilidad de que una mujer muera antes de los 55 años? ¿Cuál es la probabilidad de que una bombilla pueda encenderse al menos 200 veces?

Desearíamos que todas estas preguntas tuvieran respuesta dentro del marco de al teoría de la probabilidad. Sin embargo, las cuestiones de “simetría”, “igualmente verosímiles”, etc. no pueden considerarse como lo serían en un juego de azar. Por tanto, tendremos que alterar o extender la definición de probabilidad.

3. PROBABILIDAD A POSTERIORI O FRECUENCIAL.

Supongamos que lanzamos una moneda 100 veces, la cual tomamos bien equilibrada y simétrica. Los resultados son 56 veces cara y 44 veces cruz. Un hecho importante en que la frecuencia relativa de caras tiende a estabilizarse en torno al valor

½. Esto sugiere que la frecuencia relativa obtenida podría utilizarse como una aproximación de la probabilidad de obtener cara con la moneda empleada.

Es razonable suponer que existe un número, que designaremos con p, que es la probabilidad de obtener cara. Si la moneda parece verdaderamente bien equilibrada y simétrica, podemos emplear la definición anterior para establecer que p es aproximadamente ½. Decir que p es igual a ½ es sólo una aproximación, puesto que para esta moneda en particular no podemos estar seguros de que los dos resultados sean igualmente verosímiles. Pero comprobados el equilibrio y la simetría de la moneda, parece razonable suponer que lo son.

Tomemos ahora una moneda desequilibrada, de tal forma que después de un examen estamos completamente seguros de que los dos sucesos, cara y cruz, no son igualmente verosímiles. Aun en estos casos, puede postularse la existencia de un número p como probabilidad de obtener cara, pero para hallar el valor de p no podremos aplicar la definición clásica. Tendremos que utilizar la teoría frecuencial.

Concretemos un poco más. Supongamos que podemos realizar observaciones (o experimentos) bajo condiciones completamente uniformes. Es decir, hecha la observación, se repite el suceso en condiciones análogas y se hace otra observación. al repetir esto muchas veces, aunque las condiciones sean siempre similares, existe una variación incontrolable que es “casual” o “aleatoria”, de forma que no es posible predecir el resultado de las observaciones individualmente. Esto sugiere que definamos un número p, llamado probabilidad del suceso, y que lo aproximemos por la frecuencia relativa con que aparece dicho suceso en las repetidas observaciones.

4. MODELOS DE PROBABILIDAD.

Uno de los objetivos de la ciencia consiste en predecir y describir sucesos del mundo en que vivimos. Una manera de hacerlo es construir modelos matemáticos que describan adecuadamente el mundo real. En la teoría de la probabilidad hacemos lo mismo. Construimos un modelo probabilístico que pueda utilizarse para describir sucesos del mundo que nos rodea.

Así, por ejemplo, puede desearse hallar una ecuación adecuada para predecir el sexo de cada nacido en cierta localidad. La ecuación sería muy compleja y no se ha descubierto ninguna. Sin embargo, puede construirse un modelo de probabilidad que, aunque no sea muy útil para tratar un suceso individual, sirva perfectamente par ocuparse de grupos de sucesos. Cabe entonces indicar la existencia de un número p que represente la probabilidad de que un nacido sea varón. A partir de esta probabilidad fundamental podemos responder a preguntas tales como: ¿Cuál es la probabilidad de que de diez nacidos, al menos tres sean varones? ¿Cuál es la probabilidad de que hay tres varones consecutivos en los próximos cinco nacimientos? Para contestar a este tipo de preguntas vamos a desarrollar un modelo idealizado de probabilidad.

Consideraremos una teoría de la probabilidad adecuada sólo para aquellas situaciones que pueden ser descritas por los resultados de experimentos conceptuales. Es decir, consideraremos únicamente aquellos sucesos cuya repetición sea concebible bajo condiciones semejantes.

También necesitamos que pueda enumerarse cada posible resultado de un experimento. Asociaremos probabilidades solamente con esos resultados. añadiremos, sin embargo, que aun cuando un resultado sea imposible puede ser incluido (su probabilidad es 0). Lo fundamental es recordar que ha de incluirse cada resultado que puede ocurrir.

DEF Cada resultado imaginable de un experimento conceptual, que puede repetirse bajo condiciones similares, será denominado un punto muestral, y la totalidad de los resultados imaginables se llamará espacio muestral, siendo denotado por W.

5. CONJUNTOS DE PUNTOS.

Vamos a definir ciertas operaciones sobre el conjunto de puntos que forman el espacio muestral y que son necesarias para posteriores estudios. Un conjunto de puntos, llamado a veces simplemente un conjunto, es una colección de elementos que tienen ciertas propiedades específicas.

Si s es un punto o un elemento que pertenece al conjunto W, escribiremos sÎW.

DEF Diremos que los conjuntos S1 y S2 son iguales si cada elemento de S1 es también un elemento de S2, y cada elemento de S2 lo es de S1. Es decir si S1 y S2 tienen exactamente los mismos puntos.

DEF Diremos que S1 es un subconjunto de W, y se denota por S1ÌW, si cada elemento de S1 es también un elemento de W.

DEF En cada aplicación de la teoría existirá un conjunto universal, el propio espacio muestral W, tal que todos los demás conjuntos que intervengan en el análisis son subconjuntos de W.

Algunas veces puede que no se indique explícitamente el espacio muestral, pero generalmente estará implícito en el contexto de la discusión.

clip_image005DEF El complemento de un cierto conjunto S1, respecto al espacio muestral W, será el conjunto de puntos que están en W pero no en S1. Se indicará por W–S1, o también por S1 .

DEF Llamaremos Conjunto Nulo a un cierto conjunto S1 que no contiene puntos. Se denotará por Æ.

DEF Un suceso A está definido en el espacio muestral W como un subconjunto A de puntos de W, y cuando decimos “probabilidad de que ocurra A” queremos decir “probabilidad de que aparezca cualquier punto de A”.

Si el espacio muestral contiene un continuo de puntos, no definiremos todo subconjunto como un suceso, sino sólo subconjuntos medibles.

DEF Sean S1 y S2 dos elementos de S. Llamaremos Unión de los sucesos S1 y S2, y se denota por S1ÈS2, al suceso formado por todos los puntos de S1 y todos los puntos de S2.

DEF Sean S1 y S2 dos elementos de S. Llamaremos Intersección de los sucesos S1 y S2, y se denota por S1ÇS2, al suceso formado por todos los elementos comunes a S1 y S2.

De las definiciones anteriores se desprenden los resultados siguientes, donde W es el espacio muestral, y S1 y S2, elementos de W.

PROP Se verifica:

clip_image006

1) W = Æ

2) Si S1 y S2 no tienen puntos comunes entonces S1ÇS2=Æ. 3) S1ÇW = S1

4) S1ÈW = S

clip_image007clip_image0085) W Ç S1 = W – S1 = S1

6) S1ÈS1 = S1

7) S1ÇS1 = S1

DEF Diremos que un espacio muestral W es discreto si verifica una de las dos condiciones siguientes:

1) Un número finito de puntos.

2) Un número infinito de puntos que pueden ponerse en correspondencia biunívoca con el conjunto de los números naturales.

DEF Diremos que un espacio muestral W es continuo si contiene un conjunto continuo de puntos.

6. DESARROLLO AXIOMÁTICO DE LA PROBABILIDAD.

En los apartados anteriores hemos visto los conceptos de probabilidad clásica y frecuencial que pueden ayudarnos a resolver importantes problemas de la ciencia experimental. Para coadyuvar a la solución de estos problemas vamos a desarrollar una teoría matemática de la probabilidad. En primer lugar, vamos a enunciar los axiomas que empleamos para desarrollar la teoría.

Supondremos un espacio muestral W cuyos elementos quedan, de momento, indeterminados. Asimismo, se supondrá fijada una familia S de subconjuntos del espacio W.

SÎÃ(W)

Aquí Ã(W) es el conjunto de las partes de W, es decir, la familia formada por todos los subconjuntos de W. Por tanto

AÎÃ(W) equivale a AÌW

Finalmente supondremos dada una función P de dominio S que toma valores reales.

DEF Diremos que la terna (W,S,P) es un Espacio de Probabilidad en W, o Distribución de Probabilidad en W, si verifica las condiciones siguientes, estando las tres primeras referidas a S y las tres últimas a P:

S1) WÎS

clip_image009S2) AÎS Þ A ÎS S3) AkÎS “kÎN Þ

¥

lJ Ak Î S

=

k 1

P1) P(A) es un número real tal que P(A)³0 para todo suceso A de S. P2) P(W)=1

P3) Si S1 y S2 son dos sucesos de S mutuamente excluyentes (S1ÇS2=Æ) entonces P(S1ÈS2) = P(S1) + P(S2).

Estos axiomas, que usaremos para desarrollar el modelo idealizado de probabilidad, están motivados por las definiciones de probabilidad clásica y frecuencial.

Veamos ahora algunos teoremas que son resultado directo de los axiomas anteriores.

TEOREMA

Sea W un espacio muestral y P una función de probabilidad en W. La probabilidad

clip_image010de que no ocurra el suceso A es 1–P(A). Se escribe como P( A) =1 – P( A)

Dem.

clip_image011 clip_image011[1]

Sabemos que

A Ç A = Æ

y que

A È A = W .

clip_image011[2]

Aplicando el axioma 2 tenemos que 1 = P(W) = P(A È A)

clip_image011[3] clip_image011[4]

Y aplicando el axioma 3, 1 = P(W) = P( A È A) = P( A) + P( A)

clip_image011[5]

con lo que P( A) =1 – P( A) , quedando así demostrado.

TEOREMA

Sea W un espacio muestral con función de probabilidad P. En tal caso 0£P(A)£1 para cualquier suceso A de S.

Dem.

Por el axioma 1, P(A)³0

Y aplicando el teorema anterior, como

clip_image010[1]P( A) =1 – P( A)

verificando que

clip_image012P( A) ³ 0

entonces necesariamente se debe dar que

P(A)£1

TEOREMA

Sea W un espacio muestral con una función de probabilidad P. entonces P(Æ)=0. Dem.

clip_image013La conclusión se obtiene de forma inmediata sin más que tener en cuenta que S = Æ

7. ESPACIO MUESTRAL DISCRETO CON UN NÚMERO FINITO DE PUNTOS.

En ciertos tipos de problemas, entre los cuales los juegos de azar constituyen ejemplos notables, el espacio muestral contiene un número finito, n, de puntos, y la

probabilidad asignada a cada punto es

1 . Es decir, en ciertos problemas existe un

clip_image014n

número finito de ordenaciones, y es totalmente realista suponer que la probabilidad de

cada ordenación es

1 . En general, es suficiente para estos problemas la definición

clip_image015n

clásica, y pueden utilizarse los métodos combinatorios para la enumeración de las

ordenaciones.

DEF Sean s1, s2, …, sn los n puntos muestrales de un espacio muestral discreto W. Diremos que la función P es una función de probabilidad de sucesos igualmente verosímiles si satisface las condiciones siguientes:

1

clip_image0161) P(s1)=P(s2)=…=P(sn)= .

n

2) Si A es un suceso que contiene nA cualesquiera puntos muestrales, entonces

n P( A) = A .

n

La primera condición afirma que cada uno de los n puntos muestrales es igualmente

clip_image017verosímil y, por tanto, que su probabilidad en 1 .

n

La segunda condición establece que la probabilidad de un suceso que contenga nA

nA

clip_image018de los n puntos muestrales es .

n

Es fácil comprobar que esta definición cumple los tres axiomas anteriores y es, por tanto, una función de probabilidad.

8. PRIMERAS PROPIEDADES DE LA FAMILIA DE SUCESOS S.

En lo que sigue supondremos dado un espacio de probabilidad cualquiera (W, S, P) al cual se referirán todos los conceptos que desarrollemos.

La propiedad S2 de la familia de sucesos S se expresa diciendo que S es una familia de conjuntos cerrada por la operación de complementario. La propiedad S3 significa que S es cerrada por uniones numerables.

Las tres propiedades que contienen los axiomas S1, S2 y S3 caracterizan las familias de conjuntos que se llaman s-álgebras en W. Veamos a continuación las primeras consecuencias de estos axiomas.

PROP1 El conjunto vacío pertenece a la familia S, ÆÎS Dem.

clip_image006[1]Como Æ = W, resulta lo que se desea de S1 y S2.

PROP2 La familia S es cerrada por uniones finitas. Es decir, si AkÎS con 1£k£n

n

entonces

lJ Ak Î S . En particular, si A,BÎS se verifica que AÈBÎS.

=

k 1

Dem.

Podemos aplicar S3 donde tomamos Ak=Æ para k>n, obteniendo el resultado pedido.

PROP3 La familia S es cerrada por intersecciones finitas. O sea, si AkÎS para 1£k£n

n

entonces

t1 Ak Î S . en particular, si A,BÎS se verifica que AÇBÎS.

=

k 1

Dem.

clip_image019Como se tiene que

Ak Î S , resulta de la proposición anterior que

n

clip_image020lJ Ak Î S

=

k 1

y al

tomar complementarios se obtiene el resultado deseado.

PROP4 La familia S es cerrada por intersecciones numerables. Es decir, si AkÎS

¥

para k:1,2,… entonces

t1 Ak Î S .

=

k 1

Dem.

Similar a la anterior.

DEF Dados dos conjuntos A y B, llamamos diferencia simétrica de A y B, y se representa por ADB, al conjunto ADB=(A–B)È(B–A).

PROP5 La familia S es cerrada por diferencias ordinarias y diferencias simétricas. O sea,

1) AÎS, BÎS Þ A–BÎS

2) clip_image021AÎS, BÎS Þ ADBÎS Dem.

1) Como para la diferencia de dos conjuntos se tiene que primera parte de la tesis de la Proposición 3.

A B = A Ç B

obtenemos la

2) Teniendo en cuenta 1) y la proposición 3 obtenemos el resultado.

Como resumen de las propiedades vistas en este apartado, podemos decir que la s- álgebra S es Cerrada por las operaciones de Complementario, Diferencia y Diferencia simétrica, así como por uniones o intersecciones de un conjunto contable de sucesos.

En casos particulares, operando con conjuntos no numerables de sucesos el resultado puede ser un suceso.

DEF Diremos que una sucesión (An) de sucesos es Monótona Creciente si se cumple que AnÌAn+1 para todo n.

DEF Diremos que una sucesión (An) es Monótona Decreciente si An+1ÌAn para todo n.

DEF Diremos que la familia {AtÌW: tÎI}, donde I es un intervalo de la recta real, es una familia Monótona Creciente si

t1,t2ÎI, con t1<t2 Þ

A Ì A

t t

1 2

DEF Diremos que la familia {AtÌW: tÎI}, donde I es un intervalo de la recta real, es una familia Monótona Decreciente si

t1,t2ÎI, con t1<t2 Þ

A É A

t t

1 2

PROP6 Si {At :tÎ(a,b)} es una familia de sucesos monótona creciente, para cualquier sucesión

1) (xn) tal que se tiene

a < xn < xn+1 “n y

¥

lJ At = lJ Axn

Lim xn = b

n

Î S

2) (yn) tal que

a<t <b

n=1

vale

b > yn > yn+1 “n

¥

Lim yn = a

n

t1 At = t1 Ayn Î S

Dem.

a<t <b

n=1

1) Es inmediato ver que el segundo miembro de la igualdad está contenido en el primero.

¥

lJ At É lJ Axn Î S

a<t <b n=1

Veamos la inclusión contraria,

Dado

t‘Î(a, b)

$n‘ / xn‘ > t

por lo que

y como t’ es arbitrario obtenemos

n

At ‘ Ì Ax

¥

Ì lJ Axn

=

n 1

¥

lJ At Ì lJ Axn Î S

a<t <b n=1

De las dos inclusiones anteriores obtenemos la igualdad a demostrar.

2) La demostración la vamos a realizar de forma análoga.

En primer lugar, es inmediato ver que

¥

t1 At Ì t1 Ayn Î S

a<t <b n=1

Para comprobar la inclusión contraria

por lo que

Dado

t ‘Î(a, b)

¥

$n‘ / yn‘ < t

n

y por ser t’ arbitrario

At ‘ É Ay

É t1 Ayn Î S

=

n 1

¥

t1 At É t1 Ayn Î S

demostrando así la igualdad.

a<t <b

n=1

PROP7 Si {At :tÎ(a,b)} es una familia de sucesos monótona decreciente, para cualquier sucesión

3) (xn) tal que se tiene

a < xn < xn+1 “n y

Lim xn = b

n

¥

t1 At = t1 Axn Î S

4) (yn) tal que

a<t <b

n=1

vale

b > yn > yn+1 “n

¥

Lim yn = a

n

lJ At = lJ Ayn Î S

Dem.

a<t <b

n=1

clip_image022

Definiendo

Bt = At , la familia {Bt :tÎ(a,b)} es monótona creciente y se le puede

aplicar el teorema anterior. Al tomar complementarios en las relaciones que se obtienen para los sucesos Bt, conseguimos las igualdades a demostrar.

9. LÍMITES EN S.

Dada una sucesión (An) de conjuntos de W, podemos definir los siguientes nuevos conjuntos.

DEF Llamamos Límite Inferior de la sucesión (An)ÌW al conjunto

Lim An ={w: para algún n, y “j³n wÎAj}

_____

DEF Llamamos Límite Superior de la Sucesión (An)ÌW al conjunto

______

j

Lim An ={w:Para alguna sucesión de enteros n1<n2<n3<… y “j³1 vale wÎ An }

Podemos decir que el Límite Inferior está formado por los elementos w que pertenecen a todos los Aj desde uno en adelante. En cambio, el Límite Superior está formado por los elementos que pertenecen a infinitos Aj.

PROP Se verifica:

¥

1)

lJ t1

Lim An = Ap

______ n=1 p³ n

______ ¥

2)

= ³

Lim An = t1 lJ Ap

n 1 p n

Dem.

Inmediatas a partir de la definición.

DEF Diremos que existe el Límite de An si los límites superior e inferior son iguales y se escribe

LimAn

____

= Lim An = Lim An

____

PROP El límite inferior y superior de una sucesión de sucesos es un suceso. Por tanto, cuando existe el límite de una sucesión de sucesos, dicho límite es también un suceso.

Dem.

La primera parte es consecuencia de la fórmulas demostradas en la última proposición. La segunda parte es obvia.

PROP Se verifican las siguientes relaciones:

____

1) Lim An Ì Lim An

____

clip_image023

æ ö

____

2) clip_image024ç Lim An ÷ = Lim An

è ____ ø

clip_image023[1]

clip_image025æ ____ ö

3) ç Lim An ÷ = Lim An

è ø ____

Dem.

1) Se obtiene de forma inmediata a partir de las definiciones.

2) y 3) se obtienen a partir de los resultados de la primera proposición de este apartado, sin más que utilizar las leyes de Morgan.

Las sucesiones monótonas son convergentes, es decir, tienen límite.

Comprobémoslo

PROP Se verifica:

1) Si la sucesión (An) es monótona creciente entonces existe

Lim

n

¥

An = lJ An

=

n 1

2) Si la sucesión (An) es monótona decreciente entonces existe

Lim

n

¥

An = t1 An

=

n 1

Dem.

La demostración se obtiene fácilmente.

10. PROPIEDADES DE LA FUNCIÓN DE PROBABILIDAD P.

La función de probabilidad es No Negativa por el axioma P2. Y por el axioma P3 la función P es numerablemente aditiva, o también llamada s-aditiva.

Veamos las primeras consecuencias de los tres axiomas que satisface la función P.

PROP1 El suceso vacío, Æ, es un suceso de probabilidad cero o suceso nulo.

Dem.

Llamando a=P(Æ) y aplicando P3 con An=Æ para todo n, obtenemos

a = a + a + a + … igualdad que solamente es cierta si a=0.

PROP2 P es Finitamente Aditiva. Es decir, si los conjuntos AjÎS para j:1,2,…,n son disjuntos, entonces:

æ n ö n

PçlJ Aj ÷ = å P( Aj )

En particular

ç

è j =1

÷

ø j=1

AÎS, BÎS, AÇB=Æ Þ P(AÈB) = P(A) + P(B)

Dem.

Tomando en el axioma P3 los conjuntos Aj del enunciado para j:1,2,…,n y Aj=Æ para j>n, el enunciado de P3 se convierte en la igualdad del teorema.

Al ser P finitamente aditiva y numerablemente aditiva, podemos decir que P es Contablemente Aditiva.

PROP3 Si AÎS, BÎS, AÌB, entonces se tiene que

1) P es Sustractiva. Es decir, P(B–A) = P(B) – P(A)

2) P es Monótona. Es decir, P(A) £ P(B) Además, “AÎS

3) P(A) £1

clip_image0264) P( A)1 – P( A)

Dem.

1) Teniendo en cuenta la hipótesis AÌB podemos deducir

B = AÈ(B–A) y AÇ(B–A) = Æ

y de aquí obtenemos y de aquí

P(B) = P(A) + P(B–A)

P(B–A) = P(B) – P(A)

2) Teniendo en cuenta que P(A)³0 para todo suceso A de S, tenemos que P(B–A)³0, obteniendo fácilmente la expresión a demostrar.

3) y 4) se deducen de las expresiones 1) y 2) ya demostradas sin más que tomar B = W.

PROP4 P es Finitamente Subaditiva. Es decir, para n sucesos cualesquiera Aj, con j:1,2,…,n se verifica:

æ n ö n

PçlJ Aj ÷ £ å P( Aj )

En particular

ç

è j =1

÷

ø j =1

AÎS, BÎS Þ P(AÈB) £ P(A) + P(B)

Dem.

Para poder realizar la demostración, definimos los conjuntos Bj como sigue

B1 = A1 y

j-1

B j = Aj – lJ Ak

=

k 1

con

2 £ j £ n

Los conjuntos que acabamos de definir verifican las siguientes propiedades:

1) BjÌAj, por la propia definición.

2) Los Bj son todos ellos disjuntos, ya que si h<i se tiene BhÌAh y

clip_image027Bi Ì Ai

n n

3) lJ Aj = lJ Bj

j=1 j=1

Comprobemos que, efectivamente, se verifica la tercera de las propiedades. Para ello, hemos de comprobar las dos inclusiones.

n n

La inclusión

lJ Aj Ì lJ B j

se verifica a partir de la primera de las propiedades.

j=1 j =1

Para demostrar la inclusión contraria, lo que vamos a comprobar es

n

=

coÎlJ Aj

j 1

Si wÎA1=B1, y resulta evidente.

n

=

Þ coÎlJ B j

j 1

Si wÏA1, existirá un cierto j tal que wÎAj y wÏAk para k<j. Entonces wÎBj y por tanto pertenece a la unión de ellos, tal y como queríamos ver.

Una vez probadas estas propiedades, podemos demostrar la proposición de la siguiente forma:

æ n ö æ n ö n n

PçlJ Aj ÷ = PçlJ B j ÷ = å P( B j ) £ å P( Aj )

ç ÷

è j =1 ø

ç

è j =1

÷

ø j=1

j =1

PROP5 P es Numeráblemente Subaditiva. Es decir, para cualquier sucesión de sucesos (An) se tiene

æ ¥ ö ¥

PçlJ An ÷ £ å P( An )

Dem.

è n =1

ø n=1

Al igual que hemos hecho en la demostración de la proposición anterior, introducimos los conjuntos Bn definidos de la misma forma y, por tanto, verificando las mismas propiedades. Entonces

æ ¥ ö

æ ¥ ö ¥ ¥

PçlJ An ÷ = PçlJ Bn ÷ = å P( Bn ) £ å P( An )

è n =1 ø

è n =1

ø n=1

n =1

PROP6 Para dos sucesos cualesquiera A y B se verifica

P(AÈB) = P(A) + P(B) – P(AÇB)

Dem.

Podemos establecer las cuatro relaciones siguientes AÈB = AÈ(B–A) AÇ(B–A) = Æ

B = (AÇB)È(B–A) (AÇB)Ç(B–A) = Æ

las cuales nos permiten escribir

P(AÈB) = P(A) + P(B–A) y P(B) = P(AÇB) + P(B–A)

De ambas expresiones, eliminando P(B–A) obtenemos lo que queremos demostrar.

PROP7 Sean A1, A2, …, An n sucesos cualesquiera. Entonces

æ n ö n

æ n ö

PçlJ A

÷ = å P( A ) –

å P( A

Ç A ) +

å P( A Ç A

Ç A ) + () + (-1) n-1 Pçt1 A ÷

ç j ÷

è j =1 ø

j=1

j i

i < j £n

j i j k

i < j <k £n

ç j ÷

è j=1 ø

Dem.

Vamos a realizar la demostración por inducción en el número de sucesos.

Supongamos que tenemos n+1 sucesos.

Para n=2 la expresión anterior se convierte en la tesis de la prop6. Sea válida la expresión a demostrar, para n sucesos.

lJ

Para n+1 tenemos

æ n +1 ö æ n ö

æ n ö

lJ

lJ

Pç A

÷ = Pç

A ÷ + P( A

) – Pç

A Ç A ÷

ç j ÷

è j =1 ø

ç j ÷

è j =1 ø

n+1

ç j

è j=1

n+1 ÷

ø

Aplicando ahora la suposición de ser cierto para n sucesos completamos la demostración por inducción.

PROP8 Se verifica:

1) Si los sucesos Aj con 1£j£n son sucesos nulos entonces la unión de todos ellos es un suceso nulo.

2) Si los sucesos Aj con 1£j£n son sucesos casi seguros entonces la intersección de todos ellos es un suceso casi seguro.

Dem.

1) Para la demostración, basta tener en cuenta la prop4 en la que vimos que P era subaditiva.

æ n ö n

PçlJ Aj ÷ £ å P( Aj ) = 0

ç

è j =1

÷

ø j =1

2) Para esta parte tomamos complementarios y aplicamos el caso anterior.

PROP9 Se verifica:

1) Si (An) es una sucesión de sucesos nulos, entonces su unión es un suceso nulo.

2) Si (An) es una sucesión de sucesos casi seguros, entonces su intersección es un suceso casi seguro.

Dem.

La demostración es igual que la de la proposición anterior, pero utilizando el resultado obtenido en la prop5.

11. PROPIEDADES DE LÍMITE.

PROP1 Se verifica:

1) P es Continua Inferiormente. Es decir, dada una sucesión monótona creciente (An) se verifica que

A

æ ¥ ö

Lim P( An ) = Pç n ÷

n

n èlJ=1 ø

2) P es Continua Inferiormente. Es decir, dada una sucesión monótona decreciente (An) se verifica que

A

æ ¥ ö

n

Lim P( An ) = Pç n ÷

Dem.

n èt1=1 ø

1) En el caso de ser la sucesión monótona creciente podemos escribir

¥ æ ¥ ö

lJ An = A1 È çlJ ( An+1 – An ) ÷

n=1

è n =1 ø

verificando los sucesos del segundo miembro que son disjuntos. Por tanto

ö

å

æ ¥ ö æ æ ¥ ö ¥

Pç A

÷ = Pç A È ç

( A A

) ÷÷

P( A )

P( A A )

lJ

ç n ÷

è n =1 ø

ç 1 ç

è è n=1

lJ

n+1

n ÷÷ =

øø

1 +

n= 2

n+1 – n =

æ k ö

æ æ æ k

ööö

Lim

P( A1 )

å P( An+1

An )

Limç Pç A1

çlJ ( An+1

An ) ÷÷÷ = Lim P( An )

= ç

k ®¥ è

+

n= 2

– ÷ =

ø

ç ç

k ®¥ è è

È ç

è n= 2

– ÷÷÷

øøø n

2) Si la sucesión (An) es monótona decreciente, la formada por los sucesos complementarios es monótona creciente y tenemos

æ ö

¥

clip_image028PçlJ An ÷ = Lim P( An ) = Lim (1 – P( An ))

è n =1 ø n n

y de aquí obtenemos de forma inmediata la expresión que queremos demostrar.

PROP2 Si (An) es una sucesión de sucesos cualesquiera, se verifica

Pæ Lim A

ö £ Lim P( A

______

) £ Lim P( A

æ ______ ö

) £ P Lim A

Dem.

ç n ÷

è ______ ø

______ n

n ç n ÷

è ø

De las relaciones

t1 Ap Ì An Ì lJ Ap

resulta

p³ n

æ ö

ç ÷ £

p³ n

æ ö

lJ

£ ç ÷

t1

Pç

è p³ n

Ap ÷

ø

P( An )

Pç

è p³ n

Ap ÷

ø

Si definimos las sucesiones (Bn) y (Cn) como

Bn = t1 Ap

³

p n

Cn = lJ Ap

³

p n

podemos comprobar que son monótonas, y aplicando la prop1 obtenemos

æ ö

Lim P(Bn ) = PçlJ Bn ÷ = Pçæ Lim An ÷ö £ Lim P( An ) £

n è n

ø è ______

ø ______

______

æ ______ ö æ ö

£ Lim P( An ) £ Pç Lim An ÷ = Pçt1 Cn ÷ = Lim P(Cn )

è ø è n ø n

PROP3 P es Continua. Es decir, si (An) es una sucesión de sucesos convergente, tiene límite, entonces existe

Lim P(An) = P(Lim An)

Dem.

La demostración es inmediata con sólo aplicar la proposición anterior.

Aclaración. En la siguiente proposición vamos a utilizar el concepto de Límite Lateral. Para cualquier función real f usaremos las notaciones

Lim f (t) =

t ®c +

f (c+)

Para el límite lateral por la derecha en t=c.

Lim f (t) =

t ® c

f (c-)

Para el límite lateral por la izquierda en t=c

Recordemos la siguiente propiedad que relaciona el límite aritmético y el límite funcional.

PROP Para una función real f definida al menos en (a, a+h) son equivalentes las dos condiciones siguientes:

1) Lim f (t ) = c

t ®a +

2) Para cada sucesión (tn) con a < tn < a+h y tn®a se verifica

Lim f (t n ) = c

n ®¥

Análoga propiedad podemos demostrar para el límite lateral por la izquierda.

PROP4 Sea {At : tÎ(a,b)} una familia de sucesos monótona creciente. Entonces:

t ç

A

t ç

A

t

t ÷

t ÷

t

1) Lim P( A ) = Pæ ö 2) Lim P( A ) = Pæ ö

è >

t ®b

èlJ<b ø

t ®a +

t1a ø

Si la familia de sucesos {At : tÎfR} es monótona creciente, se tiene de forma análoga:

t ç

A

t ç

A

t

t

t ÷

t ÷

1) Lim P( A ) = Pæ ö 2) Lim P( A ) = Pæ ö

t ® +¥

è lJÎÂ ø

t ® -¥

è t1ÎÂ ø

Dem.

Vamos a demostrar las dos primeras, ya que la segunda parte es análoga.

1) La función f: (a,b) ® fR definida por f(t) = P(At) es una función monótona acotada por lo que existen los límites.

Si xn es una sucesión monótona estrictamente creciente con límite b resulta inmediatamente, por la relación entre el límite aritmético y funcional, y el resultado de la prop6 del apartado 8

æ ¥ ö æ ö

n

Lim P( At ) = Lim P( Ax ) = Pç

A ÷ = Pç

x

t

n

At ÷

n

t ®b

n®¥

èlJ=1

ø è lJ< b ø

3) La demostración de esta expresión se realiza de forma análoga.

PROP5 Sea {At : tÎ(a,b)} una familia de sucesos monótona decreciente. Entonces:

t ç

A

t ç

A

t

t ÷

t ÷

t

1) Lim P( A ) = Pæ ö 2) Lim P( A ) = Pæ ö

è >

t ®b

èt1<b ø

t ®a +

lJa ø

Dem.

Se puede obtener de la proposición anterior utilizando sucesos complementarios.

BIBLIOGRAFÍA RECOMENDADA.

Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez.

Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM.