ESTADISTICA 1

Estadística/Introducción

Qué es estadistíca?

Promedio diario de la firma Dachs AG en enero del 2005. Horizontal: Dias de enero, Vertical: la cantidad media de cada dia.
Encontramos la estadística en cualquier aspecto de la vida cotidiana:
  • El coste de vida se incremento en dos puntos porcentuales frente al año pasado.
  • En enero 2005 la firma Dachs obtuvo en promedio diario de sus cotizaciones tal y como indica la figura.
  • El recuento de votos de una elección.
  • Cuántos ganadores pueden haber en el Lotto, con eso ¿cuánto es el sobrante?
¿Qué tienen estos ejemplos en común? Éstos se basan en datos y son en realidad muchos datos. En éstos datos se necesita un orden: con el gráfico, con la probabilidad, con el cálculo del promedio, con la comparación. Ésto es la aplicación de la estadística.

Con eso podemos dar una definición de la estadística, relativamente corta y sobria, pero en esencia lo dice todo:
La estadística es el conjunto de métodos, que se puede aplicar para el estudio de cantidades de datos.
La meta de la estadística es también reducir y comprimir cantidades de datos para hacer visibles leyes y estructuras de datos.

Aplicaciones en un contexto económico

La mayoría de las conversaciones de hoy en día es sobre la globalización, la competencia y la presión de los precios. Una sola decisión del gerente puede conducir a la ruina de una compañía. Los análisis económicos y empresariales propician racionales y fundadas decisiones para la compañía. En la realidad son poco conocidas las informaciones sobre los procesos en las empresas. Así podríamos citar algunos ejemplos
  1. Las informaciones son muy complejas para volverse completamente exaltadas. Ejemplo: La necesidad de papel en una gran empresa depende de muchos factores, como el número de copias realizadas, la tendencia de los empleados a dejarles imprimir todo lo que quieren, el volumen de distribución para cada empleado, etc. No se puede estimar un análisis.
  2. Números futuros para la empresa son desconocidos y pueden volverse apreciados, p.e. el Cah-Flow de una inversión planeada para el cálculo de su financiamiento.
  3. La influencia del ambiente no puede predeterminarse, el "peligro" de un aumento de impuestos o la aceptación de un nuevo producto para los clientes.
En todos los casos se podría considerar decisiones exactas fundamentadas. Las soluciones resultantes son "poco claras". Una ayuda para la decisión sobre la inseguridad es la estadística.
Porque están disponibles en las empresas actuales información basada en pocos o muchos datos, la estadística gana cada vez mas significado como herramienta de búsqueda de decisiones.

Clasificación de métodos estadísticos

  1. Estadística descriptiva (descrita y empírica): Se analiza un fenómeno y se resumen los datos, se ordenan, se representan gráficamente. Carece de visión científica.
  2. Estadística inductiva o inferencial (cerrada, continua, matemática, analítica): Se basa en la teoría de probabilidades. Los resultados de la estadística descriptiva sirven frecuentemente como puntos de partida para visiones generalizadas.
La estadística matemática en si misma es, como la teoría de probabilidades, una parte de la estocástica.




-----------------------------------------------------------------------------------------------

Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad

 Ejemplo del "pedazo de pizza" para conceptualizar la probabilidad

Harry y Paula van a una pizzeria. Ellos están recién empezando una relación. Paula ordena la mitad de su pizza con salami y Harry con jamón. Luego ellos comparten su pizza, en lo que notan que dejan de compartir un pedazo de afuera o un pedazo central de la pizza. Sin embargo, a Harry que normalmente le gusta mas lo de afuera, no se preocupa de eso en su actual situación. Y también paula deja su mitad de afuera por casualidad. Cuán grande es verdaderamente la probabilidad, que Harry tenga dos pedazos de pizza de su preferencia del total?

Pedazos de Pizza
La respuesta correcta sería 1/4. Pero porque obtenemos la probabilidad precisamente de 1/4?
Obtenemos un proceso: Para inicios iguales (condición compleja) se puede intentar intercambiando dos mitades de los pedazos aleatoriamente, haciendolo repetidamente frecuente a voluntad. Cada ocasión tiene un desenlace incierto. Se trata aqui de una operación aleatoria (experimento, intento).
La operación aleatoria se puede tambien describir a través de:
  • Iguales condiciones complejas
  • Desenlace incierto
  • Repetidamente frecuente a voluntad
Un determinado par de mitades de pedazos del plato de Harry es un resultado. Un resultado sería por ejemplo: la primera mitad es un pedazo del borde, y el segundo pedazo es uno de la mitad,
(R;M) o solo RM (R para el borde y M para la mitad)
donde la parte "izquierda" le corresponderia a Harry y la "derecha" a Paula.
Todos los pares posibles se resumen en el Conjunto solución Ω:
Ω es también el conjunto de todas las posibles soluciones que se puedan presentar en un proceso aleatorio. Se lleva a cabo este proceso frecuentemente infinito, debíendo resultar presumiblemente en un 25% de todos los intentos dos pedazos de la mitad. Luego se podría con eso indicar que cada uno en la pareja tiene la misma probabilidad de sacar un pedazo. El número del resultado, llamado |Ω|, es cuatro. Por eso es la probabilidad para un par de pedazos del borde
P(RR) = \frac{1}{4}\;.
Si ahora resulta para un intento de ejemplo "RM", esto es un acontecimiento.
Para un "RM" se trata de un acontecimiento elemental. Es un acontecimiento que solo contiene un elemento en el conjunto de resultados.
Hay tambien complicados acontecimientos compuestos:
A: Al menos un pedazo de la mitad: A = {RM, MR, MM}
B: Un pedazo completo: B = {RM, MR}
Estos acontecimientos incluyen mas resultados de Ω; un acontecimiento es siempre un subconjunto de Ω.

La probabilidad como concepto teórico

Pequeña historia general

Hay ahora aplicadas tantas probabilidades como Homo Sapiens existen. El último día de la batalla en el bosque de Teutoburger (9 d.n.e.) había una tormenta. Los romanos interpretaron eso como un aviso ejemplar de Mercuirio, el dios del relámpago y del trueno. Los germanos miraban eso como el aliento se Tor, dios de la guerra. Como se conoce, tenían ambas partes la razón.
En el siglo 17, la época del racionalismo, Blaise Pascal (1623 - 1662) se ocupaba sistemáticamente de la probabilidad de un juego de azar y asi fundamentó el cálculo de probabilidades como una disciplina autónoma.
Jakob Bernoulli (1654 - 1705) se interesaba asimismo de las preguntas de la probabilidad discreta y publicó su primer libro sobre cálculo de probabilidades.
Con Abraham de Moivre (1667 - 1754) y Pierre Simon Laplace (1749 - 1827) se descubrió pronto la distribución normal y Carl Friedrich Gauß (1777 – 1855) continúo su desarrollo.
Richard Edler von Mises (1883 - 1953) proporcionó artículos con mucho valor para el cálculo de las probabilidades y de la matemática estadística.
En 1933 el matemático ruso Andrej Nikolajewitsch Kolmogorow (1903 - 1987) propusó una definición axiomática de probabilidad, de la que se basa la actual teoría de probabilidades. Esta definición es una aplicación de la teoría de medidas.

Resultados y Acontecimientos

El concepto actual del cálculo de probabilidades se presenta del siguiente modo:
Dado el Conjunto solución (Espacio de eventos, espacio de pruebas) Ω de un suceso aleatorio. Éste conjunto contiene todas las posibles soluciones que un suceso aleatorio puede dar. Dependiendo del tipo de suceso aleatorio se puede contemplar diferentes conjuntos solución:
Ω contiene muchas fínitas soluciones.
Ejemplos:
  • Suceso aleatorio: lanzar los dados. Ω = {1, 2, 3, 4, 5, 6}
  • Suceso aleatorio: color de ojos de la siguiente persona que se presenta en un casting. Ω = {azules, verdes, cafés, negros}.

Ω contiene un infinito contable de muchos resultados.
Ejemplos:
  • Suceso aleatorio: número de autos que a las 12 del medio dia conducen por un contador de autos en un determinado lugar. Ω = {0, 1, 2, 3, ...}.
  • Suceso aleatorio: número de requisitos en un servidor en una hora. Ω = {0, 1, 2, .....}.
Se puede contabilizar los resultados pero no se puede designar ningun razonable limite superior, por eso se deja el límite superior abierto.

Ω contiene muchos incontables resultados. Se podría tambien decir, el conjunto de los resultados es un intervalo en los números reales.
Ejemplos:
  • Suceso aleatorio: una persona adulta sera pesada (en kg). Ω = {x|30 ≤ x ≤ 200; x ∈ R}.
  • Suceso aleatorio: el cash-flow de una compañia (en €). Ω = R.
el Cash-flow se describe como la diferencia entre ingresos - egresos.
Aqui no se puede mas contar los resultados. Un pequeño intervalo cualquiera del conjunto solución contiene infinito número de elementos. Cual es el siguiente elemento de 50 kg: 51 kg, 50,01kg o 50,00000001 kg? En el intervalo [50, 51] exiten infinito número de elementos.
Se podría aqui objetar que aun en el ejemplo del Cash-flow un centavo sería la menor unidad, que es sencillamente contable. Por supuesto, pero cuando son muchos elementos cercanos reunidos se facilita el análisis se puede suponer el conjunto como continuo. Se hablaría aqui de una cuasicontinuidad.

Si un suceso aleatorio tiene un concreto resultado, se concreta un suceso. Hay sucesos simples, el único resultado que contiene es el llamado suceso elemental. Los sucesos complejos se componen de muchos resultados. Un suceso A es siempre un subconjunto del conjunto solución Ω.
Ya que el resultado es un conjunto, se pude utilizar todas las operaciones del Algebra de Conjuntos, que puede ser igual a la Algebra de Boole (también la álgebra de Schalt). Las operaciones fundamentales para conjuntos en el álgebra de Boole son - (no), ∩ y ∪. Todas las otras operaciones se pueden derivar de éllas.
Todas las soluciones de interes se reunen solo en un conjunto solución llamado E. Éste es tambien un conjunto de subconjuntos. Con esos conjuntos se puede trabajar con el álgebra de Boole pero se deben cumplir las siguientes exigencias:
  • Cuando un suceso A esta contenido en E, debe estar tambien contenido su complemento _{\bar A}
  • Cuando esta contenido A y B, debe también estar contenido A ∪ B (se puede calcular que también contiene A ∩ B).
  • Debe también contener el elemento "nulo" Ø (esto implica que también el "elemento 1" Ω esta contenido, que es el complemento de Ø).
El extenso conjunto solución es el conjunto potencia P, éste contiene todos los subconjuntos de Ω.
Ejemplo de un conjunto potencia: Suceso: En una urna, que contienen pelotas rojas(r), azules (b) y amarillas (a), se debe sacar una pelota de ahi. Lo que nos interesa es el color de las pelotitas.
Conjunto solución: Ω = {a, b, r}
Conjunto potencia: P = {Ø, {r}, {b}, {a}, {r, a}, {r, b}, {a, b}, {a, b, r}}

Kolmogorow construyó un axioma para la medida de probabilidad, es decir una proyección del conjunto solución Ω de el conjunto de los números reales en el intervalo [0,1]:

F: Ω → R; A → P(A)

Una función P, que cada suceso A de E ordena un número real se llama probabilidad cuando cumple el siguiente axioma:

Axioma de la Probabilidad:
Dados dos sucesos A,B que estan en Ω.
  1.  P(A) \ge 0 \; . No-negatividad
  2.  P(\Omega) = 1 \; . Nominalidad
  3.  P(A \cup B) = P(A) + P(B) \; , si A y B son disjuntas. Aditividad

Este sistema de axiomas se puede contar solo para muchos finitos sucesos. Para muchos infinitos sucesos Ai (i = 1, 2, ...) se obtiene, en vez del conjunto finito solución, una σ-Algebra. Se mantienen ampliado todos las propiedades de los conjuntos solución de muchos infinitos sucesos Ai. Aqui se detalla el tercer axioma respectivo:
3. Son los sucesos Ai completamente disjuntos en pares, es por su distribución
P(A_1 \cup A_2 \cup A_3...) = P(A_1) + P(A_2) + P(A_3) + ..., en caso de que Ai sea disconjunto (σ-Aditividad).

Cálculo de la probabilidad de un acontecimiento

Se debe ahora estar provisto de un suceso con probabilidad. Bajo que juicio se debe eso realizar, no nos viene en un axioma. Hay aqui diferentes procesos. Se mantiene finalmente la distribución de probabilidad.

Como asignamos los sucesos con la mejor probabilidad?
Consideremos el ejemplo en el pedazo de Pizza, el suceso A: mínimo un pedazo de la mitad. Es A = {RM, MR, MM}. Se cubre en Ω tres de cuatro posibles resultados, así tenemos la probabilidad P(A) = 3/4. La estrategía corresponde al clásico concepto de probabilidad. Se lo designa como principio simétrico o el principio de Laplace:
Cada resultado es frecuentemente igual. |A| es el número de resultados que se cubren a través de A (número de resultados favorables), |Ω| es el número de todas las soluciones posibles. Asi
P(A) = \frac {|A|} {|\Omega|} = \frac {3} {4}\;.
El principio simétrico tiene sobre todo una desventaja que no se puede aplicar para todos los sucesos aleatorios, p. e.: para muchos eventos infinitos. Frecuentemente se asigna tambien a un resultado distintas probabilidades, p.e.:
Evento aleatorio: el clima de personas
Conjunto solución Ω = {bonito, desagradable}
P("bonito") = 0,6, p("desagradable") = 0,4.
Como se llego a esos valores de probabilidad 0,4 y 0,6? se evalúo en esos casos casi las señales del clima de los últimos 100 años y se averiguó que el porcentaje de los dias "bonitos" era el 60%. Aqui tenemos una aplicación del concepto estadístico de probabilidad: Se lleva a cabo un experimento aleatorio muy seguido. Con el número continuo de los intentos se aproxima el porcentaje de intentos que se han distribuido al suceso A, la probabilidad "real" P(A) de forma formal es
P(A) = \lim_{n \to \infty} \frac {n(A)}{n}\;,
con n(A) como número de intentos que se han surgido del evento A. Se designa ese conexion como Ley de grandes números. La ley proporciona el razonamiento que se puede evaluar desconocidas probabilidades con ayuda de una visión empírica, aqui eso nos sirve de mucha ayuda!.
Para muchas preguntas se rechazan ambos conceptos de probabilidad arriba mencionados. P.e. para sucesos, que se realizan raramente, no se tiene una una serie de intentos disponibles; como la probabilidad de exito de un nuevo producto ubicado en el mercado. Se quier llevar el ejemplo a una compañia de detergente. Se encuentra ante una alternativa, de hacer publicidad en la televisión o no. Se confronta con los eventos: Cuando pasa la propaganda televisiva es para la compañia un exito/un fracaso. Cuando no se pasa la propaganda es para la compañia tambien un exito/ un fracaso. Para estas cuatro alternativas se debe determinar probabilidad. No se tiene informacion confiable sobre el evento, no se puede tener datos previos, eventualmente bajo consideraciones de experiencias parecidas se asigna una probabilidad determinada. Esa forma de proceder se denomina el concepto subjetivo de probabilidad.
Hay sucesos que se definen como conjuntos, se puden ilustrar tambien en muchos eventos y en sus probabilidades en un diagrama de Venn. La probabilidad es la superficie del correspondiente conjunto.

El ejemplo de la pizzería para calcular la probabilidad


Desglose de las ordenes de los clientes. Wein = Vino, Wasser = Agua
Ahora miremos alrededor de la pizzeria algo mas preciso: El dueño Carlo Pommodore es un hombre piadoso y acepta también a clientes sin mucho dinero que no ordenan nada. Por eso su local esta lleno con 50 clientes siempre. 20 personas ordenan Pizza y 10 lasagne. La comida llena tanto que nadie avanza a ordenar un segundo plato. 40 clientes beben vino y 20 beben agua mineral, pero 15 toman agua y vino.
Saquemos aleatoriamente a un cliente feliz del estrepitoso conjunto. Cuán grande es la probabilidad de conseguir a uno que comió pizza?
Tenemos |Ω| = 50 diferentes resultados. Se puede de ahi sacar que cada cliente tiene la misma probabilidad de ser escogido.
Definimos ahora los sucesos:
A: El cliente comió pizza; B: El cliente comió lasagne;
C: El cliente tomó vino; D: El cliente tomó agua.
Se tiene bajo el principio de simetría:
P(A) = \frac {|A|}{|\Omega|} =  \frac {20}{50}= \frac {2}{5}\;,
P(B) =  \frac {10}{50}=  \frac {1}{5}\;,
P(C) =   \frac {4}{5} y
P(D) =    \frac {2}{5}\;.
Podemos calcular:
  • La probabilidad que alguien tome agua y vino:
P(C \cap D) = \frac {|C \cap D|}{|\Omega|} = \frac {15}{50} = \frac {3}{10}\;.
  • La probabilidad que en un cliente escogido aleatoriamente no tome agua (\;_{\bar D}):
P( \bar D) = \frac {\vert \bar D \vert} {\vert \Omega \vert} =  \frac {50-20} {50}

= 1 - \frac {20} {50} = \frac {3} {5} = 1 - P(D)\;.
  • Cantidad de personas que bebieron agua o vino:
P(C \cup D) = P(C) + P(D) - P(C \cap D) = \frac {40}{50} + \frac {20}{50} - \frac {15}{50} = \frac {45}{50}=\frac {9}{10}\;.
Esta relación siempre vale para dos eventos!
  • La probabilidad que un cliente coma pizza o lasagne:
P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac {20}{50} + \frac {10}{50} - 0 = \frac {30}{50}\;.
Los conjuntos A y B son disyuntos.
  • La probabilidad que un cliente escogido aleatoriamente no beba ni vino ni agua:
P(\bar C \cup \bar D) = P(\bar C) + P(\bar D) - P(\bar C \cap \bar D).
Aqui el directo cálculo de la probabilidad es análogo al realizado anteriormente. Se usa mejor la regla de DE MORGAN:
P( \bar C \cup \bar D) = P( \overline {C \cap D}) = 1 - P(C \cap D) = 1 - \frac {15}{50} = \frac {35}{50} = 0,7.

Lo que se debe aprender

En un suceso A (A elemento de Ω) :
0 \le P(A) \le 1.
P(\bar A) = 1 - P(A).
P(\empty) = 0.
Dos sucesos A y B (A,B elementos de Ω) :
A y B no son en general disyuntos, también es la probabilidad que A o B ocurra por el teorema de adición para dos sucesos:
P(A \cup B) = P(A) + P(B) - P(A \cap B).
En el caso de que A y B sean disyuntos:
P(A \cup B) = P(A) + P(B).
La regla de Morgan:
P(\bar A \cup \bar B) = P(\overline {A \cap B})
y
P(\bar A \cap \bar B) = P(\overline {A \cup B})
Para tres eventos Ai (i = 1, 2, 3) de Ω vale analogamente a su arriba mencionada referencia:
P(A_1 \cup A_2 \cup A_3) = P(A_1) + P(A_2) + P(A_3) - P(A_1 \cap A_2) - P(A_1 \cap A_3) - P(A_2 \cap A_3) + P(A_1 \cap A_2 \cap A_3).

Mas sucesos Ai (i finito o infinito):
Si los eventos Ai generalmente en pares son disjuntos, se lo realiza por su distribución
P(A_1 \cup A_2 \cup A_3 ...) = P(A_1) + P(A_2) + P(A_3) + ...

 

----------------------------------------------------

Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad/Probabilidad de varios acontecimientos

Independencia Estocástica

Un frecuente objeto de estudio en la estadística es si los diferentes sucesos son dependientes o independientes uno del otro, es decir si favorece a la realización de un suceso a través de otro. Se analizan ejemplos en la investigación de mercados, si influyen el estatus y la educación de un consumidor la compra de un determinado periódico.

Ejemplo para conceptuar la independencia estocástica


Gráfico 1: Los sucesos: estudiantes que viven con sus padres - estudiantes que viven en otros lugares
Un extenso estudio de mercado sobre hábitos dentales de los consumidores ha encontrado que el 50% de los estudiantes de un pequeño instituto viven con sus padres. Por otro lado, el 50% de los estudaitnes prefieren pasta dental con tiras rojas y el 50% de cualquier otro color.
Veamos el suceso aleatorio: una estudiante viene de un país y compra pasta dental. Se definen los sucesos:
E: La estudiante vive con sus padres.
R: La estudiante compra pasta dental con franjas rojas.
Pregunta: Tiene el lugar donde vive esa estudiante alguna influencia en el color que ella elija?
Probablemente no, los eventos E y R son estocásticamente independientes, es decir con respecto a la teoría de probabilidades son independientes.
Nos interesa ahora el lugar donde vive la estudiante. En el gráfico 1 esta dividido el conjunto solución del lugar donde vive.
Pregunta: Qué porcentaje de los estudiantes, que viven con sus padres, comprarían probablemente pasta dental con franjas rojas?
Aqui se distribuyen la independencia de los eventos en relación a su color preferido igualmente, viviendo el 50% de compradores de pasta roja con sus padres y el 50% en otros lugares. Es decir, 50% de 50% de los estudiantes viven con sus padres y prefieren pasta con franjas rojas. Es por lo tanto:
P(R \cap E) = 0{,}5 \cdot 0{,}5 = 0{,}25.
El gráfico 2 muestra, como se divide la independencia de variables de lugar y la preferencia de color con su probabilidad.
Es ahora ejemplificada el P(E) =40% y P(R) = 60%, se obtiene la independencia de la distribución como en el gráfico 3, donde tenemos que el 60% deben comprar pasta roja al igual que el 60% vive en otros lugares y no con sus padres.

Gráfico 2: Los sucesos vivienda (Wohnot) y color de la pasta dental (Zahnpasta) entrelazados

Gráfico 3: Los sucesos: Estudiantes mujeres con sus padres (bei den Eltern) - que no viven con sus padres (woanders)

Ejemplo para conceptuar la dependencia estocástica

Anteriormente contemplamos el caso que dos eventos sean independientes. En general se debe de ahi sacar que los sucesos que generalmente se analizan son dependientes.
En la rama del estudio del marketing se emplea datos de oficinas de salud en una ciudad muestra, en la que se preocupan de la salud de los dientes de los escolares. Se conoce de ese estudio que el 50% de los niños tienen caries y que el 50% de ellos se limpia regularmente los dientes.
Tenemos el suceso aleatorio: Se cuenta a un niño aleatoriamente.
Definimos el evento
Z: El niño de escuela se asea regularmente los dientes.
K: El niño de escuela tiene caries.

Gráfico 4: Distribucón de los que se limpian sus dientes (Zähneputzern) y los que tienen caries (Kariesfällen)
Ahora es
P(Z \cap K) > P(Z \cap \bar K)
o \quad P(Z \cap K) < P(Z \cap \bar K)?
Es también la probabilidad, de obtener a un niño que regularmente se cepille los dientes y tenga caries mas grande que la probabilidad de obtener un niño que regularmente se cepille los dientes y no tenga caries o es al contrario, o es tal vez la probabilidad igual?
Es probable
P(Z \cap K) < P(Z \cap \bar K),
pues el cepillarse los dientes y la caries se conoce que no es independiente entre ellos. También son los eventos estocásticos Z y K dependientes. Obtenemos una distribución de la probablidad total que se parece a la del gráfico 4. Particularmente grande es P(Z ∩ K) y P(Z ∩ K).
La probabilidad general no podría volverse correcta con nuestra información, ésta depende de la fuerza de la dependencia.
Los sucesos estocásticos dependientes se interesan frecuentemente en los comportamientos condicionales de un evento, p.e. para las probabilidades condicionales.
P(K|\bar Z),
que un niño escogido aleatoriamente tenga caries cuando se conoce que no se lava regularmente los dientes.

Probabilidades Condicionales

Ejemplo


Como van ligados las caries y la costumbre de lavarse los dientes?
Un año después se realiza en esa escuela de prueba con propósito de investigar a 200 niños una serie de análisis sobre salud dental. Ahora se lavan los dientes regularmente el 60% de los niños. De esos niños, 40 tienen caries. Para informes oficiales se tiene que 60 niños tienen caries.
Debemos construir un diagrama de Venn a escala. En cada casilla estan 5 niños. Entonces:
P(Z) = 0{,}6; \qquad P(\bar Z) = 0{,}4;
P(Z \cap K) = 0{,}2; \qquad P(Z \cap \bar K) = 0{,}4;
P(\bar Z \cap K) = 0{,}3; \qquad P(\bar Z \cap \bar K) = 0{,}1.
Nos interesa ahora las probabilidades condicionales, que un niño tenga caries cuando se conoce que se lava los dientes:
P(K | Z).
Dicho en otras palabras: La cantidad de niños con caries de los niños que se cepillan los dientes regularmente.
Para la probabilidad condicional tenemos que
P(K|Z) = \frac{P(K \cap Z)}{P(Z)}.
Como se entiende esta probabilidad?
Se traen por lo pronto a todos los niños que se lavan regularmente los dientes al aula. De los 120 niños ahora se ha escogido aleatoriamente uno. Que probabilidad tiene ese niño caries? Observamos que de 120 niños 40 tienen caries.
Exactamente esa estrategia es el principio de la probabilidad condicional!
Resulta: P(K|Z) = \frac{40}{120} = \frac {1}{3}.
Un tercio de los niños que se limpian los dientes tienen caries, entonces naturalmente dos tercios no tienen caries. Vemos igualmente que el cálculo antes mencionado se representa por la conocida fórmula:
[[Imagen:KariesBayB.png|300px|thumb| Como se divide los casos de caries con relación a la costumbre de cepillarse los dientes?}}
P(K|Z) = \frac{P(K \cap Z)}{P(Z)} = \frac {40}{200}{ \frac{120}{200}} =  \frac{40}{120} = \frac{1}{3},
correspondientemente tenemos que:
P(\bar K|Z)= \frac{P(\bar K \cap Z)}{P(Z)}= \frac{ \frac{80}{200}}{ \frac{120}{200}}= \frac{2}{3},
P(K|\bar Z)= \frac{P(K \cap \bar Z)}{P(\bar Z)}= \frac{\frac{60}{200}}{ \frac{80}{200}}= \frac{3}{4},
P(\bar K|\bar Z)= \frac{P(\bar K \cap \bar Z)}{P(\bar Z)}= \frac{ \frac{20}{200}}{ \frac{80}{200}}= \frac{1}{4}.
Comparece este diagrama de Venn con el anterior! por qué se diferencian los dos diagramas?

Ejercicio

Es conocido que el curso de las acciones de la empresa Dachs en un 55% aumenta todos los dias de bolsa.
Evento: K1: el curso aumenta al primer día, K2: el curso aumenta al segundo día.
Se hace constar que las siguientes reglas para el desarrollo del curso de las acciones: el 40% de todos los observadores estiman que se incrementarán los dos primeros dias, el 15% que incrementará el primero pero disminuirá el segundo. En contra está 15% que cree que caerá el primero pero el segundo aumentará y el resto opina que caerá los dos días.
  1. Represente la probabilidad total en un diagrama de Venn
  2. Son los eventos K1 y K2 independientemente estocásticos? (Base una respuesta formal con ayuda d ela teoría de probabilidades).
  3. El día de hoy el curso aumenta:
    • Con que probabilidad aumentará mañana (busque: P(K2|K1))?
    • Qué probabilidad hay que caigán las acciones?
  4. Qué probabilidad hay que mañana las acciones aumenten, cuando hoy cayeron?

Teorema de Bayes

Frecuentemente se muestra la información sobre dos eventos como probabilidad condicional. Como se lo puede emplear?

Ejemplo para dos eventos

En un conocido parque temático se consumen diariamente grandes cantidades de bombillas para la decoración de los puestos. Para que el costo de los consumos no se aumente, el parque consume solo 60% de bombillas de marca y un 40% de bombillas sin marca. Debido a los observadores anteriores se conoce que de las bombillas de marca vienen el 5% mensual defectuosos. Empero las bombillas sin marca vienen mensualemente el 10% defectuosas.
Podemos representarlo gráficamente como en el gráfico 5: Cuando son defectuosos el 5% de las bombillas de marca, el 95% se queda bien. Entonces el 5% es la cantidad de bombillas defectuosas en las de marca, es decir se trata de una probabiliad condicional P(D|M).

Gráfico 5. (Davon defekt = con defectos, davon ok = en buen estado)
El empresario del parque temático necesita la información para los planes de costos del próximo verano, cúan grande es la cantidad de bombillas de marca con defecto, es decir el busca P(M|D). Eso significa: Todas las bombillas defectuosas que se recojan en un día. Se saca un bombillo al azar'. Con que probabilidad se mantienen los bombillos de marca?
Entonces conocemos que:
P(M|D) = \frac {P(M \cap D)}{P(D)}
Lamentablemente no se conoce los componentes de la fracción. Encontramos solo un método para calcularlo.
Seguimos en la búsqueda del número P(M ∩ D): Conocemos P(D|M) y entonces cálculamos
P(D|M) = \frac{P(M \cap D)}{P(M)}
También se mantiene el conocido número en P(D|M) y puede calcularse fácilmente a través de la solución de una ecuación como
P(M \cap D) = P(D|M)P(M)
también
P(M \cap D) = 0{,}05 \cdot 0{,}6 = 0{,}03.
Ahora falta aún el denominador P(D). Contemplemos el diagrama de Venn del gráfico 6. D une a la intersección entre D ∩ M y ∩ \;_{\bar M}.

Gráfico 6
La probabilidad total de D es entonces la suma de
P(D) = P(M \cap D) + P(\bar M \cap D).
se entiende que se demuestra como teorema la probabilidad total y eso nos da como hemos visto antes
P(D) = P(D|M)P(M) + P(D| \bar M)P(\bar M),
en nuestro ejemplo
P(D) = 0{,}05 \cdot 0{,}6 + 0{,}1 \cdot 0{,}4 = 0{,}07.
Son entonces el 7% de todas las bombillas defectuosas.
La buscada probabilidad condicional es ahora
P(M|D) = \frac{P(M \cap D)}{P(D)} = \frac{P(D|M)P(M)}{P(D|M)P(M) + P(D| \bar M)P(\bar M)},
Esta formúla es conocida como el Teorema de Bayes.
La probabilidad que necesitabamos es
P(M|D) = \frac{0{,}03}{0{,}07} = 0{,}4286.
Esta probabilidad resulta por eso sorpresivamente alta porque se usan 50% más bombillas de marca que sin marca. Correspondientemente es el número de las bombillas sin marca con defecto es de 0,5714.
Ahora queremos analizar que ocurre con mas de dos eventos.



Ejemplo para mas de dos eventos

Una expedición ocupada por tres conductores de camión, los señores Ahorn, Behorn y Zehorn. Ahorn conduce el 50% de todo el camino, Behorn el 20% y Zehorn el 30%. De la experiencia se conoce que Ahorn produce una abolladura del 10% de todo el viaje, Behorn el 15% y Zehorn el 20%. (véase el gráfico 7)
Definimos el evento:
F1: Ahorn conduce, F2:Behorn ..., F3:Zehorn ...
B: se ha producido una abolladura.
Queremos primero mantener los casos: cuando Ahorn conduce produce el 10% de abolladuras de todo el viaje, desarrolla el el resto 90% sin problemas.

Gráfico 7 (aller Fahrten = todos los viajes, dabei Beule = con abolladuras, keine beule = sin abolladuras)
Nos interesa la probabilidad que Ahorn haya conducido cuando aparece una abolladura en un camión una proxima vez, es decir para P(F1|B).
Es otra vez
P(F_1|B) = \frac {P(F_1 \cap B)}{P(B)}.
Del teorema de multiplicación de la probabilidad debe ser
P(F_1 \cap B) = P(B|F_1){P(F_1)}
y también
P(F_1 \cap B) = 0{,}1 \cdot 0{,}5 = 0{,}05.
Pero como se obtiene P(B)? También aqui vale nuevamente el teorema de la probabilidad total, p.e.:
P(F_1 \cap B) = P(B|F_1) \cdot P(F_1) .
Obtenemos entonces para P(B)
P(B) = P(F_1 \cap B) + P(F_2 \cap B) + P(F_3 \cap B)
= P(B | F1)P(F1) + P(B | F2)P(F2) + P(B | F3)P(F3),
también
P(B) = 0{,}1 \cdot 0{,}5 + 0{,}15 \cdot 0{,}2 \cdot 0{,}3 = 0{,}05 + 0{,}03 + 0{,}06 = 0{,}14
Nuestra buscada probabilidad sería
P(F_1|B) = \frac{P(F_1 \cap B)}{P(B)} = \frac {0{,}05}{0{,}14} = 0{,}3571
que es correspondiente a
P(F_2|B) = \frac{0{,}03}{0{,}14} = 0{,}2143
y
P(F_3|B) = \frac {0{,}06}{0{,}14} = 0{,}4286
Entonces Zehorn ha conducido con gran probabilidad de tener abolladuras.

Teorema de la multiplicacion

De la fórmula de la probabilidad condicionada
P(B \mid A) = \frac{P(A \cap B)}{P(A)}
Se deduce
P(A \cap B)=P(A) \cdot P(B \mid A)
P(A \cap B)=P(B) \cdot P(A \mid B)

Ejemplo

P(Encontrar alumno en Escuela Politecnica) = 0.12
P(Chica Escuela Politecnica) = 0.05 = P(Chica|Escuela Politecnica)
¿Cual es la probabilidad de encontrar una alumna en la universidad y que sea de la Escuela Politecnica?
P(Chica \cap Escuela Politecnica) = P(Escuela Politecnica) \cdot P(Chica \cap Escuela Politecnica) = 0.12 \cdot 0.05 = 0.006

Conocimiento teórico

  • Dos eventos A y B de Ω:
Son independientemente estocásticos, cuando su probabilidad total es igual al producto de sus probabilidades individuales:
P(A \cap B) = P(A) \cdot P(B).
Se cumple que los eventos no se los considera fundamentalmente independientes.
La probabilidad condicional para A y B es
P(A|B) = \frac{P(A \cap B)}{P(B)} y P(B|A) = \frac{P(A \cap B)}{P(A)}.
El teorema general de multiplicación de probabilidades:
P(A \cap B) = P(A|B)P(B) = P(B|A)P(A).
Teorema de Bayes:
P(A|B) = \frac{P(A \cap B)}{P(A)} = \frac{P(A|B)P(B)}{P(A|B)P(B) + P(A| \bar B)P(\bar B)}.
  • Generalización para m eventos Ai (i=1,...,m):
Estos m eventos se descomponen de conjuntos solución, es decir éstos son disjuntos y llenados en Ω. B es entonces
P(B) = P(A_1 \cap B) + P(A_2 \cap B) + \dots + P(A_m \cap B).
Vale aquí el teorema de Bayes:
P(A_i|B) = \frac{P(A_i \cap B)}{P(B)} = \frac{P(B|A_i)P(A_i)}{\sum_{j=1}^{m} P(B|A_j)P(A_j)}

 

 -----------------------------------------------------

 

Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad/Independencia estocástica

 

ndependencia Estocástica

Un frecuente objeto de estudio en la estadística es si los diferentes sucesos son dependientes o independientes uno del otro, es decir si favorece a la realización de un suceso a través de otro. Se analizan ejemplos en la investigación de mercados, si influyen el estatus y la educación de un consumidor la compra de un determinado periódico.

Ejemplo para conceptuar la independencia estocástica


Gráfico 1: Los sucesos: estudiantes que viven con sus padres - estudiantes que viven en otros lugares
Un extenso estudio de mercado sobre hábitos dentales de los consumidores ha encontrado que el 50% de los estudiantes de un pequeño instituto viven con sus padres. Por otro lado, el 50% de los estudiantes prefieren pasta dental con tiras rojas y el 50% de cualquier otro color.
Veamos el suceso aleatorio: una estudiante viene de un país y compra pasta dental. Se definen los sucesos:
E: La estudiante vive con sus padres.
R: La estudiante compra pasta dental con franjas rojas.
Pregunta: Tiene el lugar donde vive esa estudiante alguna influencia en el color que ella elija?
Probablemente no, los eventos E y R son estocásticamente independientes, es decir con respecto a la teoría de probabilidades son independientes.
Nos interesa ahora el lugar donde vive la estudiante. En el gráfico 1 esta dividido el conjunto solución del lugar donde vive.
Pregunta: Qué porcentaje de los estudiantes, que viven con sus padres, comprarían probablemente pasta dental con franjas rojas?
Aqui se distribuyen la independencia de los eventos en relación a su color preferido igualmente, viviendo el 50% de compradores de pasta roja con sus padres y el 50% en otros lugares. Es decir, 50% de 50% de los estudiantes viven con sus padres y prefieren pasta con franjas rojas. Es por lo tanto:
P(R \cap E) = 0{,}5 \cdot 0{,}5 = 0{,}25.
El gráfico 2 muestra, como se divide la independencia de variables de lugar y la preferencia de color con su probabilidad.
Es ahora ejemplificada el P(E) =40% y P(R) = 60%, se obtiene la independencia de la distribución como en el gráfico 3, donde tenemos que el 60% deben comprar pasta roja al igual que el 60% vive en otros lugares y no con sus padres.

Gráfico 2: Los sucesos vivienda (Wohnot) y color de la pasta dental (Zahnpasta) entrelazados

Gráfico 3: Los sucesos: Estudiantes mujeres con sus padres (bei den Eltern) - que no viven con sus padres (woanders)

Ejemplo para conceptuar la dependencia estocástica

Anteriormente contemplamos el caso que dos eventos sean independientes. En general se debe de ahi sacar que los sucesos que generalmente se analizan son dependientes.
En la rama del estudio del marketing se emplea datos de oficinas de salud en una ciudad muestra, en la que se preocupan de la salud de los dientes de los escolares. Se conoce de ese estudio que el 50% de los niños tienen caries y que el 50% de ellos se limpia regularmente los dientes.
Tenemos el suceso aleatorio: Se cuenta a un niño aleatoriamente.
Definimos el evento
Z: El niño de escuela se asea regularmente los dientes.
K: El niño de escuela tiene caries.

Gráfico 4: Distribucón de los que se limpian sus dientes (Zähneputzern) y los que tienen caries (Kariesfällen)
Ahora es
P(Z \cap K) > P(Z \cap \bar K)
o \quad P(Z \cap K) < P(Z \cap \bar K)?
Es también la probabilidad, de obtener a un niño que regularmente se cepille los dientes y tenga caries mas grande que la probabilidad de obtener un niño que regularmente se cepille los dientes y no tenga caries o es al contrario, o es tal vez la probabilidad igual?
Es probable
P(Z \cap K) < P(Z \cap \bar K),
pues el cepillarse los dientes y la caries se conoce que no es independiente entre ellos. También son los eventos estocásticos Z y K dependientes. Obtenemos una distribución de la probablidad total que se parece a la del gráfico 4. Particularmente grande es P(Z ∩ K) y P(Z ∩ K).
La probabilidad general no podría volverse correcta con nuestra información, ésta depende de la fuerza de la dependencia.
Los sucesos estocásticos dependientes se interesan frecuentemente en los comportamientos condicionales de un evento, p.e. para las probabilidades condicionales.
P(K|\bar Z),
que un niño escogido aleatoriamente tenga caries cuando se conoce que no se lava regularmente los dientes.

 

------------------------------------------------------

Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad/Probabilidades condicionales

Probabilidades Condicionales

Ejemplo


Como van ligados las caries y la costumbre de lavarse los dientes?
Un año después se realiza en esa escuela de prueba con propósito de investigar a 200 niños una serie de análisis sobre salud dental. Ahora se lavan los dientes regularmente el 60% de los niños. De esos niños, 40 tienen caries. Para informes oficiales se tiene que 60 niños tienen caries.
Debemos construir un diagrama de Venn a escala. En cada casilla estan 5 niños. Entonces:
P(Z) = 0{,}6; \qquad P(\bar Z) = 0{,}4;
P(Z \cap K) = 0{,}2; \qquad P(Z \cap \bar K) = 0{,}4;
P(\bar Z \cap K) = 0{,}3; \qquad P(\bar Z \cap \bar K) = 0{,}1.
Nos interesa ahora las probabilidades condicionales, que un niño tenga caries cuando se conoce que se lava los dientes:
P(K | Z).
Dicho en otras palabras: La cantidad de niños con caries de los niños que se cepillan los dientes regularmente.
Para la probabilidad condicional tenemos que
P(K|Z) = \frac{P(K \cap Z)}{P(Z)}.
Como se entiende esta probabilidad?
Se traen por lo pronto a todos los niños que se lavan regularmente los dientes al aula. De los 120 niños ahora se ha escogido aleatoriamente uno. Que probabilidad tiene ese niño caries? Observamos que de 120 niños 40 tienen caries.
Exactamente esa estrategia es el principio de la probabilidad condicional!
Resulta: P(K|Z) = \frac{40}{120} = \frac {1}{3}.
Un tercio de los niños que se limpian los dientes tienen caries, entonces naturalmente dos tercios no tienen caries. Vemos igualmente que el cálculo antes mencionado se representa por la conocida fórmula:

Como se divide los casos de caries con relación a la costumbre de cepillarse los dientes?
P(K|Z) = \frac{P(K \cap Z)}{P(Z)} = \frac {40}{200}{ \frac{120}{200}} =  \frac{40}{120} = \frac{1}{3},
correspondientemente tenemos que:
P(\bar K|Z)= \frac{P(\bar K \cap Z)}{P(Z)}= \frac{ \frac{80}{200}}{ \frac{120}{200}}= \frac{2}{3},
P(K|\bar Z)= \frac{P(K \cap \bar Z)}{P(\bar Z)}= \frac{\frac{60}{200}}{ \frac{80}{200}}= \frac{3}{4},
P(\bar K|\bar Z)= \frac{P(\bar K \cap \bar Z)}{P(\bar Z)}= \frac{ \frac{20}{200}}{ \frac{80}{200}}= \frac{1}{4}.
Comparece este diagrama de Venn con el anterior! por qué se diferencian los dos diagramas?

Ejercicio

Es conocido que el curso de las acciones de la empresa Dachs en un 55% aumenta todos los dias de bolsa.
Evento: K1: el curso aumenta al primer día, K2: el curso aumenta al segundo día.
Se hace constar que las siguientes reglas para el desarrollo del curso de las acciones: el 40% de todos los observadores estiman que se incrementarán los dos primeros dias, el 15% que incrementará el primero pero disminuirá el segundo. En contra está 15% que cree que caerá el primero pero el segundo aumentará y el resto opina que caerá los dos días.
  1. Represente la probabilidad total en un diagrama de Venn
  2. Son los eventos K1 y K2 independientemente estocásticos? (Base una respuesta formal con ayuda d ela teoría de probabilidades).
  3. El día de hoy el curso aumenta:
    • Con que probabilidad aumentará mañana (busque: P(K2|K1))?
    • Qué probabilidad hay que caigán las acciones?
  4. Qué probabilidad hay que mañana las acciones aumenten, cuando hoy cayeron?



--------------------------------------------------------------------------------------------------


Estadística/Cálculo de probabilidades/Aleatoriedad y probabilidad/Teorema de Bayes

Teorema de Bayes

Frecuentemente se muestra la información sobre dos eventos como probabilidad condicional. Como se lo puede emplear?

Ejemplo para dos eventos

En un conocido parque temático se consumen diariamente grandes cantidades de bombillas para la decoración de los puestos. Para que el costo de los consumos no se aumente, el parque consume solo 60% de bombillas de marca y un 40% de bombillas sin marca. Debido a los observadores anteriores se conoce que de las bombillas de marca vienen el 5% mensual defectuosos. Empero las bombillas sin marca vienen mensualemente el 10% defectuosas.
Podemos representarlo gráficamente como en el gráfico 5: Cuando son defectuosos el 5% de las bombillas de marca, el 95% se queda bien. Entonces el 5% es la cantidad de bombillas defectuosas en las de marca, es decir se trata de una probabiliad condicional P(D|M).

Gráfico 5. (Davon defekt = con defectos, davon ok = en buen estado)
El empresario del parque temático necesita la información para los planes de costos del próximo verano, cúan grande es la cantidad de bombillas de marca con defecto, es decir el busca P(M|D). Eso significa: Todas las bombillas defectuosas que se recojan en un día. Se saca un bombillo al azar'. Con que probabilidad se mantienen los bombillos de marca?
Entonces conocemos que:
P(M|D) = \frac {P(M \cap D)}{P(D)}
Lamentablemente no se conoce los componentes de la fracción. Encontramos solo un método para calcularlo.
Seguimos en la búsqueda del número P(M ∩ D): Conocemos P(D|M) y entonces cálculamos
P(D|M) = \frac{P(M \cap D)}{P(M)}
También se mantiene el conocido número en P(D|M) y puede calcularse fácilmente a través de la solución de una ecuación como
P(M \cap D) = P(D|M)P(M)
también
P(M \cap D) = 0{,}05 \cdot 0{,}6 = 0{,}03.
Ahora falta aún el denominador P(D). Contemplemos el diagrama de Venn del gráfico 6. D une a la intersección entre D ∩ M y ∩ \;_{\bar M}.

Gráfico 6
La probabilidad total de D es entonces la suma de
P(D) = P(M \cap D) + P(\bar M \cap D).
se entiende que se demuestra como teorema la probabilidad total y eso nos da como hemos visto antes
P(D) = P(D|M)P(M) + P(D| \bar M)P(\bar M),
en nuestro ejemplo
P(D) = 0{,}05 \cdot 0{,} + 0{,}1 \cdot 0{,}4 = 0{,}07.
Son entonces el 7% de todas las bombillas defectuosas.
La buscada probabilidad condicional es ahora
P(M|D) = \frac{P(M \cap D)}{P(D)} = \frac{P(D|M)P(M)}{P(D|M)P(M) + P(D| \bar M)P(\bar M)},
Esta formúla es conocida como el Teorema de Bayes.
La probabilidad que necesitabamos es
P(M|D) = \frac{0{,}03}{0{,}07} = 0{,}4286.
Ésta probabilidad resulta por eso sorpresivamente alta porque se usan 50% mas bombillas de marca que sin marca. Correspondientemente es el número de las bombillas sin marca con defecto es de 0,5714.
Ahora queremos analizar que ocurre con mas de dos eventos.

Ejemplo para mas de dos eventos

Una expedición ocuapda por tres conductores de camión, los señores Ahorn, Behorn y Zehorn. Ahorn conduce el 50% de todo el camino, Behorn el 20% y Zehorn el 30%. De la experiencia se conoce que Ahorn produce una abolladura del 10% de todo el viaje, Behorn el 15% y Zehorn el 20%. (véase el gráfico 7)
Definimos el evento:
F1: Ahorn conduce, F2:Behorn ..., F3:Zehorn ...
B: se ha producido una abolladura.
Queremos primero mantener los casos: cuando Ahorn conduce produce el 10% de abolladuras de todo el viaje, desarrolla el el resto 90% sin problemas.

Gráfico 7 (aller Fahrten = todos los viajes, dabei Beule = con abolladuras, keine beule = sin abolladuras)
Nos interesa la probabilidad que Ahorn conducido cuando aparece una abolladura en un camión una proxima vez, es decir para P(F1|B).
Es otra vez
P(F_1|B) = \frac {P(F_1 \cap B)}{P(B)}.
Del teorema de multiplicación de la probabilidad debe ser
P(F_1 \cap B) = P(B|F_1){P(F_1)}
y también
P(F_1 \cap B) = 0{,}1 \cdot 0{,}5 = 0{,}05.
Pero como se obtiene P(B)? También aqui vale nuevamente el teorema de la probabilidad total, p.e.:
P(F_1 \cap B) = P(B|F_1) \cdot P(F_1) .
Obtenemos entonces para P(B)
P(B) = P(F_1 \cap B) + P(F_2 \cap B) + P(F_3 \cap B)
= P(B | F1)P(F1) + P(B | F2)P(F2) + P(B | F3)P(F3),
también
P(B) = 0{,}1 \cdot 0{,}5 + 0{,}15 \cdot 0{,}2 \cdot 0{,}3 = 0{,}05 + 0{,}03 + 0{,}06 = 0{,}14
Nuestra buscada probabilidad sería
P(F_1|B) = \frac{P(F_1 \cap B)}{P(B)} = \frac {0{,}05}{0{,}14} = 0{,}3571
que es correspondiente a
P(F_2|B) = \frac{0{,}03}{0{,}14} = 0{,}2143
y
P(F_3|B) = \frac {0{,}06}{0{,}14} = 0{,}4286
Entonces Zehorn ha conducido con gran probabilidad de tener abolladuras.



------------------------------------------------------------------------------------------------

No hay comentarios :

Publicar un comentario

DEJA TU COMENTARIOS CON TUS DUDAS Y SUGERENCIAS,ASI COMO TAMBIEN UN PEDIDO EN PARTICULAR.
TAMBIEN PUEDES TU CORREO ELECTRONICO PARA UNA RESPUESTA MAS RAPIDA.