
19 minute read
Distribución Beta (p,q
PARCIAL II
DECIMA SEMANA
Advertisement
DESCRIPTIVA: Recopila, organiza, presenta, analiza e interpreta datos .
Clase 8: Semana del 04 al 11 de septiembre
DISTRIBUCION BINOMINAL
Una distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos al realizar n experimentos independientes entre sí, acerca de una variable aleatoria. Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados bajo esta distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el que definimos el suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y contamos los éxitos (sacar cara) que obtenemos, nuestra distribución de probabilidades se ajustaría a una distribución binomial. Por lo tanto, la distribución binomial se entiende como una serie de pruebas o ensayos en la que solo podemos tener 2 resultados (éxito o fracaso), siendo el éxito nuestra variable aleatoria.
Propiedades de la distribución binomial
Para que una variable aleatoria se considere que sigue una distribución binomial, tiene que cumplir las siguientes propiedades: En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o fracaso). La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p. La probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante dado que la moneda no cambia en cada experimento y las probabilidades de sacar cara son constantes. La probabilidad de fracaso ha de ser también constate. Esta se representa mediante la letra q = 1-p. Es importante fijarse que mediante esa ecuación, sabiendo p o sabiendo q, podemos obtener la que nos falte. El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto, lo que ocurra en cada experimento no afecta a los siguientes. Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara y cruz al mismo tiempo. Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de ocurrir. Si no se es hombre, se es mujer y, si se lanza una moneda, si no sale cara ha de salir cruz. La variable aleatoria que sigue una distribución binomial se suele representar como X~(n,p), donde n representa el número de ensayos o experimentos y p la probabilidad de éxito.
Formula de la distribución binomial
La fórmula para calcular la distribución normal es:
Donde: n = Número de ensayos/experimentos x = Número de éxitos p = Probabilidad de éxito q = Probabilidad de fracaso (1-p) Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino que es un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente formula:
El signo de exclamación en la expresión anterior representa el símbolo de factorial. Ejemplo de distribución binomial Imaginemos que un 80% de personas en el mundo ha visto el partido de la final del último mundial de fútbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la probabilidad de que 3 de ellos hayan visto el partido? Definamos las variables del experimento: n = 4 (es el total de la muestra que tenemos) x = número de éxitos, que en este caso es igual a 3, dado que buscamos la probabilidad de que 3 de los 4 amigos lo hayan visto. p = probabilidad de éxito (0,8) q = probabilidad de fracaso (0,2). Este resultado se obtiene al restar 1-p. Tras definir todas nuestras variables, simplemente sustituimos en la formula.
El numerador del factorial se obtendría de multiplicar 4*3*2*1 = 24 y en el denominador tendríamos 3*2*1*1 = 6. Por lo tanto, el resultado del factorial sería 24/6=4.

Fuera del corchete tenemos dos números. El primero sería 0,8^3=0,512 y el segundo 0,2 (dado que 4-3 = 1 y cualquier número elevado a 1 es el mismo). Por tanto, nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100 tenemos que hay una probabilidad del 40,96% de que 3 de los 4 amigos haya visto el partido de la final del mundial. (Sanjuán, 2017)
DISTRIBUCION MULTINOMINAL
En teoría de probabilidad, la distribución multinomial es una generalización de la distribución binomial La distribución binomial es la probabilidad de un número de éxitos en N sucesos de Bernoulli independientes, con la misma probabilidad de éxito en cada suceso. En una distribución multinomial, el análogo a la distribución de Bernoulli es la distribución categórica, donde cada suceso concluye en únicamente un resultado de un número finito K de los posibles, con probabilidades p_{1},\dots ,p_{k} (tal que p_{i}\geq 0 para i entre 1 y K y
y con n sucesos independientes. Entonces sea la variable aleatoria Xi que indica el número de veces que se ha dado el resultado i sobre los n sucesos. El vector X=(X_{1},...,X_{k})} sigue una distribución multinomial con parámetros n y p, donde p=(p_{1},...,p_{k}). La función de probabilidad de la distribución multinomial es como sigue:
Para enteros no negativos x1, ..., xk. Propiedades La media o valor esperado del suceso i observado en n pruebas es:
La varianza es:


En teoría de probabilidad, la distribución multinomial es una generalización de la distribución binomial.

(htt13) DECIMA PRIMERA SEMANA
INFERENCIAL: Utiliza métodos para realizar generalizaciones, estimación o predicción de las características de una población .
Clase 9: Semana del 11 al 18 de septiembre
DISTRIBUCION HIPERGEOMETRICA
Las distribución hipergeométrica es el modelo que se aplica en experimentos del siguiente tipo: En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que al sacar 2 bolas las dos sean blancas Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí: Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos). La distribución hipergeométrica sigue el siguiente modelo:
Donde:
Vamos a tratar de explicarlo: N: es el número total de bolas en la urna N1: es el número total de bolas blancas N2: es el número total de bolas negras k: es el número de bolas blancas cuya probabilidad se está calculando


n: es el número de ensayos que se realiza Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas? Entonces: N = 12; N1 = 7; N2 = 5; k = 3; n = 4 Si aplicamos el modelo:
Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%. Pero este modelo no sólo se utiliza con experimentos con bolas, sino que también se aplica con experimentos similares: Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras?
Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan sólo del 1,75%.
DISTRIBUCION NEGATIVA
En estadística la distribución binomial negativa es una distribución de probabilidad discreta que incluye a la distribución de Pascal. El número de experimentos de Bernoulli de parámetro θ independientes realizados hasta la consecución del k-ésimo éxito es una variable aleatoria que tiene una distribución binomial negativa con parámetros k y θ. La distribución geométrica es el caso concreto de la binomial negativa cuando k = 1. PROPIEDADES Su función de Probabilidad es
para enteros x mayores o iguales que k, donde
Su media es: μ= k(1-θ)/θ Si se piensa en el número de fracasos únicamente y μ= k/θ Si se cuentan también los k-1 éxitos su varianza es σ2=(k(1-θ))/θ2 en ambos casos. Ejemplo: Si la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es 0,40, ¿Cuál es la probabilidad de que el décimo niño expuesto a la enfermedad sea el tercero en contraerla? En este caso, X es el número de niños expuestos la enfermedad y x=10, k=1, θ=0.40 La solución es: b*(10;1,0.4)= (103--11)0.43(1-0.4)10-3=(92)0.43(0.6)7=0.0645 En un proceso de manufactura se sabe que un promedio de 1 en cada 10 productos es defectuoso, ¿Cuál es la probabilidad que el quinto (5) artículo examinado sea el primero (1) en estar defectuoso?. La solución es: X= artículos defectuosos P= 1/10 = 0,1 q= 1- 0,1 = 0,9 x= 5 ensayos K= 1 b*(5;1,0.1)=(5-1\1-1)(0.1)^1*(0.9)^5-1= b*(5;1,0.1)= 6.6% de probabilidad que el quinto elemento extraído sea el primero en estar defectuoso.

DECIMOSEGUNDA SEMANA
CUALITATIVA NOMINAL: No admiten orden .
Clase 10: Semana del 18 al 25 de septiembre
DISTRIBUCION POISSON
La distribución de Poisson es una distribución de probabilidad discreta y se emplea para describir procesos que pueden ser descritos con una variable aleatoria discreta. Describe situaciones en las cuales los clientes llegan de manera independiente durante un cierto intervalo de tiempo y el número de llegadas depende de la magnitud del intervalo. La distribución de Poisson juega un rol importante en complementar la distribución exponencial en la teoría de colas o modelo de líneas de espera. Entre los procesos que se pueden describir con la distribución de probabilidad de Poisson están la distribución de las llamadas telefónicas que llagan a un conmutador, la demanda (necesidades) de servicios en una institución asistencial por parte de los pacientes, los arribos de los camiones y automóviles a la caseta de cobro y el número de accidentes en un cruce. Los ejemplos citados tienen un elemento en común. Pueden ser descritos por una variable aleatoria discreta que asume valores enteros (0,1,2,3,4,5 y así sucesivamente). La Distribución de Poisson se llama así en honor a Simeón Dennis Poisson (1781-1840), francés que desarrolló esta distribución basándose en estudios efectuados en la última parte de su vida. Características de los procesos que producen una distribución de la probabilidad de Poisson El número de vehículos que pasan por una caseta de cobro en las horas de mayor tráfico sirve como ejemplo para mostrar las características de una distribución de probabilidad de Poisson. El promedio (media) de los arribos de vehículos por hora de gran tráfico puede estimarse a partir de los datos anteriores del tráfico. Si dividimos las horas de gran tráfico en periodos (intervalos) de un segundo cada uno, encontraremos que los siguientes enunciados son verdaderos: a) La probabilidad de que exactamente un vehículo llegue por segundo a una caseta individual es un número muy pequeño y es constante para que cada intervalo de un segundo. b) La probabilidad de que dos o más vehículos lleguen en un intervalo de un segundo es tan reducida que podemos asignarle un valor cero. c) El número de vehículos que llegan en determinado intervalo de un segundo es independiente del momento en que el intervalo de un segundo ocurre durante la hora de gran tráfico. d) El número de llegadas en cualquier intervalo de un segundo no depende del número de arribos de cualquier otro intervalo de un segundo. (gestiopolis, 2020)
Ejemplo:
Supóngase que estamos investigando la seguridad de un crucero muy peligroso. Los archivos de la policía indican una media de cinco accidentes por mes en él. El número de accidentes está distribuido conforme a la distribución de Poisson, y la división de seguridad en carreteras quiere calcular la probabilidad de exactamente 0,1,2,3 y 4 accidentes en un mes determinado. Aplicando la fórmula anterior:
P(0) = (5)0 (e-5) /0! = 0.00674 P(1) = (5)1 (e-5) /1! = 0.03370 P(2) = (5)2 (e-5) /2! = 0.08425 P(3) = (5)3 (e-5) /3! = 0.14042 P(4) = (5)4 (e-5) /4! = 0.17552 Para saber cual es la probabilidad en 3 o menos, sumaremos las probabilidades de 0,1,2,3 lo que será igual a : P(0) = 0.00674 P(1) = 0.03370 P(2) = 0.08425 P(3) = 0.14042 P(3 o menos) = 0.26511 Dado que la probabilidad de que haya 3 o menos accidentes es de 0.26511 entonces la probabilidad de que ocurran más de tres debe ser = 1 –0.26511 = 0.73489. (gestiopolis, 2020)
DISTRIBUCION NORMAL
La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se utiliza más comúnmente en estadística, es un modelo que aproxima el valor de una variable aleatoria a una situación ideal, dependiendo de la media y la desviación típica. La distribución normal es de vital importancia en estadística por tres razones principales:
Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan estrechamente a la distribución normal. La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la distribución binomial y la distribución de Poisson. La distribución normal proporciona la base para la estadística inferencial clásica por su relación con el teorema de límite central. En la distribución normal, uno puede calcular la probabilidad de que varios valores ocurran dentro de ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un valor particular dentro de una distribución continua, como la distribución normal, es cero. Esta propiedad distingue a las variables continuas, que son medidas, de las variables discretas, las cuales son contadas.
Ejemplo:
El tiempo (en segundos) se mide y no se cuenta. Por lo tanto, es factible determinar la probabilidad de que el tiempo de descarga para una página principal en un navegador de la Web esté entre 7 y 10 segundos o que la probabilidad de que el tiempo de descarga esté entre 8 y 9 segundos, o la probabilidad de que el tiempo de descarga esté entre 7.99 y 8.01
segundos. Sin embargo, la probabilidad de que el tiempo de descarga sea exactamente de 8 segundos es cero.

(Berenson & Levine, 2006)
DECIMOTERCERA SEMANA
CUALITATIVA ORDINAL: Si existe orden .
9
Clase 11: Semana del 02 al 09 de octubre DISTRIBUCION NORMAL A LA APROXIMACION BINOMINAL
La distribución binomial, es una distribución discreta en la que n ensayos pueden producir un éxito o un fracaso. La probabilidad de éxito la denominamos p y la posibilidad de fracaso será q = (1 - p). Como se ha visto en otros apartados el cálculo de la distribución binomial puede exceder el límite de cualquier tabla y volverse muy engorrosa en su cálculo si el valor de n es muy grande. Un método alternativo para el cálculo de la distribución binomial es por medio del uso de la distribución normal para aproximar la distribución binomial. Para ello es fundamental que se satisfagan las siguientes condiciones, np ≥ 5 y n(1 - p) ≥ 5 y además p está próximo a 0,5. Si no se pudieran utilizar las tablas binomiales, se puede aproximar la respuesta utilizando la distribución normal. Para ello podemos obtener la media y la desviación estándar de la distribución normal con las siguientes fórmulas:
Debido a que la distribución normal es continua, y en consecuencia entre dos valores existirá una serie infinita de valores posibles, para estimar una variable aleatoria discreta se requiere de un leve ajuste, denominado factor de corrección de continuidad, sumando o restando 1/2 al valor de x. De esta forma el valor de z se obtiene mediante la fórmula:
Ejemplos:
El 45% de todos los empleados de una dependencia pública poseen título que los acredita para el puesto. ¿Cuál es la probabilidad de que de los 160 empleados elegidos al azar 75 posean título para el puesto? Solución: Datos: n = 160, x = 75, p = 0,45, q = 0,55


La probabilidad de que 75 empleados elegidos aleatoriamente posean título para el cargo es del 5,68%. (Jorge Castro Monge, s.f.)

Clase 12: Semana del 09 al 16 de octubre
DISTRIBUCIÓN MUESTRAL DE MEDIDAS
Si tenemos una muestra aleatoria de una población N((m,s), se sabe (Teorema del límite central) que la fdp de la media muestral es también normal con media m y varianza s2/n. Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para poblaciones cualesquiera.
Es decir es el error típico, o error estándar de la media. ¿Cómo usamos esto en nuestro problema de estimación? 1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la llamada z); pero haciendo la transformación (llamada tipificación)
una normal de media m y desviación s se transforma en una z.

Llamando za al valor de una variable normal tipificada que deja a su derecha un área bajo la curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son los valores que ofrece la tabla de la normal) podremos construir intervalos de la forma
para los que la probabilidad es 1 - a.
Teniendo en cuenta la simetría de la normal y manipulando algebraícamente
que también se puede escribir
o, haciendo énfasis en que es el error estándar de la media,


Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%, o nivel de significación de 100a%. El nivel de confianza habitual es el 95%, en cuyo caso a=0,05 y za /2=1,96.
Al valor se le denomina estimación puntual y se dice que es un estimador de m. Ejemplo: Si de una población normal con varianza 4 se extrae una muestraaleatoria de tamaño 20 en la que se calcula se puede decir que m tiene una probabilidad de 0,95
de estar comprendida en el intervalo que sería el intervalo de

confianza al 95% para m
En general esto es poco útil, en los casos en que no se conoce m tampoco suele conocerse s2; en el caso más realista de s2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.
o, haciendo énfasis en que es el error estándar estimado de la media, Este manera de construir los intervalos de confianza sólo es válido si la variable es normal. Cuando n es grande (>30) se puede sustituir t por z sin mucho error.
Clase 13: Semana del 16 al 23 de octubre
DISTRIBUCION LOGARITMICA NORMAL Y BETA
La variable resultante al aplicar la función exponencial a una variable que se distribuye normal con media Mu y desviación estándar Sigma, sigue una distribución lognormal con parámetros Mu (escala) y Sigma (forma). Dicho de otro modo, si una variable X se distribuye normalmente, la variable lnX, sigue una distribución lognormal. La distribución lognormal es útil para modelar datos de numerosos estudios médicos tales como el período de incubación de una enfermedad, los títulos de anticuerpo a un virus, el tiempo de supervivencia en pacientes con cáncer o SIDA, el tiempo hasta la seroconversión de VIH+, etc.
Campo de variación: 0 < x < ∞ Parámetros: Mu: parámetro de escala, -∞ < Mu < ∞ Sigma: parámetro de forma, Sigma > 0
Ejercicio
Supóngase que la supervivencia, en años, luego de una intervención quirúrgica (tiempo que pasa hasta que ocurre la muerte del enfermo) en una cierta población sigue una distribución lognormal de parámetro de escala 2,32 y de forma 0,20. Calcúlese la probabilidad de supervivencia a los 12 años, la mediana de supervivencia y represente la función de distribución de la variable. Resultados con Epidat 3.1
La probabilidad de supervivencia a los 12 años se sitúa próximo a 0,20.La función de distribución de la supervivencia a la intervención quirúrgica se presenta a continuación:


Distribución Beta (p,q)

La distribución beta es posible para una variable aleatoria continua que toma valores en el intervalo [0,1], lo que la hace muy apropiada para modelar proporciones. En la inferencia bayesiana, por ejemplo, es muy utilizada como distribución a priori cuando las observaciones tienen una distribución binomial. Uno de los principales recursos de esta distribución es el ajuste a una gran variedad de distribuciones empíricas, pues adopta formas muy diversas dependiendo de cuáles sean los valores de los parámetros de forma p y q, mediante los que viene definida la distribución. Un caso particular de la distribución beta es la distribución uniforme en [0,1], que se corresponde con una beta de parámetros p=1 y q=1, denotada Beta(1,1). Campo de variación: 0 ≤ x ≤ 1 Parámetros: p: parámetro de forma, p > 0 q: parámetro de forma, q > 0
CONCLUSIONES
El texto paralelo fue elaborado para tener el resumen de todos los temas que se han preparado para la evaluación final, conforme sus métodos usados en las diferentes técnicas descritas para realizar los ejercicios y con conformidad que el presente sirva de apoyo. Definir de manera total cada uno de los temas que fuesen de gran utilidad, le permitirá al usuario tener idea de cual fue el objetivo a realizar durante la lectura y aprobación de sus ejercicios. Demostrar que es muy probable la memorización de cada uno de los temas para la utilización al momento que se es dado un problema. Indicar que este resumen no permite que el lector se confunda tratando de entenderlo por lo cual es breve y conciso.
RECOMENDACIONES
Interpretar de manera concreta los temas y comprender que se hizo lo posible para que cada uno no fuese complicado de entender y adquirir Justificar que la manera en que usted lo indique se puede realizar su lectura de manera general y aceptable.
BIBLIOGRAFIAS
(n.d.). Retrieved from https://sites.google.com/ AcademiaLab. (2022). Retrieved from https://academia-lab.com/ Berenson, M. L., & Levine, D. M. (2006). Estadística para administración. Pearson Educación. gestiopolis. (2020, septiembre 15). GestioPolis.com . Retrieved from https://www.gestiopolis.com/ Jorge Castro Monge, M. (n.d.). jcastrom.jimdofree. Retrieved from https://jcastrom.jimdofree.com/ marta. (n.d.). superprof.es. Retrieved from https://www.superprof.es/ Sanjuán, F. J. (2017, noviembre 16). Economipedia.com. Retrieved from https://economipedia.com/ support.minitab.com. (n.d.). Retrieved from https://support.minitab.com