Teorema central del limite estadistica

Historia del teorema del límite central

El teorema del límite central para las medias muestrales dice que si se siguen extrayendo muestras cada vez más grandes (como lanzar uno, dos, cinco y, finalmente, diez dados) y se calculan sus medias, las medias muestrales forman su propia distribución normal (la distribución muestral). La distribución normal tiene la misma media que la distribución original y una varianza que es igual a la varianza original dividida por el tamaño de la muestra. La variable \(n\) es el número de valores que se promedian juntos, no el número de veces que se hace el experimento.

Para decirlo de manera más formal, si se extraen muestras aleatorias de tamaño \(n\), la distribución de la variable aleatoria \(\bar{X}\), que consiste en las medias de las muestras, se llama distribución muestral de la media. La distribución muestral de la media se aproxima a una distribución normal a medida que \(n\), el tamaño de la muestra, aumenta.

Introduzca el valor bajo, el valor alto, la media, la desviación estándar (ST. Dev.), el tamaño de la muestra (n) y, a continuación, pulse Calcular para encontrar la probabilidad. También puede introducir la probabilidad y dejar en blanco el Bajo o el Alto, y encontrará el límite que falta.

Fórmula del teorema del límite central

El teorema del límite central afirma que si se tiene una población con una media μ y una desviación estándar σ y se toman muestras aleatorias suficientemente grandes de la población con reemplazo, entonces la distribución de las medias muestrales tendrá una distribución aproximadamente normal. Esto será cierto independientemente de si la población de origen es normal o sesgada, siempre que el tamaño de la muestra sea lo suficientemente grande (normalmente n > 30). Si la población es normal, el teorema es válido incluso para muestras inferiores a 30. De hecho, también se cumple incluso si la población es binomial, siempre que min(np, n(1-p))> 5, donde n es el tamaño de la muestra y p es la probabilidad de éxito en la población. Esto significa que podemos utilizar el modelo de probabilidad normal para cuantificar la incertidumbre al hacer inferencias sobre la media de una población basándonos en la media de la muestra.

Antes de ilustrar el uso del Teorema Central del Límite (CLT), ilustraremos primero el resultado. Para que se cumpla el resultado del CLT, la muestra debe ser suficientemente grande (n > 30). De nuevo, hay dos excepciones. Si la población es normal, el resultado es válido para muestras de cualquier tamaño (es decir, la distribución muestral de las medias muestrales será aproximadamente normal incluso para muestras de tamaño inferior a 30).

Teorema del límite central de la convolución

En teoría de la probabilidad, el teorema central del límite (CLT) establece que, en muchas situaciones, cuando se suman variables aleatorias independientes, su suma debidamente normalizada tiende a una distribución normal (informalmente una curva de campana) aunque las propias variables originales no estén distribuidas normalmente. El teorema es un concepto clave en la teoría de la probabilidad porque implica que los métodos probabilísticos y estadísticos que funcionan para las distribuciones normales pueden ser aplicables a muchos problemas que implican otros tipos de distribuciones. Este teorema ha sufrido muchos cambios durante el desarrollo formal de la teoría de la probabilidad. Las versiones anteriores del teorema se remontan a 1811, pero en su forma general moderna, este resultado fundamental en la teoría de la probabilidad se enunció con precisión en 1920,[1] sirviendo así de puente entre la teoría de la probabilidad clásica y la moderna.

Por ejemplo, supongamos que se obtiene una muestra que contiene muchas observaciones, cada una de las cuales se genera aleatoriamente de forma que no depende de los valores de las demás observaciones, y que se calcula la media aritmética de los valores observados. Si este procedimiento se realiza muchas veces, el teorema del límite central dice que la distribución de probabilidad de la media se aproximará mucho a una distribución normal. Un ejemplo sencillo de esto es que si uno lanza una moneda muchas veces, la probabilidad de obtener un número determinado de caras se aproximará a una distribución normal, con la media igual a la mitad del número total de lanzamientos. En el límite de un número infinito de lanzamientos, será igual a una distribución normal.

Ejemplo de teorema central del límite

La distribución muestral es una distribución teórica. Se crea tomando muchas muestras de tamaño \N(n\) de una población. Cada media de la muestra se trata entonces como una única observación de esta nueva distribución, la distribución muestral. La genialidad de pensar de esta manera es que reconoce que cuando tomamos una muestra estamos creando una observación y esa observación debe proceder de alguna distribución particular. El Teorema Central del Límite responde a la pregunta: ¿de qué distribución procede la media de la muestra? Si se descubre esto, entonces podemos tratar una media muestral como cualquier otra observación y calcular las probabilidades sobre los valores que podría tomar. En efecto, hemos pasado del mundo de la estadística, en el que sólo sabemos lo que tenemos de la muestra, al mundo de la probabilidad, en el que conocemos la distribución de la que procede la media muestral y los parámetros de esa distribución.

Las razones por las que se muestrea una población son obvias. El tiempo y el gasto de comprobar cada factura para determinar su validez o cada envío para ver si contiene todos los artículos puede superar con creces el coste de los errores de facturación o envío. En el caso de algunos productos, el muestreo requeriría su destrucción, lo que se denomina muestreo destructivo. Un ejemplo de ello es la medición de la capacidad de un metal para resistir la corrosión del agua salada para las piezas de los buques oceánicos.