Si tuviera un país de 100 millones de personas y su estatura promedio fuera de 5 pies y eligiera 10 millones de ellas al azar, ¿su altura promedio también sería de 5 pies?

Hay un teorema realmente importante en las estadísticas que nos dice cómo se comportará el promedio de una muestra elegida al azar. Se llama teorema del límite central. En esencia, dice que el promedio de la muestra seguirá una distribución normal centrada en la media de la población y con una desviación estándar menor que la desviación estándar de la población por un factor igual a la raíz cuadrada del tamaño de la muestra.

Entonces, en su escenario, la desviación estándar del promedio de la muestra será un factor de aproximadamente 3200 más pequeño que la desviación estándar de la población. 6.4 pulgadas es probablemente demasiado alto para SD de la población, pero podemos permitirnos ser conservadores. Usando este valor, sabemos que el promedio de la muestra tendrá una desviación estándar de aproximadamente 0.002 pulgadas. A partir de esto, podemos decir, por ejemplo, que el promedio de la muestra estará dentro de 0.01 pulgadas de cinco pies con una probabilidad del 99.99994%. (La probabilidad es incluso mayor si su muestra se toma sin reemplazo).

Entonces, si bien no podemos esperar que el promedio de la muestra sea exactamente el mismo que el promedio de la población, podemos esperar que sea extremadamente cercano con una probabilidad extremadamente alta ya que la muestra es increíblemente grande.

Supreme Content

Re: la pregunta de altura, una submuestra al azar de una distribución normal probablemente tendrá _efectivamente_ la misma media que toda la distribución. (Las alturas de las personas se distribuyen normalmente.) De manera efectiva, quiero decir que si presta la atención adecuada a los dígitos significativos con los que puede medir con precisión, una prueba t mostrará que los medios son indistinguibles.

Esto es lo que quiero decir prestando atención a los dígitos significativos: digamos que sus datos de altura están en centímetros. Con una n de 10 millones, sería fácil dividir la distribución estándar de la muestra por la raíz cuadrada de 10 millones y rechazar la hipótesis nula basada en alguna diferencia en las décimas o incluso milésimas de un nivel milimétrico, pero sería una tontería.

Re: la pregunta sobre la tasa de homicidios, eso no tiene mucho sentido. Las tasas de asesinatos se miden dentro de límites geográficos definidos. Si su muestra vive en la misma geografía que la población, entonces, por supuesto, la tasa de homicidios será la misma.

En general, no, esto no funciona. Depende de cómo la cantidad que se muestrea está realmente distribuida por toda la población.

Como ilustración extrema, supongamos que hay un millón de ciudadanos en un país. Supongamos que 999,999 ciudadanos pobres tienen cada uno un solo dólar en su nombre, y el último, el rey, tiene $ 999,000,001 (mil millones menos 999,999). *

Entonces, el patrimonio neto promedio de una persona en este país es de mil millones dividido por un millón, o $ 1,000. No muy representativo de la situación real, ¿verdad? Si eliges 100.000 ciudadanos al azar, es muy probable que cada uno de ellos sea pobre, solo hay un rey, por lo que el valor neto promedio de esa muestra probablemente sea de solo $ 1.

El teorema del límite central no funciona tan bien en situaciones como la anterior, que no están “distribuidas de forma aleatoria”. Necesitará un tamaño de muestra irrazonablemente grande para capturar la situación con precisión. Dicho esto, el teorema del límite central todavía se aplica aquí, simplemente no es práctico.

* ¿Hacia dónde se dirige la economía estadounidense?

Teóricamente es posible que la altura promedio en el grupo seleccionado sea la misma que para toda la población, pero la probabilidad de que sea muy baja. En casi todos los casos, los promedios diferirán bastante.

More Interesting