Links donde Consultamos la información

sábado, 22 de junio de 2013

Estimaciones (puntual o por intervalos)

antes de adentrarnos en el tema de la estimación puntual o por intervalos es imperativo concretar primero ¿que es una estimación?.

Una estimación es la que se da cuando estamos frente al deber de elaborar un estudio de una población cualquiera de la que desconocemos sus parámetros, por ejemplo su media poblacional o la probabilidad de éxito si la población sigue una distribución binomial, o cualquier otro tipo de distribución, para ello, debemos tomar una muestra aleatoria de dicha población a través de la cual calcular una aproximación a dichos parámetros que desconocemos y queremos estimar. pues esa aproximación que vamos a calcular es la  que recibir por nombre "estimación". también tomaremos en cuenta el calculo del error así nuestros cálculos de dicha estimación serán mucho mas adecuados para cuando apliquemos estas herramientas en diversas situaciones.

NOTA: poder calcular una estimación debemos usar un instrumento conocido como "estimador", para ello, este debe cumplir con diversas propiedad para que este sea tomado en cuenta como herramienta de calculo de una estimación cualquiera, las propiedades que deben poseer estos "estimadores" son las siguientes:

Insesgado: Un estimador es insesgado cuando la media de su distribución muestral asociada coincide con la media de la población. Este caso se da cuando, por ejemplo


Varianza mínima: La variabilidad de un estimador viene determinada por el cuadrado de su desviación estándar. En el caso del estimador, su desviación estándar es 

En el caso del error estándar de p´, 

teniendo este conocimiento básico en cuenta, podemos ya adentrarnos en el mundo de las estimaciones, para ello contaremos con el desarrollo de material didáctico referido a esta área a continuación, donde los temas a tratar serán en un primer lugar la estimación puntual y por ultimo pero no menos importante la estimación por intervalos.

                      (((((►((((► (((►((►(►ESTIMACIÓN PUNTUAL◄)◄))◄)))◄))))◄)))))                                    

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media μ , o la desviación estándar σ ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado ( x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional.

Variables de la estimación puntual:




Ejemplo: Una compañía llamada "Sonytron" desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor será un estimador puntual de la media de la población.

Ejemplo #1: La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución normal X. se ha observado una muestra de extensión 9 con los siguientes resultados:  

0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55. 
Si aceptamos como valor de σ el valor calculado de la cuasi-desviación típica muestral¿Cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a 0,1?

Solución:

datos muestrales
n = 9,                 ∑xi=6,35 ,           ∑2ix = 4,9675 

por tanto procedemos a hacer los siguientes cálculos respectivos:

Teniendo en cuenta que si aceptamos el valor que nos dala longitud del intervalo de confianza para una muestra de extensión n y un nivel de confianza del 95% es:

  resolviendo la inecuación: 


obtenemos un n>93.59.
Ejemplo #2: Una muestra de tamaño 10 de una población de mujeres presenta una altura media de 172 cm. y una muestra de 12 varones de otra población presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad del 95% se puede asegurar que los varones son más altos en media que las mujeres o viceversa. 

Solución: Para resolver este problema hallaremos un intervalo de confianza para la diferencia de medias al 95% y comprobaremos si dicho intervalo contiene el valor cero, en cuyo caso se puede aceptar la hipótesis de que las alturas medias son iguales con una probabilidad del 95%. Estamos entonces ante el caso del cálculo de intervalos de confianza para la diferencia de medias de dos distribuciones normales con varianzas conocidas. En esta situación el intervalo de confianza para la diferencia de medias se basa en el siguiente estadístico: 

lo que nos lleva al intervalo de confianza para la varianza definido por:

por tanto nos da como resultado el siguiente intervalo de confianza:

Como este intervalo contiene el valor cero, se puede aceptar con una probabilidad del 95%
que Por tanto, aceptaremos la hipótesis de que la estatura de los varones y las mujeres de ambas poblaciones es similar con un coeficiente de confianza del 95%. 

            
             (((((►((((► (((►((►(►ESTIMACIÓN POR INTERVALOS◄)◄))◄)))◄))))◄)))))       


Tipos de estimaciones por intervalos:


Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ

1. Sabemos (por el TCL) que, para valores grandes de n , la media muestralsigue una distribución aproximadamente normal con media µx = µ y desviación estándar , que queda de la siguiente manera:


  


2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribución normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estándar de la media.

De lo anterior se puede decir que genera la siguiente expresión:








Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la 
media de la población µ esté contenida en él es de 0,95. 


Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel 
de confianza (1 - α) del intervalo es la probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (α = 0,05). 

Intervalo de confianza para µ con σ conocida: Un vendedor mayorista de partes automotrices necesita una estimación de la vida media que puede esperar de los limpiaparabrisas en condiciones normales de manejo. La administración de la empresa ya ha determinado que la desviación estándar de la vida útil de la población es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de 100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21 meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la población de los limpiaparabrisas.

Tenemos X como la distribución de la vida útil en meses de la población de limpiaparabrisas, no sabemos qué distribución tiene, al igual que desconocemos su media.En este caso sí conocemos la desviación estándar poblacional. 

X ≈ (µ,σ = 6)

La media muestralpor el teorema central del límite se va a aproximar la distribución 
normal: 

Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la población de limpiaparabrisas, es decir para µ

es decir que el valor Z de la tabla de la normal estándar que 
deja un área de 0,9 entre
O de otro modo, como el nivel de confianza 
es 0,9, α = 0,05, entonces el valor Z que deja su derecha un área de  y a la izquierda de –Z un área de  

El error máximo de estimación es la mitad de la longitud del intervalo, E = z(α/2) * 

Con una confianza del 95%, la vida media de la población de limpiaparabrisas que vende este mayorista está entre 19,824 meses y 22,176 meses. 

Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional en meses de todos los parabrisas que vende este mayorista.

Intervalo de confianza para µ con σ desconocida:

El administrador de una planta industrial generadora de energía desea estimar, por intervalo, la cantidad de carbón que se consumió por termino medio semanalmente durante año pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400 toneladas, la desviación estándar muestral 700 toneladas. ¿Cuál será el intervalo de confianza del 95% para el consumo medio semanal durante el año pasado?. (supongamos normalidad). 

Tenemos X como la distribución de toneladas de carbón consumidas cada semana del año pasado por la planta de energía y su media y su desviación estándar desconocidas  X≈ (µ,σ)

Aunque n < 30, suponemos que la media muestral,,sigue una distribución normal  



Para estimar la desviación estándar poblacional σ vamos a utilizar la desviación estándar muestral S que es 700 toneladas. Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas de carbón en cada semana del año pasado, es decir para µ, será: 



Utilizamos la t-Student porque la desviación estándar poblacional σ es desconocida. En las tablas, una t-Student con 10 – 1 = 9 grados de libertad que deja su derecha un área de 0,025. α = 0,05 porque el nivel de confianza es de 1− α = 0,95 Con una confianza del 95%, el consumo promedio semanal de carbón durante el año pasado por esta planta de energía estará entre 10.899 toneladas y 11.901 toneladas. Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio poblacional de toneladas de carbón por semana durante el año pasado por la planta de energía

Intervalo de confianza para la probabilidad de éxito p en una binomial. 

 Durante un año y medio las ventas han estado disminuyendo de manera coherente en los 1.500 establecimientos de una cadena de comida rápida. Un empresa de consultoría ha determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala administración. Construir un intervalo de confianza del 95% para esta porción.A la población de todos los establecimientos de ésta cadena de comida rápida le vamos a llamar X que seguirá una binomial con probabilidad de éxito, probabilidad de tener signo de mala administración, p desconocida. A fin de estimar dicho parámetro, se toma una muestra de tamaño n= 95 y definimos p′ como la proporción de éxitos en la muestra. En este caso p′es 0,3 y 1-p′= 0,7 

Como n > 20, n∗p′ ≥ 5y n∗(1−p′) ≥ 5, entonces la distribución X es aproximadamente normal, i.e.: 


Como p es desconocida, la aproximaremos por p′que es la estimación puntual de p. Entonces, la proporción muestral de éxitos, que la hemos utilizado para estimar la proporción de la población tendrá la siguiente distribución.


Por lo tanto la estimación del error estándar de la proporción de establecimientos que tiene claros signos de mala será 0,057. El intervalo de confianza del 95% para la probabilidad de éxito poblacional p viene dado 
por

= 0,3±1,96∗0,047 = 0,3± 0,0921=[0,20788; 0,39212]

es el valor z*, de manera que el 95% del área bajo la curva normal se incluye entre –1,96 y 1,96.

Por lo tanto, con un nivel de confianza del 95%, la proporción de establecimientos de esta cadena de comida rápida que tiene mala administración estará entre 0,20788 y 0,39212. Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporción de establecimientos con mala administración












Bibliografía:

1) Lind, D.; Mason, R.; Marchal, W. (2001): “Estadística para Administración y Economía”. Ed.
Irwin McGraw-Hill.F.

2) Kvanli, A. (2000) “Introduction to Business Statistics” South-Western.

3) Johnson, R. (1996): “Elementary Statistics”. Ed. Duxbury.

4) Levin, R.; Rubin, D. (1996): “Estadística para Administradores”. Ed. Prentice Hall.

5) Farber, E. (1995): “A Guide to Minitab”. Ed. McGraw-Hill


Enlaces:




4) www.uv.es/ceaces/pdf/intervalos.pdf


5) www.eui.upm.es/~rafami/Estadistica/Material/Tema7-Apuntes.pdf



7) www.iesxunqueira1.com/Download/pdf/teointervalos.pdf


8) recursostic.educacion.es/.../estimacion_por_intervalos/estimacion.htm



.

































:

1 comentario:

  1. Cuando se realiza una investigación de un proyecto cualquiera de la que desconocemos sus parámetros, como su media o la probabilidad , debemos tomar una muestra variable de aquel proyecto mediante el cual se puede calcular una aproximación a dichos parámetros que no se conocen y se quieren estimar por el cual se tienen que una estimación puntual de un parámetro desconocido, como puede ser la media o la desviación estándar, es un número que se utiliza para aproximar el verdadero valor de dicho parámetro. A fin de realizar tal estimación, se toma una muestra y se calcula el parámetro muestral asociado o se puede estimar por medio de la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad

    ResponderEliminar