Estadística Inferencial 1
lunes, 3 de diciembre de 2018
Estimación puntual
La estimación puntual consiste en obtener un único número calculado a partir de las observaciones muéstrales, y que es utilizado como estimación del valor del parámetro
Estimación puntual.
Básicamente la estimación puntual se refiere a la elección de un estadístico, es decir, el número calculado a partir de datos de una muestra del cual se espera que permita estimar un parámetro estudiado, de la población con una “razonable aproximación”. Para explicar lo que queremos significar con razonable aproximación, caso no simple, haremos las siguientes consideraciones, en primer lugar, el valor del parámetro es desconocido, y en segundo el valor del estadístico se desconoce hasta que se obtiene la muestra. Entonces, solo podemos preguntarnos si después de un muestreo repetido, la distribución del estadístico tiene ciertas propiedades que permita considerarlo como una “aproximación”.
Un estadístico es un estimador centrado del parámetro, si, y solo si, la media de su distribución muestral es igual a.
Es decir, un estadístico es un estimador centrado si, “en promedio”, se puede esperar que sus valores sean iguales al del parámetro que se supone que aproximan.
De manera general se puede decir, que la propiedad de ser centrada es una de las mas deseadas en la estimación de puntos, aunque no es esencial y, algunas veces, pierde su valor frente a otros factores. Un defecto del criterio que se conserve la media es que, en general, no proporciona un único estadístico para un problema dado de estimación. Por ejemplo, se puede demostrar que, para muestras aleatorias de tamaño 2, la media (X1+X2)/2 y la media ponderada, donde a y b son constantes positivas, son estimadores centrados de la media de la población, y también lo son la mediana muestral y el recorrido medio si, además, suponemos que la población es simétrica. Esto nos sugiere que debemos buscar otro criterio que decidir cuál de varios estimadores centrados es el “mejor” para estimar en determinado parámetro.
Estimación de intervalos
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad.
Intervalo de confianza
Se le llama estimación puntual porque a ese número, que se utiliza como estimación del parámetro, se le puede asignar un punto sobre la recta real. En la estimación por intervalos se obtienen dos puntos ( un extremo inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con cierta seguridad el valor del parámetro.
El estimador del parámetro poblacionales una función de las variables aleatorias u observaciones muéstrales.
Para una realización particular de la muestra se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional.
Vemos pues que existe diferencia entre estimador y estimación. El estimador es un estadístico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta será la estimación puntual. El estimador tendrá su distribución muestral.
PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES
a) Estimador insesgado
Si tenemos un gran número de muestras de tamaño y obtenemos el valor del estimador en cada una
de ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ .
Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a
estimar.
b) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error estándar ,es decir, entre dos estimadores insesgados de un parámetro dado es más eficiente el de menor varianza.
c) Estimador consistente
Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida que aumenta el tamaño de la muestra . Es decir, la probabilidad de que la estimación sea el verdadero valor del parámetro tiende a 1.
d) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información importante sobre el parámetro.
La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que tratamos de estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que se encuentre el parámetro que tratamos de estimar.
Este intervalo contiene al parámetro estimado con un determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional
Variabilidad del Parámetro
Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más observaciones deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión.
Límite de Confianza
Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido.
Valor a
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α)
Como los estimadores puntuales no pueden esperarse efectivamente que coincidan con las cantidades que se supone que estiman, a veces es preferible substituirlos por estimador de intervalos, es decir, intervalos para los que podemos asegurar, con un grado de certeza razonable, que contiene el parámetro considerado.
Estimación puntual.
Básicamente la estimación puntual se refiere a la elección de un estadístico, es decir, el número calculado a partir de datos de una muestra del cual se espera que permita estimar un parámetro estudiado, de la población con una “razonable aproximación”. Para explicar lo que queremos significar con razonable aproximación, caso no simple, haremos las siguientes consideraciones, en primer lugar, el valor del parámetro es desconocido, y en segundo el valor del estadístico se desconoce hasta que se obtiene la muestra. Entonces, solo podemos preguntarnos si después de un muestreo repetido, la distribución del estadístico tiene ciertas propiedades que permita considerarlo como una “aproximación”.
Un estadístico es un estimador centrado del parámetro, si, y solo si, la media de su distribución muestral es igual a.
Es decir, un estadístico es un estimador centrado si, “en promedio”, se puede esperar que sus valores sean iguales al del parámetro que se supone que aproximan.
De manera general se puede decir, que la propiedad de ser centrada es una de las mas deseadas en la estimación de puntos, aunque no es esencial y, algunas veces, pierde su valor frente a otros factores. Un defecto del criterio que se conserve la media es que, en general, no proporciona un único estadístico para un problema dado de estimación. Por ejemplo, se puede demostrar que, para muestras aleatorias de tamaño 2, la media (X1+X2)/2 y la media ponderada, donde a y b son constantes positivas, son estimadores centrados de la media de la población, y también lo son la mediana muestral y el recorrido medio si, además, suponemos que la población es simétrica. Esto nos sugiere que debemos buscar otro criterio que decidir cuál de varios estimadores centrados es el “mejor” para estimar en determinado parámetro.
Estimación de intervalos
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad.
Intervalo de confianza
Se le llama estimación puntual porque a ese número, que se utiliza como estimación del parámetro, se le puede asignar un punto sobre la recta real. En la estimación por intervalos se obtienen dos puntos ( un extremo inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con cierta seguridad el valor del parámetro.
El estimador del parámetro poblacionales una función de las variables aleatorias u observaciones muéstrales.
Para una realización particular de la muestra se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional.
Vemos pues que existe diferencia entre estimador y estimación. El estimador es un estadístico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta será la estimación puntual. El estimador tendrá su distribución muestral.
PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES
a) Estimador insesgado
Si tenemos un gran número de muestras de tamaño y obtenemos el valor del estimador en cada una
de ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ .
Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a
estimar.
b) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error estándar ,es decir, entre dos estimadores insesgados de un parámetro dado es más eficiente el de menor varianza.
c) Estimador consistente
Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida que aumenta el tamaño de la muestra . Es decir, la probabilidad de que la estimación sea el verdadero valor del parámetro tiende a 1.
d) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información importante sobre el parámetro.
La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que tratamos de estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que se encuentre el parámetro que tratamos de estimar.
Este intervalo contiene al parámetro estimado con un determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional
Variabilidad del Parámetro
Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más observaciones deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión.
Límite de Confianza
Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido.
Valor a
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α)
Como los estimadores puntuales no pueden esperarse efectivamente que coincidan con las cantidades que se supone que estiman, a veces es preferible substituirlos por estimador de intervalos, es decir, intervalos para los que podemos asegurar, con un grado de certeza razonable, que contiene el parámetro considerado.
Distribución t de Student
En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra.
CARACTERIZACIÓN
La distribución t de Student es la distribución de probabilidad del cociente
donde
- Z es una variable aleatoria distribuida según una normal típica (de media nula y varianza 1).
- V es una variable continua que sigue una distribución χ² con grados de libertad.
- Z y V son independientes
Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad .
miércoles, 24 de octubre de 2018
jueves, 13 de septiembre de 2018
Distribucion muestral de la proporcion.
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal .
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal
donde p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.
Suscribirse a:
Entradas (Atom)