# Estimación Puntual de Parámetros

## Introducción

La estimación puntual es un procedimiento fundamental en estadística inferencial que permite obtener una única aproximación numérica de un parámetro desconocido de una población a partir de una muestra de datos. Su importancia radica en que proporciona una herramienta para realizar inferencias sobre la población sin necesidad de observarla en su totalidad, facilitando la toma de decisiones en contextos científicos, económicos e industriales. La calidad de un estimador puntual depende de sus propiedades, como insesgamiento, consistencia, eficiencia y suficiencia, las cuales garantizan que las estimaciones sean lo más precisas y confiables posible.

---

## Propiedades de los Estimadores

### **1. Insesgamiento**
Un estimador $\hat{\theta}$ es **insesgado** si su valor esperado es igual al parámetro:

$$ E[\hat{\theta}] = \theta $$

Si un estimador no es insesgado, se dice que tiene **sesgo**, definido como:

$$ B(\hat{\theta}) = E[\hat{\theta}] - \theta $$

Si $B(\hat{\theta}) \to 0$ cuando $n \to \infty$, el estimador es **asintóticamente insesgado**.

### **2. Consistencia**
Un estimador es **consistente** si converge en probabilidad al verdadero valor del parámetro a medida que el tamaño de la muestra aumenta:

$$ \hat{\theta}_n \to \theta \quad \text{cuando} \quad n \to \infty $$

Equivale a decir que para cualquier $\epsilon > 0$:

$$ P(|\hat{\theta}_n - \theta| < \epsilon) \to 1 \quad \text{cuando} \quad n \to \infty $$

### **3. Eficiencia**
Un estimador es **eficiente** si tiene la menor varianza posible entre todos los estimadores insesgados del parámetro. Formalmente, si $\hat{\theta}_1$ y $\hat{\theta}_2$ son dos estimadores insesgados de $\theta$, entonces $\hat{\theta}_1$ es más eficiente si:

$$ \text{Var}(\hat{\theta}_1) \leq \text{Var}(\hat{\theta}_2) \quad \forall \theta $$

Un estimador eficiente alcanza la **cota de Cramér-Rao**, que establece un límite inferior para la varianza de cualquier estimador insesgado:

$$ \text{Var}(\hat{\theta}) \geq \frac{1}{n I(\theta)} $$

donde $I(\theta)$ es la **información de Fisher**.

### **4. Suficiencia**
Un estimador es **suficiente** si retiene toda la información relevante sobre el parámetro contenida en la muestra. Formalmente, una estadística $T(X)$ es suficiente para $\theta$ si la distribución condicional de la muestra dado $T(X)$ no depende de $\theta$:

$$ f(X_1, ..., X_n \mid T(X), \theta) = f(X_1, ..., X_n \mid T(X)) $$

El **teorema de factorización de Fisher-Neyman** proporciona un criterio práctico para determinar si un estimador es suficiente.

### **5. Robustez**
Un estimador es **robusto** si es relativamente insensible a violaciones de los supuestos del modelo estadístico subyacente, como la presencia de valores atípicos o desviaciones de la normalidad en los datos. Matemáticamente, la robustez puede evaluarse a través de la influencia relativa de una observación en el estimador, lo que se formaliza con la **función de influencia**:

$$ IF(X; T) = \lim_{\epsilon \to 0} \frac{T(F_\epsilon) - T(F)}{\epsilon} $$

donde $T(F)$ es el estimador basado en la distribución $F$, y $F_\epsilon$ es la distribución contaminada con una pequeña proporción $\epsilon$ de valores atípicos. Un estimador robusto tiene una función de influencia acotada.


---

## Métodos de Estimación

### **1. Método de Máxima Verosimilitud (MLE)**

El método de máxima verosimilitud es una técnica ampliamente utilizada para estimar parámetros en modelos estadísticos. Su principio fundamental es encontrar el valor del parámetro que maximiza la probabilidad de observar los datos dados.

Dado un conjunto de observaciones $X_1, X_2, ..., X_n$, la función de verosimilitud se define como:

$$ L(\theta) = \prod_{i=1}^{n} f(X_i \mid \theta) $$

La estimación por máxima verosimilitud se obtiene maximizando la función de log-verosimilitud:

$$ \ell(\theta) = \sum_{i=1}^{n} \log f(X_i \mid \theta) $$

#### **Ejemplo: Estimación de los parámetros de una distribución normal**
Supongamos que tenemos una muestra aleatoria de una distribución normal $N(\mu, \sigma^2)$. La función de verosimilitud es:

$$ L(\mu, \sigma^2) = \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} \exp \left(-\frac{(X_i - \mu)^2}{2\sigma^2} \right) $$

Maximizando esta función, los estimadores de máxima verosimilitud son:

$$ \hat{\mu} = \frac{1}{n} \sum_{i=1}^{n} X_i $$
$$ \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \hat{\mu})^2 $$

### **2. Método de los Momentos**

El método de los momentos consiste en igualar los momentos teóricos de la distribución con los momentos muestrales y resolver para obtener los valores estimados de los parámetros.

#### **Ejemplo: Estimación del parámetro de una distribución exponencial**

Si una variable aleatoria $X$ sigue una distribución exponencial con parámetro $\lambda$, su esperanza es:

$$ E[X] = \frac{1}{\lambda} $$

Igualando esto con la media muestral:

$$ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i $$

El estimador de $\lambda$ por momentos es:

$$ \hat{\lambda} = \frac{1}{\bar{X}} $$

### **3. Método por Analogía**

El método por analogía selecciona un estimador que cumpla un papel análogo en la muestra al desempeñado por el parámetro en la población.

#### **Ejemplo: Estimación del parámetro de una distribución uniforme**

Para una variable aleatoria $X$ que sigue una distribución uniforme $U(0, \theta)$, el máximo valor en la muestra es un estimador natural del parámetro superior $\theta$. Es decir,

$$ \hat{\theta} = \max(X_1, X_2, ..., X_n) $$

---

## Referencias

Mayorga (2004) Inferencia estadística, Unal.
