# **Hipergeométrica no central (sesgo por “odds”)**

Resumen operativo: hay **dos** “hipergeométricas no centrales” para sesgo por *odds*. Eligen sin reemplazo desde una población finita con ponderaciones. Diferencia clave: **Fisher** condiciona globalmente en $n$ y sesga con un **factor de odds fijo**; **Wallenius** sesga **secuencialmente** en cada extracción con probabilidades proporcionales a pesos restantes. Si $\omega=1$ ambas colapsan a la hipergeométrica central.

# 1) Fisher no central (FNCH)

**Escenario**: dos clases, población $N=K_1+K_2$, muestra de tamaño fijo $n$, sesgo global $\omega>0$ para la clase 1.
**PMF**:

$$
\mathbb P(X=k)
=\frac{\binom{K_1}{k}\binom{K_2}{n-k}\,\omega^{k}}
{\displaystyle Z(\omega)},\quad
Z(\omega)=\sum_{j=L}^{U}\binom{K_1}{j}\binom{K_2}{n-j}\omega^{j},
$$

con $L=\max(0,n-K_2),\ U=\min(n,K_1)$.
**Momentos por derivadas del normalizador**:

$$
\mathbb E[X]=\omega\,\frac{Z'(\omega)}{Z(\omega)},\qquad
\mathrm{Var}(X)=\omega\,\frac{d}{d\omega}\mathbb E[X].
$$

**Inferencia**: en tablas $2\times2$ con márgenes fijos, la verosimilitud de $\omega$ es $\ell(\omega)=x\log\omega-\log Z(\omega)+\text{cte}$. El **CMLE** de $\omega$ satisface $\mathbb E_{\omega}[X]=x$. Es la base del test exacto de Fisher y de IC condicionados del *odds ratio*.
**Multiclase**: $\Pr(\mathbf x)\propto \prod_i \binom{K_i}{x_i}\omega_i^{x_i}$ sobre $\sum x_i=n$, con normalizador $\sum_{\sum x_i=n}\prod_i \binom{K_i}{x_i}\omega_i^{x_i}$.

# 2) Wallenius no central (WNCH)

**Escenario secuencial**: en cada extracción, la prob. de elegir clase $i$ es proporcional a **peso** $w_i$ por **remanente** $R_i$. Para dos clases,

$$
\Pr(\text{clase 1 en el paso t}\mid R_1,R_2)=\frac{w_1 R_1}{w_1 R_1+w_2 R_2}.
$$

El conteo final $X$ tiene una pmf definida por una **integral** (no hay forma cerrada simple).
**Momentos**: no hay fórmula cerrada general; se usan ecuaciones implícitas o aproximaciones determinísticas y de Laplace.
**Multiclase**: igual regla proporcional con $m$ pesos $w_i$.

# 3) Cuándo usar cada una

* **FNCH**: condicionas en $n$ y en **márgenes fijos**. Sesgo representado por *odds ratio* constante. Contingencia $2\times2$, ensayos condicionados, selección “por preferencia fija”.
* **WNCH**: selección **competitiva** paso a paso. Atracción constante por categoría pero dependiente del inventario remanente. “Pesca con distinta capturabilidad”, muestreo preferencial, *ranking* con empates.

# 4) Relaciones y límites

* $\omega=1$ o $w_i$ iguales $\Rightarrow$ hipergeométrica central.
* **Fracción de muestreo pequeña** $n/N\to 0$: ambas $\Rightarrow$ ensayos casi i.i.d. con prob.

$$
p'\approx \frac{\omega p}{(1-p)+\omega p},\quad p=\frac{K_1}{N}.
$$

Entonces $X\approx \mathrm{Bin}(n,p')$.

* Multiclase, $n/N\to 0$: $\Rightarrow$ multinomial con $p'_i\propto w_i p_i$.

# 5) Ejemplo numérico (FNCH)

$K_1=5,\ K_2=5,\ n=3,\ \omega=2$.
Soporte $k=0,1,2,3$. Normalizador $Z=390$.

$$
\begin{array}{c|cccc}
k & 0 & 1 & 2 & 3\\\hline
\Pr(X=k) & 0.02564 & 0.25641 & 0.51282 & 0.20513
\end{array}
$$

$\mathbb E[X]\approx 1.8974,\ \mathrm{Var}(X)\approx 0.5536$.
Para comparación central $(\omega=1)$: $\mathbb E[X]=nK_1/N=1.5$.
Aproximación *binomial-tilt* con $p'=2\cdot 0.5/(0.5+2\cdot 0.5)=2/3$ da media $2.0$ cercana.

# 6) Simulación

* **WNCH** exacta por proceso secuencial: repetir $n$ veces, elegir clase $i$ con prob. $w_i R_i/\sum_j w_j R_j$, decrementar $R_i$.
* **FNCH**: muestreo exacto por **DP** del normalizador y *inverse transform* en el soporte $\{L,\dots,U\}$; o por *Metropolis–Hastings* en $k$ con kernel de nacimiento–muerte que respeta la razón

$$
\frac{\Pr(k+1)}{\Pr(k)}=\frac{(K_1-k)(n-k)}{(k+1)(K_2-n+k+1)}\,\omega.
$$

# 7) Cómputo y aproximaciones

* **FNCH**: $Z(\omega)$ se computa de forma **estable** con recursiones sobre $k$ o con suma log-espacio. Momentos por derivadas numéricas de $\log Z$.
* **WNCH**: pmf y CDF por cuadraturas adaptativas o aproximaciones de **saddlepoint**.
* **Normal** multivariante: para conteos moderados, usa media y covarianza condicionadas con **FPC**.

# 8) Extensiones

* **Multivariante FNCH**: $\Pr(\mathbf x)\propto \prod_i \binom{K_i}{x_i}\omega_i^{x_i}$ en $\sum x_i=n$.
* **Multivariante WNCH**: regla proporcional $w_i R_i$ en cada paso.
* **Reglas de paro**: parar al alcanzar $r$ éxitos induce análogos “no centrales” de la hipergeométrica negativa.

# 9) Usos típicos

* FNCH: inferencia exacta en tablas $2\times2$ con márgenes fijos, estimación del *odds ratio* condicional.
* WNCH: captura desigual, muestreo preferente, draws con “atractividad” constante dependiente del stock.

**Guía rápida**: márgenes fijos y sesgo por *odds* global $\Rightarrow$ **Fisher**. Selección ponderada paso a paso $\Rightarrow$ **Wallenius**.
