# 参数估计

## 矩估计

矩指得是 sp.summation(X**k,(i, 1, n))/n，其中 k 为矩估计的阶数。
对于随机变量，如果在分布的形式已知的情况下，可以求出带参数的矩的表达式，然后可以和实际的样本的矩的观测值来进行比较，从而获得参数的估计值。
用这种方式来求参数的估计值称为矩估计。

## 极大似然估计

它先构造一个表达式，然后求对数之后再计算取极值时对应参数的值，当这个表达式的取值为最大的时候，也就是最接近这是情况的时候，因为真实出现的情况就可以看作时出现可能性最大的情况，这个就是背后的原理。


In [2]:
# ![20240917081108](https://raw.githubusercontent.com/Cipivious/my_try/main/img/20240917081108.png)
import numpy as np
from scipy.optimize import minimize

# 样本数据（假设为 X_1, X_2, ..., X_n）
sample_data = np.array([2, 3, 1, 4, 2])  # 示例数据，请用实际数据替换

# 1. 矩估计量
sample_mean = np.mean(sample_data)
moment_estimate_p = 1 / sample_mean
print(f"矩估计量 p = {moment_estimate_p}")

# 2. 最大似然估计量
def negative_log_likelihood(p, data):
    if p <= 0 or p >= 1:
        return np.inf  # 避免非物理意义的 p 值
    log_likelihood = len(data) * np.log(p) + np.sum((data - 1) * np.log(1 - p))
    return -log_likelihood  # 求负，因为 scipy 的 minimize 函数是求最小值

# 使用 scipy.optimize.minimize 求解最大似然估计量
initial_guess = 0.5  # 初始值
result = minimize(negative_log_likelihood, initial_guess, args=(sample_data,), bounds=[(0, 1)])
mle_estimate_p = result.x[0]

print(f"最大似然估计量 p = {mle_estimate_p}")


矩估计量 p = 0.4166666666666667
最大似然估计量 p = 0.5


In [3]:
import numpy as np
from scipy.optimize import minimize

# 样本数据（假设为 X_1, X_2, ..., X_n）
sample_data = np.array([2, 3, 1, 4, 2])  # 示例数据，请用实际数据替换

# 1. 矩估计量
sample_mean = np.mean(sample_data)
moment_estimate_p = 1 / sample_mean
print(f"矩估计量 p = {moment_estimate_p}")

# 2. 最大似然估计量
def negative_log_likelihood(p, data):
    if p <= 0 or p >= 1:
        return np.inf  # 避免非物理意义的 p 值
    log_likelihood = len(data) * np.log(p) + np.sum((data - 1) * np.log(1 - p))
    return -log_likelihood  # 求负，因为 scipy 的 minimize 函数是求最小值

# 使用 scipy.optimize.minimize 求解最大似然估计量
initial_guess = 0.5  # 初始值
result = minimize(negative_log_likelihood, initial_guess, args=(sample_data,), bounds=[(0, 1)])
mle_estimate_p = result.x[0]

print(f"最大似然估计量 p = {mle_estimate_p}")


矩估计量 p = 0.4166666666666667
最大似然估计量 p = 0.5


In [13]:
import sympy as sp

p, k = sp.symbols('p k', positive=True)
n_samples = 5
X = sp.symbols("X1:%d" % (n_samples + 1))

sample_mean = sum(X)/n_samples
moment_estimate_p = sp.Eq(1/p, sample_mean)
p_moment_estimate = sp.solve(moment_estimate_p, p)[0]
p_moment_estimate

5/(X1 + X2 + X3 + X4 + X5)

In [2]:
import sympy as sp

def likelihood(func, data, para):
    expr = sp.prod(func(row) for row in data)
    log_expr = sp.log(expr)
    diff_expr = sp.diff(log_expr, para)
    result = sp.solve(diff_expr, para)[0]
    return result

para = sp.symbols("theta")
data = sp.symbols("X1:%d" % 10)
# 用Piecewise来定义带有条件的不等式函数
def func(x):
    return sp.Piecewise(
        (1 / (1 - para), (para <= x) & (x <= 1)),  # 条件为 para <= x <= 1
        (0, True)  # 否则返回 0
    )


# para = sp.symbols("p")
# data = sp.symbols("X1:%d" % 10)
# def func(x):
#     return para * (1 - para) ** (x - 1)

result = likelihood(func=func, data=data, para=para)
print(result)
    

TypeError: cannot determine truth value of Relational