【二项分布的最大似然估计值怎么求】在统计学中,最大似然估计(Maximum Likelihood Estimation, MLE)是一种常用的参数估计方法。对于二项分布来说,我们通常需要根据一组观测数据来估计其参数,即成功概率 $ p $。本文将通过总结的方式,结合表格形式,系统地介绍如何求解二项分布的最大似然估计值。
一、基本概念
二项分布描述的是在 $ n $ 次独立重复试验中,事件发生成功次数的分布。其概率质量函数为:
$$
P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}
$$
其中:
- $ X $ 是随机变量,表示成功次数;
- $ n $ 是试验次数;
- $ p $ 是每次试验成功的概率(待估计参数);
- $ k $ 是观测到的成功次数。
二、最大似然估计的基本思路
最大似然估计的核心思想是:找到使得观测数据出现的概率最大的参数值。
设我们有 $ m $ 个样本,每个样本对应一次 $ n $ 次独立试验,得到成功次数分别为 $ x_1, x_2, ..., x_m $。那么,似然函数为:
$$
L(p) = \prod_{i=1}^{m} \binom{n}{x_i} p^{x_i} (1-p)^{n - x_i}
$$
为了方便计算,我们取对数似然函数:
$$
\ln L(p) = \sum_{i=1}^{m} \left[ \ln \binom{n}{x_i} + x_i \ln p + (n - x_i) \ln(1 - p) \right
$$
由于 $\ln \binom{n}{x_i}$ 不依赖于 $ p $,在求导时可以忽略,因此简化后的对数似然函数为:
$$
\ln L(p) = \sum_{i=1}^{m} \left[ x_i \ln p + (n - x_i) \ln(1 - p) \right
$$
接下来,对 $ p $ 求导并令导数为零,即可得到最大似然估计值。
三、求解过程
对对数似然函数求导:
$$
\frac{d}{dp} \ln L(p) = \sum_{i=1}^{m} \left( \frac{x_i}{p} - \frac{n - x_i}{1 - p} \right)
$$
令导数等于零:
$$
\sum_{i=1}^{m} \left( \frac{x_i}{p} - \frac{n - x_i}{1 - p} \right) = 0
$$
整理得:
$$
\frac{\sum x_i}{p} = \frac{\sum (n - x_i)}{1 - p}
$$
两边交叉相乘:
$$
(1 - p) \sum x_i = p \sum (n - x_i)
$$
展开并整理:
$$
\sum x_i - p \sum x_i = p \sum n - p \sum x_i
$$
消去相同项后:
$$
\sum x_i = p \sum n
$$
最终得到:
$$
p = \frac{\sum x_i}{\sum n}
$$
四、结论与公式总结
步骤 | 内容 |
1 | 定义二项分布的概率质量函数 |
2 | 构建似然函数和对数似然函数 |
3 | 对对数似然函数关于 $ p $ 求导 |
4 | 令导数为零,解方程 |
5 | 得到最大似然估计值:$ \hat{p} = \frac{\sum x_i}{\sum n} $ |
五、示例说明
假设我们进行了以下实验:
实验编号 | 试验次数 $ n $ | 成功次数 $ x $ |
1 | 10 | 6 |
2 | 10 | 7 |
3 | 10 | 5 |
则:
$$
\sum x = 6 + 7 + 5 = 18,\quad \sum n = 10 + 10 + 10 = 30
$$
所以:
$$
\hat{p} = \frac{18}{30} = 0.6
$$
六、总结
二项分布的最大似然估计值可以通过对数似然函数求导并解方程得到。最终结果为:
$$
\hat{p} = \frac{\text{所有样本中成功次数之和}}{\text{所有样本中试验次数之和}}
$$
该方法简单有效,适用于大多数实际问题中的参数估计场景。