最大似然估计的核心,就是找出那个能让你的数据看起来最不意外的解释。本文用一枚硬币的故事、一个懒侦探的比喻和几行Python代码,把这个统计学的底层逻辑讲得清清楚楚。不管你是做数据分析还是机器学习,看懂它都值。
最大似然估计,就是挑出那个能让你的数据看起来最不意外的解释。
就这一句。下面所有的内容都是围着这句话转。
你有数据:七次正面,三次反面。你有一堆可能的解释:硬币是公平的?硬币偏向正面70%?硬币被粘住了永远正面?最大似然就是挨个试这些解释,问一个问题:在这个解释下,我的数据有多“正常”?
公平硬币也能掷出7次正面,概率虽然小但可能。但一枚70%偏向正面的硬币,让这个结果显得稀松平常,就像周二一样普通。你的直觉会倾向那个更平常的解释——恭喜,直觉就是最大似然。
你是个侦探,总在案发后到达现场。你没看到发生了什么,只看到现场:碎掉的灯、泥脚印、没叫的狗。从这些痕迹里,你逆向推理出最可信的故事。你选的不是犯罪本身,而是那个最容易留下这些痕迹的嫌疑人。
硬币已经掷完,数据已成事实。你迟到现场,指着最能匹配证据的解释。
日常说话里它们差不多,但统计学里是两种不同的活。
| 问题 | 概率 | 似然 |
|---|---|---|
| 什么固定 | 规则(硬币) | 数据(掷出的结果) |
| 什么未知 | 数据 | 规则 |
| 方向 | 规则 → 数据 | 数据 → 规则 |
| 你的角色 | 导演 | 侦探 |
概率:你知道硬币是公平的,预测会出现几个正面。似然:你已经看到了7正3反,反过来猜这枚硬币到底是什么偏向。

假设硬币有一个隐藏旋钮,设定正面概率 p。p=0.5 公平,p=0.7 偏向正面。我们看不到旋钮,这就是问题。统计上管它叫参数,其实就是宇宙设置的某个旋钮,然后藏了起来。
先猜 p=0.5: 每次正面概率0.5,反面0.5,10次独立掷,总概率 = 0.5^10 ≈ 0.000977
再猜 p=0.7: 正面0.7,反面0.3,总概率 = 0.7^7 × 0.3^3 ≈ 0.00222
0.00222 比 0.000977 大一倍多。说明7正3反在70%偏向的硬币下更“不意外”。侦探的心在往这边偏。

旋钮是连续的,我们可以试所有 p 值,画出一条似然曲线。

山顶在 p=0.7 处。那就是最大似然估计——让数据最不意外的那个解释。对于硬币,它就是正面次数除以总掷数:7/10=0.7。
乘十个小于1的数已经很小了,如果是上万条数据,计算机会因为数值下溢直接归零。解法:对似然取对数,把乘法变成加法。
对数把乘法变成加法。
取对数后山顶位置不变,但计算稳定多了。


import numpy as np
flips = np.array([1, 1, 0, 1, 1, 0, 1, 1, 1, 0])
heads, total = flips.sum(), flips.size
def log_likelihood(p):
return heads * np.log(p) + (total - heads) * np.log(1 - p)
candidate_p = np.linspace(0.001, 0.999, 1000)
scores = log_likelihood(candidate_p)
best_p = candidate_p[np.argmax(scores)]
print(round(best_p, 3)) # 输出 0.7
用优化库更高效:最小化负对数似然(机器学习里常用的技巧)。
from scipy.optimize import minimize_scalar
def neg_log_likelihood(p):
return -(heads * np.log(p) + (total - heads) * np.log(1 - p))
result = minimize_scalar(neg_log_likelihood, bounds=(0.001, 0.999), method="bounded")
print(round(result.x, 3)) # 输出 0.7
对于身高这种连续数据,假设它服从正态分布。最大似然估计下,最可能的均值就是样本的平均数,最可能的标准差就是样本标准差。你初中就会算平均数——实际上你早就在做最大似然估计了。
最大似然和机器学习里的“损失函数”是同一个山的不同朝向。最大化对数似然 = 最小化负对数似然(loss)。
每个模型的训练,本质上都在爬一个高维的似然山坡。
但这不是说方法错了,而是你知道了工具什么时候该用,什么时候别用。
最大似然估计,就是挑出那个能让你的数据看起来最不意外的解释。
你现在知道了“解释”是什么(隐藏的参数设置),“最不意外”怎么找(似然山顶),以及它怎样支撑着半个机器学习世界。
世界藏着它的旋钮,我们学着理智地、固执地、一步步推理回去。

免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断