莱特兄弟曾致信史密森尼学会,索取所有关于人类飞行的资料。他和奥维尔兄弟如饥似渴地研读了当时顶尖航空研究人员的每一篇论文、每一项理论和每一次计算。他们深入研究了奥托·李林塔尔的滑翔机设计、奥克塔夫·沙努特的工程原理,以及塞缪尔·兰利关于升力和阻力的表格。
然而,他们随后做了一件极具颠覆性的事:对所有这些既有知识提出了质疑。
当他们的滑翔机表现与已发布的实验数据不符时,莱特兄弟并没有简单地归咎于自身。相反,他们选择自行建造风洞,并亲自测试了超过200种机翼设计。他们的发现令人震惊不已:李林塔尔的升力系数——整个航空领域一直以来所依赖的关键数据——不仅有误,而且是彻头彻尾的错误。
莱特兄弟的质疑并非出于傲慢,他们运用的是“第一性原理思维”。正是这种思维,使得他们在1903年成功实现首次飞行,而拥有更多资金、声望和资源的兰利,却在仅仅九天前,将他的飞行器坠毁在了波托马克河中。
当今的数据科学家们正面临着类似的挑战。人们被各种操作手册、框架和最佳实践所包围,例如A/B测试指南、指标分类体系、模型选择清单等。这些工具无疑是宝贵的。然而,正如兰利的表格一样,当它们被盲目应用时,也可能将我们引入歧途。
知名的战略性数据科学家们并不会在框架和第一性原理之间做选择。他们深谙两者结合之道:框架带来效率,第一性原理赋予洞察。二者相辅相成,能够将仅仅执行任务的人员与真正的战略合作伙伴区分开来。
什么是第一性原理思维?
第一性原理思维,意味着将问题分解到其最根本的真相,并在此基础上从头开始构建解决方案。亚里士多德曾将其描述为“探寻事物已知的第一基础”。
在实践中,这意味着需要提出以下问题:
- 我们确切知道的绝对真理是什么?
- 我们正在做出哪些假设?
- 这些假设中,哪些是可以被质疑和挑战的?
这并非意味着要完全否定现有的知识体系:莱特兄弟同样研究了所有可用的研究成果;他们只是没有将其奉为圭臬,不加批判地全盘接受。
对于数据科学家而言,这一点同样适用。框架是地图——它们提供了穿越熟悉地形的经验证的捷径。而第一性原理则是指南针,当地图变得模糊不清时,它能帮助人们保持方向感,不致迷失。
数据科学家为何此刻需要第一性原理思维?
数据科学领域中框架的普及自有其充分理由。它们能够帮助团队快速进行实验、定义指标并构建模型。然而,它们也可能带来虚假的自信。
曾有团队执行了看似完美的A/B测试,但却回答了一个错误的问题。也曾有标准指标生成了看起来令人印象深刻,但实际上未能衡量任何有意义内容的仪表盘。这些失败并非因为框架本身存在缺陷,而是因为没有人停下来提出第一性原理的关键问题:我们真正试图为哪个决策提供信息?我们真正想要衡量的是什么价值?我们真的需要如此复杂的程度吗?
这一点比以往任何时候都更加重要,因为人工智能正在自动化数据科学的执行层面。生成式AI能够出色地查询数据、生成可视化图表并应用既有框架。然而,它却无法判断所提出的问题是否正确。
第一性原理思维是数据科学家的核心差异化优势。它是一种让框架能够立足于现实的关键技能,并正成为战略性数据科学家最不可或缺的能力。
第一性原理如何改变一切
以下是三个案例,它们清晰地表明,尽管数据科学的操作手册可能编写得非常完善,但若盲目地严格遵循,反而可能导致糟糕的结果。
超越教科书式的A/B测试
框架通常会指导:定义假设、随机分配用户、衡量主要指标、检查显著性。如果提出的问题本身是正确的,这一流程无疑能够完美运作。
但第一性原理的质疑则来得更早:我们究竟想为哪个决策提供信息?我们究竟想解决哪种不确定性?
曾有一个团队在测试一个新的推荐算法。按照框架思维,他们会随机分配用户,衡量点击率,运行两周,然后发布表现最佳的版本。
然而,当团队运用第一性原理进行审视时,却发现了不同的情况。团队并不担心点击量的增长——早期迹象已表明点击量会上升。团队真正不确定的是,这些点击是否会带来真正的用户参与度,还是仅仅制造了无效的噪音。
于是,团队改变了衡量指标。他们不再仅仅关注点击量,而是转而聚焦于回访次数、会话深度和长期参与度。结果如何?新的算法虽然将点击量提高了12%,但回访次数却下降了8%。标准的框架可能会建议“立即发布”。但第一性原理的审视却告诉团队:“时机未到。”
团队最终判断,新算法过于注重“标题党”效应。框架为团队提供了方法论,而第一性原理则指明了正确的方向与问题。
我们的指标真正衡量的是什么?
北极星指标、OKR、HEART等指标框架之所以强大,在于它们能够提供结构化的指引。然而,它们也可能制造一种错觉,让人误以为已经衡量了真正重要的事物。
第一性原理思维会追问:我们真正关注的根本行为或价值是什么?这个指标真的能准确捕捉到它吗?
以用户参与度为例。许多框架会建议使用日活跃用户(DAU)、会话时长或每次会话行为数作为衡量标准。这些看似合理的代理指标,但它们真的准确吗?
- 对于一款冥想应用而言,更长的会话时长可能看起来“更好”,但其根本目标是培养用户可持续的冥想习惯。这可能意味着随着时间的推移,用户的会话时长反而会变得更短。
- 对于一款分析工具而言,每个用户查询次数的增加可能预示着更深入的使用,但也可能意味着用户在寻找答案时遇到了困难。其真正的价值在于提供更快、更具针对性的洞察。
曾有团队在接手一份新工作时,继承了一个仪表盘,其中自豪地将每周活跃用户数报告为主要成功指标。然而,深入研究后发现,大多数“活跃”用户仅仅是登录、浏览片刻便离开了,并未完成任何实际任务。从第一性原理的视角出发,该团队确定真正的价值在于完成的任务数量。一旦将衡量指标转向“任务完成数”,团队便发现(正如预期)在新定义下,实际使用量远低于此前,但这种新的衡量框架为团队提供了清晰的指引,明确了应将重点放在何处,以推动有意义的产品采纳。
框架为团队提供了丰富的指标选择。而第一性原理思维则能帮助判断,这些指标中是否有任何一个能够真正反映产品的核心价值。有时标准指标恰如其分,但有时它们却可能带来危险的误导。
第一性原理如何拯救一次产品发布
早期职业生涯中,一个团队曾遇到一个清晰的例子:当时团队的任务是构建一个“用户质量评分”系统,以帮助销售部门优先处理潜在客户。
按照框架方法,解决方案显而易见:采用监督学习模型,预测转化概率,然后根据得分进行排序。团队拥有所需的数据、特征和方法论。
然而,在项目推进两周后,正当团队努力争取微小的性能提升时,有人提出了一个关键问题:销售部门究竟会如何利用这个评分来做出决策?
团队向销售部门咨询了这个问题。得到的答案并非“给我精确的概率值”。而是:“我应该投入时间和精力进行个性化沟通来致电这个潜在客户,还是仅仅发送一封快速的标准化邮件即可?”
这个问题彻底改变了项目的方向。团队发现,他们需要的并非一个覆盖完整概率范围的复杂模型,而是一个围绕特定阈值进行优化、简单且可解释的分类器。
通过重新定义问题,团队从集成模型转向了逻辑回归,削减了一半的特征,提前三周交付了成果——并且最终交付了一个销售部门真正能投入使用的工具。
通过回归第一性原理,团队明确了真正的核心问题,随后再结合标准框架构建了解决方案。
指南针与地图
核心教训是:战略性数据科学家不会在框架和第一性原理之间做选择。他们会巧妙地将二者结合。
- 框架是地图——它们让团队能够快速行动并利用积累的知识。
- 第一性原理是指南针——当地图未能清晰指引方向时,它能帮助团队保持正确的航向。
莱特兄弟并未全盘否定那个时代的研究成果。他们在前人基础上继续探索,但也深知何时需要回归本源,从基础重新审视。
正是这种思维模式的转变,将战略性数据科学家与战术执行者区分开来。这并非关乎掌握更多方法或更努力地工作,而在于懂得何时遵循地图的指引,以及何时需要校准自己的指南针。
在人工智能的辅助下,应用框架将变得越来越容易。然而,指南针——那需要由数据科学家自行打造。而这正是未来几年中,能够让数据科学家保持相关性、战略性和不可或缺的关键所在。
