随着2025年最后一个季度的到来,是时候回顾并审视那些将塑造2026年数据与人工智能(AI)领域的关键趋势了。
尽管媒体头条可能聚焦于最新的模型发布和性能竞赛,但真正具有颠覆性的发展却发生在“战壕”之中——数据科学家、数据与AI工程师以及AI/ML团队正在一线将这些复杂的系统和技术投入生产应用。毫不意外,推动AI走向生产化及其随之而来的挑战,正成为引领行业航向的核心力量。
以下是定义这一演进的十大趋势,以及它们在2025年最后一个季度所预示的深远意义。
1. “数据+AI领导者”的崛起
近期,如果您频繁使用LinkedIn,可能会注意到信息流中“数据+AI”相关职位的数量显著增加,甚至在一些团队成员的头衔中也能看到这一变化。
这并非意味着您所不知晓的组织架构调整。
尽管这主要源于传统上被归类为数据或AI/ML专业人士的自发性转变,但这种头衔上的变化反映了一个行业现实:数据和AI已不再是两个独立的学科。Monte Carlo在近一年来持续探讨这一趋势,即两者正日益融合。
从所需资源和技能,到它们所解决的问题,数据和AI犹如一枚硬币的两面。这一现实正在对2025年团队与技术的演进方式产生显著影响。
2. 对话式BI炙手可热,但需冷静审视
数据民主化以各种形式已成为近十年来的趋势,而对话式BI(Conversational BI)正是这一叙事中的最新篇章。
对话式BI与所有其他BI工具的区别在于,它承诺以极高的速度和优雅的方式实现这一理想愿景——即便对于最非技术性的领域用户也是如此。
其前提很简单:只要能提出问题,就能获得答案。理论上,这对所有者和用户来说都是双赢。然而,挑战(如同所有民主化尝试)不在于工具本身,而在于被民主化的事物——数据的可靠性。
唯一比错误洞察更糟糕的,是快速传递的错误洞察。将聊天界面连接到一个不受治理的数据库,不仅会加速访问,更会加速不良后果的显现。
3. 上下文工程正成为核心学科
AI模型的输入成本大约是输出成本的300-400倍。如果上下文数据存在元数据不完整、HTML未去除或空向量数组等问题,团队在进行大规模处理时将面临巨大的成本超支。此外,混淆或不完整的上下文也是一个主要的AI可靠性问题:模糊的产品名称和糟糕的块(chunking)处理会使检索器感到困惑,而对提示词或模型的微小更改都可能导致截然不同的输出。
因此,上下文工程(Context Engineering)在2025年中成为数据与AI团队中最热门的词汇也就不足为奇了。上下文工程是一个系统性的过程,旨在为AI模型准备、优化和维护上下文数据。那些精通上游上下文监控的团队——即在数据进入昂贵的处理任务之前确保可靠的语料库和嵌入向量——将从他们的AI模型中获得更优的结果。然而,这项工作无法孤立进行。
现实情况是,仅仅对上下文数据进行可见性分析并不能解决AI质量问题,AI可观测性解决方案(如评估)也同样无法单独做到。团队需要一种全面的方法,提供对生产环境中整个系统的可见性——从上下文数据到模型及其输出。结合了数据与AI的社会技术方法(socio-technical approach),是实现规模化可靠AI的唯一途径。
4. AI热情差距持续扩大
最新的麻省理工学院报告已经说明了一切:AI面临着价值实现问题。而这部分责任,至少应由高层管理团队承担。
“仍有许多人认为AI是魔法,可以不假思索地满足一切需求。”
这是一个真实引用,反映了数据与AI团队普遍面临的一个情境:
- 对技术缺乏理解的高管设定了优先级;
- 项目未能创造价值;
- 试点项目被废弃;
- 循环往复。
企业在AI试点项目上投入了数十亿美元,却对AI将如何在何处产生影响缺乏清晰的理解——这不仅对试点项目的表现产生了显著影响,也影响了整体的AI热情。
实现价值必须是首要、次要乃至第三位的优先事项。这意味着需要赋予那些同时理解技术和驱动数据的“数据+AI”团队充分的自主权,让他们能够解决真实的业务问题,并提供必要资源以确保这些用例的可靠性。
5. 揭秘代理(Agents)与代理式工作流(Agentic Workflows)的差异
过去18个月中,代理(Agentic)的愿景一直在助推炒作机器,而“代理式AI”与“代理”之间的语义辩论最终于今年夏天在LinkedIn评论区的神圣之地展开。
问题的核心在于这两种看似相同但实际上截然不同的策略在性能和成本上的实质性差异。
- 单一用途代理(Single-purpose agents)是执行特定、明确任务的主力,其范围清晰,结果可预测。适用于专注的、重复性工作。
- 代理式工作流(Agentic workflows)通过将复杂、多步骤的流程分解为可管理的部分来处理。关键在于将大问题拆解成小模型能够处理的离散任务,然后使用更大的模型来验证和聚合结果。

图片:Monte Carlo的可观测性代理
例如,Monte Carlo的故障排除代理(Troubleshooting Agent)就采用代理式工作流,协调数百个子代理来调查数据与AI质量问题的根本原因。
6. 嵌入向量质量备受关注,监控紧随其后
与传统数据产品不同,AI的各种形式本质上并非确定性的。输入与输出并不总是完全一致。因此,在这种背景下,要弄清“良好”的定义,不仅意味着衡量输出结果,还要衡量喂养这些结果的系统、代码和输入。
嵌入向量(Embeddings)就是这样一个系统。
当嵌入向量未能准确表示源数据的语义时,AI将收到错误的上下文信息,无论向量数据库或模型性能如何。这正是为什么嵌入质量在2025年成为一项任务关键型优先事项的原因。
最常见的嵌入故障是基本数据问题:空数组、错误维度、损坏的向量值等。问题在于,大多数团队只有在AI响应明显不准确时才会发现这些问题。
Monte Carlo的一位客户完美地描述了这一困境:“我们对嵌入向量的生成方式、新数据是什么以及它如何影响训练过程一无所知。我们害怕切换嵌入模型,因为不清楚重新训练会带来什么影响。我们是否必须重新训练使用这些嵌入的模型?我们是否需要完全从头开始?”
随着质量和性能关键维度的日益明确,团队正开始制定新的监控策略,以支持生产环境中的嵌入向量,包括维度、一致性和向量完整性等因素。
7. 向量数据库需要现实审视
向量数据库并非2025年的新兴事物。真正新颖的是,数据与AI团队正逐渐意识到,他们一直以来所依赖的向量数据库可能并没有想象中那么可靠。
过去24个月里,向量数据库(以高维向量形式存储数据以捕捉语义信息)已成为RAG(检索增强生成)应用的实际基础设施。然而,近几个月来,它们也成为了数据与AI团队焦虑的源头。
嵌入向量会发生漂移,分块策略会改变,嵌入模型也会更新。所有这些变化都导致了无声的性能退化,而这常常被错误地诊断为“幻觉”,从而使团队陷入昂贵的解决误区。
挑战在于,与内置监控功能的传统数据库不同,大多数团队缺乏对向量搜索、嵌入向量和代理行为的必要可见性,无法在问题产生影响之前捕获向量问题。这很可能导致向量数据库监控实施的增加,以及其他旨在提高响应准确性的可观测性解决方案的兴起。
8. 领先的模型架构优先考虑简洁性而非性能
AI模型托管格局正在围绕两大明确的赢家进行整合:Databricks和AWS Bedrock。这两个平台之所以成功,是因为它们将AI能力直接嵌入到现有的数据基础设施中,而不是要求团队学习全新的系统。
Databricks通过模型训练、部署和数据处理之间的紧密集成脱颖而出。团队可以在数据所在的同一平台上微调模型,消除了在系统之间移动数据的复杂性。与此同时,AWS Bedrock则凭借其广度与企业级安全性取得成功,它提供了对Anthropic、Meta等多个基础模型的访问,同时保持了严格的数据治理和合规标准。
其他平台为何落后?原因在于碎片化和复杂性。那些需要大量自定义集成工作或强迫团队采用全新工具链的平台,正在输给那些能无缝融入现有工作流程的解决方案。
团队选择AI平台时,更多是基于操作的简便性和数据集成能力,而非原始模型性能。胜利者深知,如果一个最优秀的模型过于复杂以至于无法可靠地部署和维护,那么它将毫无用处。
9. 模型上下文协议(MCP)是关键推动者
模型上下文协议(Model Context Protocol, MCP)已成为改变游戏规则的“AI领域的USB-C”——一个通用标准,它允许AI应用程序无需自定义集成即可连接到任何数据源。
团队无需为每个数据库、CRM或API构建单独的连接器,只需使用一个协议就能同时赋予大型语言模型(LLMs)访问所有数据的能力。当模型能够无缝地从多个数据源获取信息时,它们就能提供更快、更准确的响应。
早期采用者已经报告,通过专注于在整个数据生态系统中运作的单一MCP实施方案,显著降低了集成复杂性和维护工作。
此外,MCP还实现了治理和日志记录的标准化——这些都是企业部署中的重要要求。
但不要指望MCP会止步不前。许多数据和AI领域的领导者预计,在未来一年内,代理上下文协议(Agent Context Protocol, ACP)将会出现,以处理更复杂的上下文共享场景。现在采用MCP的团队将为标准的持续演进做好准备。
10. 非结构化数据是新“黄金”(但会是“愚人金”吗?)
大多数AI应用依赖于非结构化数据——如电子邮件、文档、图像、音频文件和支持工单——来提供丰富的上下文,使AI响应更加有用。
然而,尽管团队可以使用既定工具监控结构化数据,非结构化数据长期以来一直处于盲区。传统的数据质量监控无法像跟踪数据库表那样处理文本文件、图像或文档。
Monte Carlo的非结构化数据监控解决方案正在弥补这一空白,通过为Snowflake、Databricks和BigQuery上的文本和图像字段提供自动化质量检查。
展望未来,非结构化数据监控将变得像传统数据质量检查一样普遍。组织将实施全面的质量框架,将所有数据——无论是结构化还是非结构化——都视为需要主动监控和治理的关键资产。

展望2026
2025年迄今为止的经验表明,在AI竞赛中胜出的团队并非那些拥有最大预算或最华丽演示的团队。真正的赢家是那些已经找到在生产环境中交付可靠、可扩展和值得信赖的AI解决方案的团队。
