订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
如果说 2023 年是生成式人工智能驱动的聊天机器人和搜索的天下,那么 2024 年则迎来了代理式人工智能的崛起——这些工具能够跨越数字环境规划和执行多步骤操作。从 Devin 的工程突破到微软对 Copilot Vision 的早期试验,创新层出不穷,但有一点始终如一:需要保持数据基础设施的组织性和可靠性。
随着企业纷纷投入先进的人工智能计划,几个趋势重塑了数据管理、安全和使用方式。企业越来越多地采用多云、开放数据和开放治理策略,以避免供应商锁定并获得更大的灵活性。他们还将重点放在非结构化数据上,将数据市场转变为中心,为预训练的人工智能模型提供专有数据集和应用程序。与此同时,向量和图数据库的进步带来了新的可能性,为未来的发展奠定了基础。
如今,随着人工智能故事的不断展开,行业领袖分享了他们对 2025 年支撑人工智能的数据基础设施将如何演变的预测。
“在 2025 年,企业将全面拥抱多模态数据和人工智能,改变其运营方式并创造价值。这种转变的核心是‘智能数据飞轮’——一个动态循环,实时数据驱动人工智能驱动的洞察,推动持续创新和改进。如今的暗数据——图像、视频、音频和传感器输出——将成为解锁更精准预测、更智能自动化和实时适应性的关键,最终带来对商业现实更丰富、更细致入微的理解。
“随着实时数据飞轮的到位,人工智能将自主诊断问题、优化流程并生成创新解决方案。企业将依靠人工智能代理来确保数据质量、发现洞察并制定策略,使人力资源能够专注于更高层次的任务。这将重新定义效率、加速创新,并将企业转变为更具活力和智能的组织。”
—— 谷歌云数据、分析和人工智能战略和出站产品管理总监 Yasmeen Ahmad
“随着人工智能工作负载继续推动增长,开拓性组织将转向液体冷却,以最大限度地提高性能和能源效率。超大规模云提供商和大型企业将引领潮流,在容纳数十万个 AI 加速器、网络和软件的新型 AI 数据中心中使用液体冷却。
“企业将越来越多地选择在托管设施中部署 AI 基础设施,而不是自行构建——部分原因是为了减轻大规模设计、部署和运营智能制造的财务负担。或者,他们将根据需要租用容量。这些部署将帮助企业利用最新的基础设施,而无需自行安装和运营。这种转变将加速液体冷却作为 AI 数据中心主流解决方案的更广泛行业采用。”
—— 英伟达 DGX 平台副总裁 Charlie Boyle
“世界正在以前所未有的速度创造数据。到 2028 年,将产生多达 400 泽字节的数据,复合年增长率 (CAGR) 为 24%。然而,存储安装基数预计将以 17% 的 CAGR 增长——因此增长速度明显低于数据生成的增长速度。而且,构建一个硬盘驱动器需要一整年的时间。这种增长率的差异将扰乱全球存储供需平衡。随着组织在人工智能的使用方面变得不那么实验性,而更加战略性,他们将需要构建更大的物理数据中心空间和容量计划,以确保存储供应,并充分利用对人工智能和数据基础设施的投资——同时平衡财务、监管和环境问题。”
—— 西数科技执行副总裁兼首席商务官 B.S. Teh
“在 2025 年,人工智能工厂将超越其最初提供基础设施即服务的阶段,提供计算、网络和存储服务,以提供平台即服务功能。虽然基础服务对于启动人工智能采用至关重要,但下一波人工智能工厂将优先考虑推动数据亲和力和提供持久价值的平台。这种转变对于使人工智能工厂在长期内保持可持续性和竞争力至关重要。”
—— DataPelago 联合创始人兼首席执行官 Rajan Goyal
“在大多数情况下,人工智能的早期应用只是使用了在海量公共数据上训练的基础模型。随着复杂的 RAG 应用程序成为主流,以及用于生成结构化数据的产品的快速成熟,利用海量私有企业数据的应用程序将开始创造真正的价值。但这些应用程序的门槛将很高:企业将要求人工智能应用程序具有可靠性,而不仅仅是炫酷的演示。
“此外,提供这些模型的人工智能公司将不得不与出版商和内容提供商友好相处,以保障人工智能发展的未来。他们需要与内容提供商签订许可协议,以确保他们因其提供的极其宝贵的数据而获得补偿。这必须尽快发生,在一切都变成诉讼和阻止人工智能爬虫的纠缠之前。”
—— Snowflake 首席执行官 Sridhar Ramaswamy
“在 2025 年,企业将使用代理挖掘数 TB 的通信数据,例如电子邮件、Slack 消息和 Zoom 录音,这些代理提供分析洞察、仪表板和可操作的决策支持工具。
“这将推动各个行业显着的生产力提升。”
—— RelationalAI 研究和机器学习副总裁 Nikolaos Vasiloglou
“在 2025 年,数据治理、准确性和隐私将成为有效采用人工智能的最重大障碍。随着组织寻求扩展人工智能,他们将意识到,成功的人工智能成果完全取决于可信赖的数据。管理和准备海量数据、确保合规性和维护准确性将带来复杂的挑战。企业需要通过投资于能够跨各种数据源实现统一管理的基础数据平台来克服这些障碍。
“因此,我们将看到对数据管理角色和与人工智能计划相一致的治理框架的更大重视,因为企业认识到不可靠的数据会直接影响人工智能的有效性。”
—— EDB 分析、数据和人工智能工程副总裁 Jeremy Kelway
“在 2025 年,统一的数据可观察性平台将成为大型企业必不可少的工具,使企业能够全面了解数据基础设施的性能、质量、管道健康状况、成本管理和用户行为,以解决复杂的治理和集成挑战。通过自动化异常检测并提供实时洞察,这些平台将支持数据可靠性并简化跨行业的合规工作。”
—— Acceldata 联合创始人兼首席技术官 Ashwin Rajeeva
“在 2025 年,我们将看到对主权云和私有云的真正推动。我们已经看到最大的超大规模云提供商投入数十亿美元在全球范围内建设数据中心,以提供这些功能。这种……容量需要一段时间才能上线;在此期间,需求将激增,这得益于主要来自欧盟的一系列立法。那些拥有灵活、可扩展和弹性云基础设施的企业将能够快速采用主权云或私有云方法。那些拥有单片、僵化的基础设施的企业将让自己落后于时代。”
—— Vultr 首席营销官 Kevin Cochrane
“我一直在关注边缘计算的潜在扩展,这是由 5G 的普及推动的,它将数据处理更靠近源头,并减少延迟。这可能有助于民主化人工智能。问题是,我们能否构建在移动设备上运行的有效人工智能应用程序,可能无需依赖云资源?
“如果 5G 可供现场技术人员使用,他们可以利用人工智能来协助他们的工作——无论是医疗专业人员在 5G 可用但 Wi-Fi 不可用灾区提供诊断和治疗,还是工程师和科学家利用人工智能辅助研究和实时计算做出现场决策。”
—— CData 高级技术布道师 Jerod Johnson
“传统上,数据保护一直专注于关键任务数据,因为这是需要更快恢复的数据。然而,情况已经发生了变化,非结构化数据已增长到涵盖过去 10 年中生成的所有数据的 90%。海量 PB 级非结构化数据的庞大表面积,加上其广泛使用和快速增长,使其极易受到勒索软件攻击。网络犯罪分子可以使用非结构化数据作为特洛伊木马来感染企业。经济高效地保护非结构化数据免受勒索软件攻击将成为一项关键的防御策略,从将冷数据、非活动数据迁移到不可修改的对象存储开始,在那里它无法被修改。
“为此,IT 和存储主管将寻找提供自动化功能来保护、细分和审计人工智能中敏感数据和内部数据使用的非结构化数据管理解决方案——随着人工智能的成熟,这种用例注定会扩展。此外,他们需要创建系统化的方法,让用户能够跨企业数据存储进行搜索,整理正确的数据,检查敏感数据并将数据迁移到人工智能,并提供审计报告。”
—— Komprise 联合创始人 Krishna Subramanian
总而言之,2025 年有望在企业数据基础设施方面取得重大进步,从多模态数据飞轮到主权云。然而,数据治理和存储短缺等挑战将持续存在。在这个充满活力的领域取得成功将取决于平衡创新与信任和可持续性,将数据转化为持久的竞争优势。