2024 年:人工智能商业化元年
2024 年,人工智能领域发生了翻天覆地的变化,商业化进程达到了前所未有的高度。ChatGPT 引发的“大语言模型”热潮持续升温,OpenAI、微软、Meta、谷歌等科技巨头纷纷推出新的模型,无数初创公司和个人开发者也加入了这场盛宴。
曾经关于人工智能研究放缓的传言不攻自破,新技术层出不穷,例如 Liquid AI 的 Liquid Foundation Models,超越了传统的 Transformer 架构。
更重要的是,企业开始全面拥抱“智能代理”的理念,开发出能够独立解决特定问题或在人类监督下工作的 AI 驱动的机器人、应用程序和工作流程。
回顾 2024 年,人工智能领域涌现出无数令人瞩目的事件,以下列举了其中最具影响力的 14 个,并将其归纳为几个主题。
OpenAI:持续引领
OpenAI 作为人工智能时代的开拓者,在激烈的竞争中依然保持着领先地位。
- o1 模型:OpenAI 推出了首个超越 GPT 系列的通用大模型家族——o1“推理”系列,该模型能够更有效地处理复杂提示,提高准确性,尤其擅长科学、编码和推理任务。
- o3 模型:紧随其后,OpenAI 在年底发布了更强大的 o3 模型,尽管该模型要到 2025 年初才会公开发布,但它表明 OpenAI 并没有止步不前。
- ChatGPT 搜索:这项功能最初以独立产品 SearchGPT 的形式推出,后来整合到 ChatGPT 中,它能够在 ChatGPT 中实现更实时的网络信息检索,并以更精炼的方式呈现搜索结果,增强了 ChatGPT 对最新查询的实用性,与谷歌、必应和新兴搜索引擎 Perplexity 展开正面竞争。
- Canvas:Canvas 于 10 月推出,它将 ChatGPT 的界面扩展到对话式界面之外,成为一个类似工作站的面板,可以根据用户的要求动态更新内容,例如编辑文档或编码项目。
- Sora:经过近一年的预热,OpenAI 在 12 月初终于向大众发布了 Sora,这款视频生成模型凭借其独特的界面和故事板功能,迅速引发了广泛的关注和讨论。
Meta:开源力量
- Llama 3 和 3.1:Meta 在 4 月发布了 Llama 3,在开源人工智能领域树立了新的性能标准,随后又在 7 月发布了拥有 4050 亿参数的 Llama 3.1。Llama 3.1 的版本被用于 Meta AI,该 AI 助手整合到 WhatsApp、Messenger、Instagram 和 Facebook 等平台,旨在成为使用最广泛的 AI 助手。
- Llama 3.3:Llama 3.3 于 2024 年 12 月发布,其性能与更大的模型相当,但计算成本却低得多,使其更适合企业应用。
多元化发展
除了 OpenAI 和 Meta,其他公司也取得了重大进展。阿里巴巴的 Qwen-2.5 系列、DeepSeek 的 V2.5 和 R1-Lite 预览版等中国模型异军突起,在一些基准测试中名列前茅。英伟达也超越了单纯的显卡和软件架构供应商的角色,推出了自己的开源、强大的 Nemotron-70B 模型。
总部位于旧金山的 Nous Research 致力于提供更个性化、更不受限制的开源 AI 模型,也推出了几个新颖的想法。法国的 Mistral 也迅速扩展了自己的开源和专有 AI 产品。
谷歌:强势回归
谷歌的 Gemini 系列 AI 模型曾经因其奇怪的图像生成和“过度觉醒”的批评而备受嘲讽,但它在今年强势回归,推出了更强大的新版本,在第三方性能基准测试中名列前茅,越来越受到开发者和企业的青睐。
- Gemini 2.0 Flash:谷歌推出了 Gemini 2.0 Flash,这是一款支持流式视频分析的多模态 AI 模型,能够识别和指示你在屏幕上的操作。
- Gemini 2.0 Flash Thinking:该模型与 OpenAI 的 o1 和 o3 推理模型竞争。
“智能代理”崛起
“智能代理”的概念从一个流行语变成了现实,顶级企业软件供应商纷纷推出相关产品和计划。
- Salesforce 的 Agentforce 2.0:Salesforce 最近发布了 Agentforce 2.0,这是一个先进的 AI 代理程序,旨在增强其 CRM 和销售产品以及 Slack 的推理、集成和定制功能,显著提高企业生产力工具。
- SAP 的 Joule:SAP 将其 Joule 聊天机器人转换为由开源大语言模型 (LLM) 驱动的 AI 代理,推动企业环境中的创新和效率。
- 谷歌的 Project Astra:作为 Gemini 2.0 计划的一部分,谷歌推出了 Project Astra,这是一个 AI 助手,旨在通过利用谷歌的服务套件提供实时的上下文响应,以提高用户生产力和决策能力。
展望 2025:AI 生成内容将主导一切
基于这些进展,2025 年将见证 AI 生成内容在商业和消费领域的大规模应用,从 OpenAI 到 Meta、谷歌、微软、苹果,甚至埃隆·马斯克的 xAI,都将 AI 图像生成器集成到其产品中。
这种扩展将简化内容创作,增强个性化,并提高各个行业的效率。
此外,我们预计大语言模型 (LLM) 和生成式 AI 驱动的机器人将在商业和消费领域进行大规模部署,彻底改变自动化和人机交互。
这是 2024 年最后一期 #AIBeat 时事通讯。感谢您的阅读、写作、订阅、分享、评论,感谢您与我们同行。期待在 2025 年与您分享更多内容,并听到您的更多声音。
祝您和您的家人节日快乐,新年吉祥!来自 VentureBeat 的全体成员。