订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
毫无疑问,企业人工智能是一项大生意,尤其是对 IBM 而言。
IBM 在生成式人工智能方面的业务规模已达 20 亿美元,现在正寻求加速增长。IBM 今天通过推出第三代 Granite 大型语言模型 (LLM) 来扩展其企业人工智能业务。新一代的核心要素是继续关注真正的开源企业人工智能。更进一步,IBM 正在通过其 InstructLab 功能确保模型可以针对企业人工智能进行微调。
今天宣布的新模型包括具有 20 亿和 80 亿参数的通用选项 Granite 3.0。此外还有混合专家 (MoE) 模型,包括 Granite 3.0 3B A800M Instruct、Granite 3.0 1B A400M Instruct、Granite 3.0 3B A800M Base 和 Granite 3.0 1B A400M Base。为了完善更新,IBM 还推出了一个新的模型组,其中包含经过优化的安全保障选项,包括 Granite Guardian 3.0 8B 和 Granite Guardian 3.0 2B 模型。新模型将在 IBM 的 watsonX 服务以及 Amazon Bedrock、Amazon Sagemaker 和 Hugging Face 上提供。
“正如我们在上次财报电话会议上提到的,我们在生成式人工智能方面建立的业务规模已超过 20 亿美元,涵盖技术和咨询领域,”IBM 高级副总裁兼首席商务官 Rob Thomas 在与媒体和分析师的简报会上表示。“回顾我在 IBM 的 25 年职业生涯,我不确定我们是否曾有过业务以如此快的速度扩展。”
Granite 3.0 推出了一系列针对企业应用量身定制的复杂人工智能模型。
IBM 预计,新模型将有助于支持一系列企业用例,包括:客户服务、IT 自动化、业务流程外包 (BPO)、应用程序开发和网络安全。
新的 Granite 3.0 模型由 IBM 的集中式数据模型工厂团队进行训练,该团队负责为训练提供数据来源和整理。
IBM 研究高级副总裁兼主任 Dario Gil 解释说,训练过程涉及 12 万亿个数据标记,包括多种语言的语言数据以及代码数据。他强调,与前几代相比,关键区别在于数据的质量和训练过程中使用的架构创新。
Thomas 补充说,同样重要的是要认识到数据的来源。
“我们在构建模型方面的优势之一是我们拥有的独特 IBM 数据集,”Thomas 说。“我认为,我们在行业中拥有独特的优势,我们成为我们构建的所有产品的首批客户,这也让我们在构建模型方面具有优势。”
据 Gil 介绍,Granite 模型在各种任务中取得了非凡的成果,超越了来自 Google、Anthropic 等公司的最新版本模型。
“你在这里看到的是性能极其出色的模型,绝对是业界领先的,我们对此感到非常自豪,”Gil 说。
但 Granite 的独特之处不仅仅在于原始性能。IBM 还非常重视安全性和信任,开发了先进的“Guardian”模型,这些模型可用于防止核心模型被破解或生成有害内容。各种模型尺寸选项也是一个关键要素。
“我们非常重视这一点,并且从扩展人工智能中吸取了教训,推断成本至关重要,”Gil 指出。“这就是我们如此关注模型类别大小的原因,因为它兼具性能和推断成本,对于企业中的大规模用例非常有吸引力。”
Granite 3.0 的一个关键差异化因素是 IBM 决定根据开放源代码倡议 (OSI) 批准的 Apache 2.0 开源许可证发布这些模型。
市场上还有许多其他开放模型,例如 Meta 的 Llama,但实际上并没有根据 OSI 批准的许可证提供。对于某些企业来说,这是一个重要的区别。
“我们决定在这方面绝对做到干净利落,并决定使用 Apache 2 许可证,以便为我们的企业合作伙伴提供最大限度的灵活性,让他们能够使用这项技术做他们需要做的事情,”Gil 解释说。
宽松的 Apache 2.0 许可证允许 IBM 的合作伙伴在 Granite 模型之上构建自己的品牌和知识产权。这有助于培养一个由 Granite 技术驱动的强大解决方案和应用程序生态系统。
“这完全改变了企业采用人工智能的速度,因为你拥有一个宽松的许可证,它可以促进贡献、社区建设,最终实现广泛传播,”Thomas 说。
展望未来,IBM 正在思考下一个重大范式转变,Gil 将其称为——生成式计算。
从本质上讲,生成式计算是指通过提供示例或提示来对计算机进行编程的能力,而不是显式地编写逐步指令。这与 Granite 等 LLM 的功能相一致,这些 LLM 可以根据接收到的输入生成文本、代码和其他输出。
“这种我们不编写指令,而是通过示例对计算机进行编程的范式是基础性的,我们才刚刚开始通过与 LLM 交互来体验这种感觉,”Gil 说。“你会看到我们会在生成式计算的范式方向上进行投资并积极进取,我们将能够实现下一代模型、代理框架等等,这是一种全新的计算机编程方式,是 Gen AI 革命的结果。”