订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
ChatGPT 公开发布两年后,人工智能的讨论无处不在,各行各业的公司都在寻求利用大型语言模型 (LLM) 来改变其业务流程。然而,尽管 LLM 强大且充满希望,但许多企业和 IT 领导者对其过度依赖,而忽略了它们的局限性。这就是我预计未来专门语言模型 (SLM) 将在企业 IT 中发挥更大的补充作用的原因。
SLM 通常被称为“小型语言模型”,因为它们需要更少的数据和训练时间,并且是“LLM 的更精简版本”。但我更喜欢“专门”这个词,因为它更好地传达了这些专门构建的解决方案能够比 LLM 更准确、更一致、更透明地执行高度专业化的工作的能力。通过将 LLM 与 SLM 相辅相成,组织可以创建利用每个模型优势的解决方案。
LLM 非常强大,但它们也以有时“失去情节”或提供由于其通才训练和海量数据集而偏离轨道的输出而闻名。由于 OpenAI 的 ChatGPT 和其他 LLM 本质上是“黑盒子”,无法揭示它们如何得出答案,这种趋势变得更加成问题。
这个黑盒子问题在未来将变得更加严重,特别是对于那些准确性、一致性和合规性至关重要的公司和关键业务应用程序。以医疗保健、金融服务和法律为例,这些行业的不准确答案可能造成巨大的经济损失,甚至危及生命。监管机构已经注意到这一点,并可能开始要求可解释的人工智能解决方案,尤其是在依赖数据隐私和准确性的行业。
虽然企业通常采用“人机协同”的方法来缓解这些问题,但过度依赖 LLM 会导致一种虚假的安全感。随着时间的推移,可能会产生自满情绪,错误可能会在未被发现的情况下溜走。
幸运的是,SLM 更适合解决 LLM 的许多局限性。SLM 不是为通用任务而设计,而是以更窄的范围开发,并针对特定领域的数据进行训练。这种特殊性使它们能够处理精度至关重要的领域中的细微语言要求。SLM 不是依赖庞大、异构的数据集,而是针对目标信息进行训练,从而赋予它们上下文智能,以提供更一致、更可预测和更相关的响应。
这提供了几个优势。首先,它们更易于解释,更容易理解其输出的来源和基本原理。这在需要将决策追溯到来源的受监管行业至关重要。
其次,它们更小的尺寸意味着它们通常比 LLM 运行得更快,这对于实时应用程序来说是一个关键因素。第三,SLM 为企业提供了更多对数据隐私和安全性的控制,尤其是在内部部署或专门为企业构建的 SLM。
此外,虽然 SLM 可能最初需要专门的培训,但它们降低了使用由外部提供商控制的第三方 LLM 相关的风险。这种控制在需要严格数据处理和合规性的应用程序中非常宝贵。
我想明确一点,LLM 和 SLM 并不相互排斥。在实践中,SLM 可以增强 LLM,创建混合解决方案,其中 LLM 提供更广泛的上下文,而 SLM 确保精确执行。即使在 LLM 方面,现在也还处于早期阶段,因此我始终建议技术领导者继续探索 LLM 的多种可能性和优势。
此外,虽然 LLM 可以很好地扩展以解决各种问题,但 SLM 可能无法很好地转移到某些用例。因此,在开始时要清楚地了解要解决哪些用例非常重要。
同样重要的是,企业和 IT 领导者要投入更多时间和精力来培养训练、微调和测试 SLM 所需的独特技能。幸运的是,通过 Coursera、YouTube 和 Huggingface.co 等常见来源,可以获得大量免费信息和培训。领导者应确保他们的开发人员有足够的时间学习和试验 SLM,因为人工智能专业知识的竞争日益激烈。
我还建议领导者仔细审查合作伙伴。我最近与一家公司交谈,他们询问我对某家技术提供商的声明的意见。我的看法是,他们要么夸大了自己的说法,要么只是在理解该技术的性能方面能力不足。
该公司明智地退后一步,实施了一个受控的概念验证来测试供应商的说法。正如我所料,该解决方案还没有准备好投入使用,该公司能够在投入相对较少的时间和资金的情况下退出。
无论公司是从概念验证还是实时部署开始,我都建议他们从小处着手,经常测试,并在早期成功基础上进行构建。我个人体验过使用一小组指令和信息,结果发现当我向模型提供更多信息时,结果会偏离轨道。这就是为什么稳步前进是一种谨慎的做法。
总之,虽然 LLM 将继续提供越来越有价值的功能,但随着企业对其对人工智能的依赖程度不断提高,它们的局限性也越来越明显。通过 SLM 进行补充提供了一条前进的道路,尤其是在需要准确性和可解释性的高风险领域。通过投资 SLM,公司可以为其人工智能战略做好未来准备,确保其工具不仅推动创新,而且满足信任、可靠性和控制的要求。
AJ Sunder 是 Responsive 的联合创始人、首席信息官和首席产品官。
DataDecisionMakers
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作技术人员)分享数据相关见解和创新的平台。
如果您想了解前沿理念和最新信息、最佳实践以及数据和数据技术的未来,请加入我们 DataDecisionMakers。
您甚至可以考虑贡献自己的文章!
阅读 DataDecisionMakers 的更多内容