订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
新加坡首家基础模型人工智能初创公司 Sapient Intelligence 宣布成功完成种子轮融资,以 2 亿美元的估值筹集了 2200 万美元。
该公司获得了 Vertex Ventures、住友集团和 JAFCO 等知名投资者的支持,希望在人工智能开发领域开辟一条独特的道路,解决其认为 GPT 风格模型存在的根本缺陷。
“这家初创公司的目标实际上是打造新一代基础模型架构,以解决大型语言模型(LLM),尤其是 GPT 架构难以解决的极其复杂且具有长期推理能力的任务,”联合创始人兼首席执行官奥斯汀·郑 (Austin Zheng) 在最近接受 VentureBeat 视频采访时表示。
传统的 GPT 风格模型依赖于自回归方法,该方法通过基于先前输出的顺序构建来生成预测。
虽然这种方法对于一般任务有效,但它在多步骤推理和复杂问题解决方面存在困难。
“对于当前的模型,它们都是使用自回归方法训练的,这样做的优点是模型更容易收敛到一般任务,”郑解释说。“所以它听起来真的很聪明,可以解决很多不同的任务。它具有非常好的泛化能力,但对于它们来说,解决一个复杂且具有长期推理能力的多步骤任务非常困难。这就是幻觉产生的原因,”郑说。
Sapient 的解决方案是一种新颖的模型架构,其灵感来自神经科学和数学,将 Transformer 组件与循环神经网络结构相结合,模仿人脑的工作方式。
“该模型将始终评估解决方案,评估选项,并根据评估结果提供奖励模型,”郑说。“此外,该模型可以持续地循环计算,直到找到正确的解决方案。这样,我们的代理将能够部署到企业或生产环境中,并通过反复试验不断学习和改进自身,学习成为现有代码库的专家。”
这种设计是 Sapient 模型灵活性和强大功能的基础,使它们能够以精确性和可靠性解决各种任务。
这也使它们与 OpenAI 及其 o1 系列的新一代推理模型以及其他中国竞争对手竞争。
该公司的创新体现在基准性能上。
“我们使用的第一个基准实际上是数独,”郑告诉 VentureBeat。“目前,我们的模型在解决数独方面是性能最好的神经网络——在不使用中间工具和数据的情况下,准确率达到 95%。”
据郑说,虽然其他领先模型需要在中间步骤上进行训练才能解决这个流行的数字排序谜题,但 Sapient 只向模型提供了未完成的数独棋盘、规则和最终解决方案,并且必须通过反复试验自行推断如何解决它们。
同样,Sapient 的模型在二维导航和复杂数学问题解决等任务中表现出色,始终优于竞争方法。
训练这些模型是 Sapient 与众不同之处。郑说:“与需要大量高质量、逐步数据的传统模型不同,我们的方法只需要问答对。这大大降低了训练复杂模型的门槛。”
通过利用合成数据,Sapient 减少了对精选数据集的依赖,从而创建了可扩展且高效的训练管道。
Sapient 的最初重点是现实世界的应用,从企业编码和机器人技术开始。
其自主编码代理旨在彻底改变企业管理软件开发和维护需求的方式。
该公司已经在住友的企业环境中部署了一个自主人工智能编码代理,以学习该公司的代码库,并最终开始维护和贡献代码。
Sapient 旨在为其他企业客户提供类似的服务,郑将其描述为“能够帮助他们维护、更新和发展现有技术栈的智能且定制的人工智能员工和人工智能软件工程师”。
与 Cognition 的 Devin(由 GPT-4o 提供支持)不同,Sapent 相信其编码人工智能代理能够自主工作——无需任何人类指导流程或解决问题,只需主管在代码上线之前检查一下即可。
该公司还在推进具身人工智能,设计能够让机器人实时交互、学习和适应的模型。
“只有少数几家初创公司致力于理解环境,以及规划选项和任务,并理解哪些任务是可能的——以及不断改进自身对环境、问题和用例的理解,”郑指出。“这将是我们未来 1-2 年的主要关注点。”
Sapient 不仅通过技术,还通过其全球化和包容性方法来脱颖而出。
“除了中国以外,很少有基础模型层面的 AI 初创公司是由亚洲创始人领导的,”郑指出。“我们真的希望将自己定位为一个国际化和以研究为导向的组织。此外,我们希望成为首批由亚洲人领导的国际研究机构之一,解决真正具有挑战性的问题,我们也看到了这一点正在实现。”
该公司在新加坡设有办事处,并计划进军湾区,正在建立一个人工智能研究实验室,以汇集不同的观点和人才。
其团队体现了这种精神,由来自 DeepMind、Anthropic 和微软人工智能等领先机构的科学家和工程师组成。
这种多样性,加上与住友集团等日本投资者的牢固合作关系,使 Sapient 在全球人工智能生态系统中成为独一无二的参与者。
Sapient 的长期愿景雄心勃勃,目标是开发可以应用于个人和企业,并产生同样有益结果的技术。
“最终目标是打造一个真正通用的代理,能够真正解决我们用户的日常任务——一个‘全能代理解决方案’,用于个人助理和解决所有任务。这就是我们在技术目标和方向方面的目标,”郑说。
这包括未来的面向公众的产品,例如自主编码代理和通用个人助理。
目前,Sapient 专注于完善其技术并提供企业级解决方案。定价模式仍在探索中,但可能包括许可费、订阅费或与成功完成任务相关的基于任务的收费。
随着 Sapient 扩展其运营和能力,它仍然是快速发展的人工智能领域中值得关注的公司。