前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

Salesforce 推出 Agentforce 测试中心

洞察2024年11月23日· 5 分钟阅读10 阅读

订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多 随着企业希望使其开 […]

订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多

随着企业希望使其开始部署的智能体更加可观察,智能体 AI 的下一阶段可能就是评估和监控。

虽然 AI 智能体基准测试可能会产生误导,但观察智能体是否按预期工作仍然具有很大价值。为此,公司开始提供平台,让客户可以在沙盒中测试 AI 智能体或评估其性能。

Salesforce 在周三发布了其智能体评估平台 Agentforce 测试中心,目前处于有限试点阶段。预计将于 12 月正式发布。测试中心让企业能够观察和原型化 AI 智能体,以确保它们能够访问所需的工作流程和数据。

测试中心的新功能包括用于 Agentforce 的 AI 生成的测试、用于 Agentforce 和 Data Cloud 的沙盒以及用于 Agentforce 的监控和可观察性。

AI 生成的测试允许公司使用 AI 模型生成“数百种合成交互”,以测试智能体最终是否以公司想要的方式回答问题。顾名思义,沙盒提供了一个隔离的环境来测试智能体,同时镜像公司的數據,以便更好地反映智能体将如何为他们工作。监控和可观察性让企业在智能体投入生产时,能够在沙盒中进行审计跟踪。

Salesforce 产品和行业营销执行副总裁 Patrick Stokes 告诉 VentureBeat,测试中心是该公司称为智能体生命周期管理的一类新智能体的一部分。

Stokes 说:“我们正在定位我们认为将成为智能体的一个重要新子类别。当我们说生命周期时,我们的意思是整个过程,从起源到开发,一直到部署,然后是您在前进过程中部署的迭代。”

Stokes 说,目前,测试中心没有工作流程特定的洞察力,开发人员无法看到智能体使用的 API、数据或模型中的特定选择。但是,Salesforce 在其 Einstein Trust Layer 上收集了这种数据。

Stokes 说:“我们正在构建开发人员工具,将这些元数据公开给我们的客户,以便他们能够实际使用它来更好地构建他们的智能体。”

Salesforce 将其重点放在 AI 智能体上,将大量精力投入到其智能体产品 Agentforce 上。Salesforce 客户可以使用预设智能体或在 Agentforce 上构建自定义智能体,以连接到他们的实例。

AI 智能体触及组织中的许多点,由于良好的智能体生态系统旨在自动化大量工作流程,因此确保它们正常工作变得至关重要。

如果智能体决定使用错误的 API,可能会给企业带来灾难。AI 智能体本质上是随机的,就像为其提供动力的模型一样,在得出结果之前会考虑每个潜在的概率。Stokes 说,Salesforce 通过用相同话语或问题的不同版本轰炸智能体来测试智能体。其响应被评分为通过或失败,允许智能体在人类开发人员可以控制的安全环境中学习和发展。

帮助企业评估 AI 智能体的平台正在迅速成为一种新型的产品。今年 6 月,客户体验 AI 公司 Sierra 推出了一个名为 TAU-bench 的 AI 智能体基准测试,用于查看对话式智能体的性能。自动化公司 UiPath 在 10 月发布了其 Agent Builder 平台,该平台也提供了一种在完全部署之前评估智能体性能的方法。

测试 AI 应用程序并非新鲜事。除了对模型性能进行基准测试之外,许多 AI 模型存储库(如 AWS Bedrock 和 Microsoft Azure)已经允许客户在受控环境中测试基础模型,以查看哪个模型最适合他们的用例。

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

阿联酋联手Colossal打造基因“诺亚方舟”
TOP1

阿联酋联手Colossal打造基因“诺亚方舟”

微软Copilot付费转化率仅3.3%,AI投入回报成疑
TOP2

微软Copilot付费转化率仅3.3%,AI投入回报成疑

3

SpaceX 收购 xAI:是救援还是资本游戏?

1小时前
SpaceX 收购 xAI:是救援还是资本游戏?
4

OpenAI 从 Anthropic 挖角安全专家,年薪超 55 万美元

1小时前
OpenAI 从 Anthropic 挖角安全专家,年薪超 55 万美元
5

美国新法为多癌种检测开辟医保覆盖路径

2小时前
美国新法为多癌种检测开辟医保覆盖路径
6

AI玩具泄露5万儿童聊天记录,参议员要求解释

9小时前
AI玩具泄露5万儿童聊天记录,参议员要求解释
7

得州电网因AI热潮重审数据中心审批

22小时前
得州电网因AI热潮重审数据中心审批
8

NASA:140英尺小行星夜间近距离飞掠地球

19小时前
NASA:140英尺小行星夜间近距离飞掠地球
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款