前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

锦秋基金投资企业Pokee AI发布7B研究智能体PokeeResearch:RLAIF与推理脚手架重塑深度研究

NEXTECH
Last updated: 2025年10月28日 上午7:00
By NEXTECH
Share
15 Min Read
SHARE

锦秋基金已完成 Pokee AI 的投资。

Contents
核心看点技术要点数据与结果典型场景研究团队与论文信息关于 Pokee AI

锦秋基金作为一家12年期的AI基金,始终秉持长期主义的投资理念,积极寻找具有突破性技术和创新商业模式的通用人工智能初创企业。

在大模型普遍追求规模化的背景下,锦秋基金被投企业Pokee AI选择了一条不同的发展路径,推出了研究智能体PokeeResearch,旨在让AI学会如何像研究员一样思考与验证。

Pokee AI最新发布了一款面向“深度研究”场景的7B参数智能体。该智能体采用“来自AI的反馈强化学习”(RLAIF)与链式思维的多轮自校验推理脚手架,旨在解决浅层检索、对齐度量薄弱和工具使用脆弱这三大痛点。

PokeeResearch 智能体架构图

PokeeResearch是一款专为“深度研究”场景打造的智能体模型,它不依赖更大的参数规模,而是在“推理稳定性”和“事实可靠性”上实现了新的突破。

You Might Also Like

星环科技AI Infra平台:重构企业AI基础设施,技术架构与核心优势深度解析
Claude 新王牌 “Skills” 深度解析:让你的 AI 秒变行业专家,告别重复劳动
蚂蚁金服Ming-UniVision模型:告别繁琐,一体化实现图像理解、生成与编辑
AI学会遗忘:浙大LightMem团队以“睡眠机制”破解大模型记忆难题,显著降低成本并提升准确率

根据团队实验结果,PokeeResearch在10项深度研究/开放域问答基准上取得了同规模(7B)模型中的最佳平均表现。

➡️项目已在 GitHub 以 Apache 2.0 协议开源推理与模型代码

➡️ https://github.com/Pokee-AI/PokeeResearchOSS

PokeeResearch 核心看点图示

核心看点

训练范式

PokeeResearch基于RLAIF + RLOO的统一强化学习框架,不依赖人工标注,直接围绕事实正确性、引文忠实度和指令遵循等“人类关注指标”优化策略。

推理稳健性

PokeeResearch引入了“研究—验证”双模式循环与多调用自纠错机制。当遇到工具调用失败时,它能诊断并恢复,并对候选答案进行自我核验以过滤显性错误。

7B模型量级中表现最佳

在HLE、GAIA、BrowseComp以及NQ、TriviaQA、HotpotQA、2Wiki、Musique、Bamboogle、PopQA共10项权威基准上,PokeeResearch均取得了7B量级同类最优平均成绩(mean@4)。

PokeeResearch 开源信息
开源与复现

PokeeResearch基于MIT许可协议开源,提供了可复现的实验设置与推断代码,便于社区进行复评与落地集成。

技术要点

RLAIF 奖励设计

以外部LLM作为“客观评审”,对生成答案的语义正确性进行判定,避免F1/EM等纯词汇重合指标的偏差;训练中采用RLOO获得更稳健、几乎无偏的策略梯度估计。

研究—验证循环

研究模式中执行“分解问题—检索—阅读—综合”,并允许多次工具调用与自我修正;验证模式对答案做一致性与可用性检查,不通过则回到研究模式继续迭代。

工具链

PokeeResearch提供了面向互联网检索与网页内容提要的标准化工具接口,服务于证据收集、证据综合和结论生成的闭环。

数据与结果

信息寻址/网页浏览能力

在HLE、GAIA、BrowseComp等基准上,PokeeResearch取得了7B规模最优均值表现。

PokeeResearch 信息寻址能力基准测试结果

开放域/多跳问答

在NQ、TriviaQA、HotpotQA、2Wiki、Musique、Bamboogle、PopQA等基准上,PokeeResearch均取得了同等规模下的最佳表现。

PokeeResearch 开放域多跳问答基准测试结果

注:完整分数、评测设定与样本量详见论文正文与附录表格/图示。

典型场景


深度检索与事实核查

PokeeResearch支持多源证据汇聚,并提供可追溯的引用。

复杂长链路问答

PokeeResearch能够处理跨文档、多跳推理,并具备过程自校验能力。

研究写作与情报分析

PokeeResearch面向报告、备忘与策略建议,提供结构化输出。


研究团队与论文信息

论文题目

PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold

PokeeResearch 论文封面

作者

Yi Wan, Jiuqi Wang, Liam Li, Jinsong Liu, Ruihao Zhu, Zheqing Zhu(Pokee AI)

开源地址:https://github.com/Pokee-AI/PokeeResearchOSS

(*为共同一作)

关于 Pokee AI

Pokee AI 专注于打造面向真实业务场景的 研究级智能体 与 自动化工作流,以开放、稳健的技术路线推动生产力工具的下一代体验。

作为全球首个可连接数千种工具的通用基础 AI 智能体,Pokee 无需定制集成、MCP 服务器或重新训练,便能将最热门的AI工具与最常用的互联网平台整合,为用户实现日常工作的全自动化。Pokee AI真正做到了“一个智能体,上千工具,丝滑体验”。当前,Pokee AI已在数十个互联网平台上线,并提供无缝衔接的安全登录方式。

TAGGED:7B模型AI前沿技术PokeeResearchRLAIF研究智能体
Share This Article
Email Copy Link Print
Previous Article 图1:置信区间计算示意图 构建一个真正高效的KPI监控系统:实用策略与挑战应对
Next Article 京东云JoyAgent 3.0:从入门到实战,办公智能体搭建与应用场景全解析
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技

相关内容

传统数据治理面临的挑战
AI 前沿技术

语义治理:面向AI时代的企业数据治理新范式

2025年10月18日
滑动窗口分块示意图
AI 前沿技术

RAG Chunking 2.0:提升文档分块效果的八大实用策略与Python示例

2025年11月14日
OpenAI开发者日2025数据增长图
AI 前沿技术

OpenAI 2025开发者日:开幕主题演讲精要与多项重磅功能升级

2025年10月8日
传统工具调用流程示意图
AI 前沿技术

MCP上下文爆炸怎么办?Anthropic给出了新答案(图文示例) 介绍 MCP 上下文爆炸问题及 Anthropic 给出的代码执行模式解决方案

2025年11月8日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up