前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

Codex驱动自改进税务AI

洞察2026年5月27日· 7 分钟阅读0 阅读

Thrive Holdings与OpenAI合作开发Tax AI,利用Codex打造能自我改进的税务智能体。通过专家反馈、生产痕迹和Codex迭代循环,该智能体在六周内将税务表单准确率从25%提升至86%,显著节省报税时间,为复杂专业领域的AI应用提供了可复用的设计蓝图。

现实系统中的智能体在投入生产后往往表现异常,出现难以预见的故障。过去,团队只能在上线后手动排查边缘案例、调整提示词,反馈循环缓慢且依赖工程师推进。但如今,借助精心设计的评估基础设施、一线专家的直接参与、真实生产环境以及Codex的前沿智能体能力,我们可以构建能自我改进的智能体。

过去六个月,OpenAI的前沿工程师与研究员携手Thrive Holdings的工程师,为Crete旗下的30多家会计师事务所共同开发了Tax AI系统。该系统并非依赖工程师逐一修复故障,而是利用Codex将生产使用行为转化为结构化信号,驱动自主改进。

可量化的自我改进

在每个报税季,Crete的会计师要处理数万份税表,涉及数百万份底层文件。针对中高复杂度的税表,仅数据录入就需八小时。Tax AI上线后,自动处理了7000份1040和1041税表,将会计师准备时间节省约三分之一,草稿准确率高达97%,吞吐量提升约50%。更重要的是,系统在三个月内实现了显著自我进化。

以字段完成准确率为衡量指标:上线初期,仅25%的税表达到75%的正确字段完成率;六周后,这一比例升至86%。在90%和100%正确率层级上,系统进步更快。初期系统处理W-2和1099等简单表单,随后逐步攻克含K-1、附表等复杂案例,每次新能力节省的时间都比上一次更多。

三阶段循环设计

支柱一:贴近一线专家

会计师的直觉和判断决定了哪些错误值得重点关注。系统围绕专家的反馈来调整学习方向。

支柱二:让生产过程留下证据

系统不仅记录输入和输出,还完整保存从源材料到提取字段、下游提交及专家修正的完整路径。

支柱三:Codex驱动的改进循环

将生产问题转化为可追踪的评估目标,Codex可以调查根因、提出修改、通过针对性评估和回归测试验证,并生成拉取请求供工程师审核。

典型案例:租赁物业附表

租赁物业收入需填写Schedule E。系统需要从手写笔记、邮件、电子表格等混乱源文件中提取字段,并映射到税务引擎。当会计师修正一个预测值时,系统会捕获差异、按类型分组重复故障,并将其打包成评估目标。随后,Codex会检查源包、提取模式、映射行为等环节,定位问题是未支持字段、提取遗漏还是映射缺口。它实施针对性修复,重新运行评估和回归套件,最终提交候选代码修改。这一闭环将重复的专家修正转化为可测量的工程任务。

扩展到新领域

租赁物业案例经历了约六周密集研发才达到90%的精确率和召回率,但期间积累的可复用模式(评审工件、评估规范、实现模式)使后续支持Schedule C和Schedule A更加容易。如今,同样的三阶段设计蓝图被用于Thrive Holdings旗下的记账、审计和IT帮助台自动化等场景。

一位去年花费180小时准备税表的高级会计师今年仅用了15小时。她将省下的时间用来给每位客户打电话解读税表,并提供新服务。这证明,自我改进的智能体能在专业领域持续学习,变得更加可靠和富有价值。

标签:Codex自我改进Thrive HoldingsOpenAI

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

TOP1

Anthropic任命KiYoung Choi为韩国区代表董事

美国最高法院允许佛蒙特州对Meta的诉讼继续
TOP2

美国最高法院允许佛蒙特州对Meta的诉讼继续

3

IREN 与戴尔签署 16 亿美元 Blackwell GPU 采购协议

13小时前
IREN 与戴尔签署 16 亿美元 Blackwell GPU 采购协议
4

Google 警告加拿大法案将创建“监控基础设施”

13小时前
Google 警告加拿大法案将创建“监控基础设施”
5

NASA重金打造月球基地,四家公司分得合同

13小时前
NASA重金打造月球基地,四家公司分得合同
6

SpaceX拿下29亿美元太空军合同

13小时前
SpaceX拿下29亿美元太空军合同
7

NASA 月球车合同花落两家,Intuitive Machines 出局

13小时前
NASA 月球车合同花落两家,Intuitive Machines 出局
8

朝鲜测试AI制导巡航导弹

13小时前
朝鲜测试AI制导巡航导弹
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款