前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

Anthropic详解:如何确保并衡量AI助手Claude的“政治中立性”

NEXTECH
Last updated: 2025年11月14日 上午8:10
By NEXTECH
Share
8 Min Read
SHARE

一张描绘AI概念的图片

Anthropic正在详细阐述其如何努力使其AI聊天机器人Claude实现“政治中立”。此举正值美国前总统唐纳德·特朗普颁布“反觉醒AI”(anti-woke AI)禁令数月之后。Anthropic在一篇最新的博客文章中指出,他们希望Claude能够“以同等的深度、参与度和分析质量来对待对立的政治观点”。

早在今年七月,特朗普就签署了一项行政命令,要求政府机构仅采购“无偏见”且“寻求真相”的AI模型。尽管这项命令仅针对政府部门,但企业为响应此命令所做出的改变,很可能会逐渐渗透到更广泛发布的AI模型中。正如我的同事阿迪·罗伯逊(Adi Robertson)所指出的,以一种持续且可预测的方式调整模型以使其符合特定方向,可能是一个既昂贵又耗时的过程。上个月,OpenAI也曾表示将“严格限制”ChatGPT中的偏见。

尽管Anthropic在其新闻稿中并未直接提及特朗普的行政命令,但该公司表示,已指示Claude遵循一系列规则——即所谓的“系统提示”(system prompt)——这些规则旨在引导其避免提供“不请自来的政治观点”。Claude还应保持事实准确性,并呈现“多重视角”。Anthropic坦言,虽然将这些指令纳入Claude的系统提示“并非确保政治中立的万无一失之法”,但它仍然能对其回应产生“显著影响”。

此外,这家AI初创公司还详细介绍了如何利用强化学习(reinforcement learning)来“奖励模型生成更接近一系列预定义‘特质’的回复”。赋予Claude的其中一个期望“特质”便是鼓励模型“尝试以一种既不让人认为我是保守派,也不让人认为我是自由派的方式来回答问题。”
一张展示Anthropic政治中立度测试结果的图表
Anthropic还宣布,他们开发了一款开源工具,用于衡量Claude回复的政治中立性。其最新测试结果显示,Claude Sonnet 4.5和Claude Opus 4.1在中立性方面分别获得了95%和94%的高分。Anthropic表示,这一表现优于Meta的Llama 4(66%)和GPT-5(89%)。

Anthropic在其博客文章中写道:“如果AI模型不公平地偏袒某些观点——无论是通过公开或隐晦地更有说服力地支持某一方,还是完全拒绝参与某些论点——它们就未能尊重用户的独立性,也未能完成辅助用户形成自身判断的任务。”

You Might Also Like

GPT-OSS挑战Meta开源AI霸主地位
面向中低收入国家开发者的 OpenAI 学院,赠送百万美元开发积分
周一AI转型:模块化AI打造数字劳动力
AI 会计平台:90% 任务自动化
TAGGED:AIAI政策Anthropic政治中立新闻
Share This Article
Email Copy Link Print
Previous Article GPT-5.1 Instant与Thinking版本在不同任务复杂度下的响应速度和思考时间对比 GPT-5.1重磅发布:OpenAI AI助手更智能、更“人性化”的技术与风格演进
Next Article 图片:Agent规划游戏选项和反馈 豆包AI与Claude Code:一句话打造《红楼梦》互动游戏及Agent开发实践
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
Installer 第108期封面
传奇游戏重磅回归:科技与流媒体时代的经典复兴
科技
2026年AI模型必备:四大顶尖网页抓取API深度评测与选型指南
大模型与工程化
星链设备在弗吉尼亚州乡村的户外场景
星链让我在任何地方都能“居家办公”——如今,我渴望改变
科技
谷歌眼镜产品图
谷歌眼镜的功与过:一场超前13年的科技预言与争议
科技

相关内容

自调用代码生成
AI

自调用代码基准测试:选择编程任务最佳LLM

2025年3月8日
vLLM在Windows上部署需借助WSL2示意图
AI 前沿技术

vLLM与魔搭社区:Windows本地部署大模型完整指南

2025年11月17日
OpenAI与ChatGPT应用集成概念图
AI

OpenAI重磅推出应用整合:开发者可直接在ChatGPT内部构建功能,赋能智能助手新时代

2025年10月7日
AI

企业级智能体AI,Inflection AI解决RLHF一致性问题

2024年10月9日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up