前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

Anthropic详解:如何确保并衡量AI助手Claude的“政治中立性”

NEXTECH
Last updated: 2025年11月14日 上午8:10
By NEXTECH
Share
8 Min Read
SHARE

一张描绘AI概念的图片

Anthropic正在详细阐述其如何努力使其AI聊天机器人Claude实现“政治中立”。此举正值美国前总统唐纳德·特朗普颁布“反觉醒AI”(anti-woke AI)禁令数月之后。Anthropic在一篇最新的博客文章中指出,他们希望Claude能够“以同等的深度、参与度和分析质量来对待对立的政治观点”。

早在今年七月,特朗普就签署了一项行政命令,要求政府机构仅采购“无偏见”且“寻求真相”的AI模型。尽管这项命令仅针对政府部门,但企业为响应此命令所做出的改变,很可能会逐渐渗透到更广泛发布的AI模型中。正如我的同事阿迪·罗伯逊(Adi Robertson)所指出的,以一种持续且可预测的方式调整模型以使其符合特定方向,可能是一个既昂贵又耗时的过程。上个月,OpenAI也曾表示将“严格限制”ChatGPT中的偏见。

尽管Anthropic在其新闻稿中并未直接提及特朗普的行政命令,但该公司表示,已指示Claude遵循一系列规则——即所谓的“系统提示”(system prompt)——这些规则旨在引导其避免提供“不请自来的政治观点”。Claude还应保持事实准确性,并呈现“多重视角”。Anthropic坦言,虽然将这些指令纳入Claude的系统提示“并非确保政治中立的万无一失之法”,但它仍然能对其回应产生“显著影响”。

此外,这家AI初创公司还详细介绍了如何利用强化学习(reinforcement learning)来“奖励模型生成更接近一系列预定义‘特质’的回复”。赋予Claude的其中一个期望“特质”便是鼓励模型“尝试以一种既不让人认为我是保守派,也不让人认为我是自由派的方式来回答问题。”
一张展示Anthropic政治中立度测试结果的图表
Anthropic还宣布,他们开发了一款开源工具,用于衡量Claude回复的政治中立性。其最新测试结果显示,Claude Sonnet 4.5和Claude Opus 4.1在中立性方面分别获得了95%和94%的高分。Anthropic表示,这一表现优于Meta的Llama 4(66%)和GPT-5(89%)。

Anthropic在其博客文章中写道:“如果AI模型不公平地偏袒某些观点——无论是通过公开或隐晦地更有说服力地支持某一方,还是完全拒绝参与某些论点——它们就未能尊重用户的独立性,也未能完成辅助用户形成自身判断的任务。”

You Might Also Like

AI 助力危机辅导青少年
Runway发布Gen-3 Alpha Turbo AI视频摄像机控制
AI领域:大并不总是更好
通用处理器助力边缘AI及更多应用
TAGGED:AIAI政策Anthropic政治中立新闻
Share This Article
Email Copy Link Print
Previous Article GPT-5.1 Instant与Thinking版本在不同任务复杂度下的响应速度和思考时间对比 GPT-5.1重磅发布:OpenAI AI助手更智能、更“人性化”的技术与风格演进
Next Article 图片:Agent规划游戏选项和反馈 豆包AI与Claude Code:一句话打造《红楼梦》互动游戏及Agent开发实践
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
图表1
《亚洲水发展展望2025》深度解读:亚太水安全喜忧参半,未来挑战何在?
未分类
谷歌助手设备概念图
谷歌支付6800万美元和解语音助手监听诉讼,你的隐私可能被“误触发”录音
科技
20260127081404359.jpg
甲骨文豪掷500亿美元押注AI基建,美国数据中心版图加速扩张
科技
OpenAI总裁豪掷2500万美元支持特朗普,科技巨头与政坛的深度捆绑引关注
AI

相关内容

ElevenLabs团队在a16z活动上分享的组织方法论
AI 行业应用

ElevenLabs创业方法论:20个小团队,6个月PMF生死赛与高效组织架构

2025年11月6日
20250318225215645.jpg
AI

AI赋能工业元宇宙中的机器人训练

2025年3月19日
人工智能与社会变革的图景
AI 行业应用

AI影像诊断普及,放射科医生为何反成“香饽饽”?深度解析AI对医疗与社会经济的影响

2025年11月11日
20241203010345411.png
AI

AI 规模化终结了吗?未来方向

2024年12月3日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?