前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

OpenAI奥特曼:ChatGPT无法取代“真正工作”——深度访谈GPT-6、AGI与AI未来

NEXTECH
Last updated: 2025年10月15日 上午8:08
By NEXTECH
Share
60 Min Read
SHARE

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

“你今天的工作,或许并不是真正的工作。”OpenAI CEO奥特曼在与Rowan Cheung的最新访谈中,提出了这一引人深思的观点。

Contents
OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作访谈全文

OpenAI奥特曼与Rowan Cheung访谈

在这场长达30分钟的对谈里,奥特曼除了分享自己对AI与工作的思考,还涵盖了GPT-6的进展、ChatGPT是否会成为美国版微信、AGI的设想变化、AI未来的交互模式,以及他本人被恶搞成Sora热梗的感受。可以说,这次对话提供了从娱乐八卦到前沿科技的多重视角,既有趣味,也直指未来趋势。

经整理的访谈全文如下:

访谈全文

DevDay之后:最大亮点与产品布局

Q: Dev Day2025里所有发布的内容——你最兴奋的部分是哪一个?

Sam Altman:我对所有的内容都很兴奋。把应用引入ChatGPT这件事,其实我很早就想做了。

You Might Also Like

Claude Skills深度解析:一张图看懂它与MCP、Project的差异与协作
OpenAI 将 ChatGPT 升级为操作系统:支持第三方应用与MCP集成,发布AgentKit
AI意识深度解析:本质、研究方法与伦理挑战
LangExtract:大模型文本提炼工具功能与工作流程详解

但更让我兴奋的是听大家聊他们用Agent Builder做的各种东西。其实无论是Agent Builder还是Agent Kit,里面都有很多让我想亲自去用的功能。不过,如果一定要我选一个,我觉得在ChatGPT里运行应用会是最棒的。

Rowan Cheung:每周活跃用户8亿人的ChatGPT已经成了新的分发平台。开发者和创业者该怎么利用Apps SDK在ChatGPT上构建应用呢?

Sam Altman:我觉得我们还需要经过一些迭代,才能真正弄清人们主要会怎么使用这些功能。比如,人们会习惯根据应用的名字来调用它们吗?还是他们更希望ChatGPT自己知道他们常用的是什么,并主动推荐?

我觉得未来开发者会摸索出一种新的分发机制,让这些应用被自然地用起来。不过这种事情总是这样:只有当你真的把它发布到世界上之后,才会被各种意外的使用方式所惊喜。

Rowan Cheung:我记得你们也发布了文档教开发者如何提高被推荐的几率?

Sam Altman:是的,不过还是得带上免责声明。全新产品变化很快,我们会在实践中一起学习。

Rowan Cheung:回到两年前的第一个Dev Day,你们推出了GPT Builder,那真的很棒。我记得自己也是最早公开搭建 GPT的人之一。从那时到现在,你们在Agent Builder上取得了哪些突破?

Sam Altman:最大的变化是模型本身变得更强了。我回想起第一个Dev Day,那时的模型能力和现在相比,差距非常大——22、23个月的时间,模型能力已经进步得惊人。同时我们也学到了很多关于用户想要怎样构建这些Agent的东西。他们不仅希望在ChatGPT上构建,也希望能在其他平台上使用。让我印象最深的是,现在你可以非常轻松地搭建一个相当复杂的系统——用可视化界面、上传几个文件、授权访问数据源、告诉它你的需求,然后几分钟就能部署好。我昨天在彩排时第一次完整看这个过程,感到震撼。借助Codex、Agent Kit等工具快速开发令人印象深刻的软件,这种体验像是经历了一次“地壳变动”。

Rowan Cheung:现在在Agent Builder里基本可以零代码构建agent,对吧?

Sam Altman:是的,不过如果你懂一点或很多代码,你能做更复杂的事情。但即便是普通的知识工作者,也可以开始构建 agent。可以说,这几乎是一场针对Agent的“零代码革命”。

Rowan Cheung:这对下一波创业者或开发者意味着什么?

Sam Altman:这是我一直在思考的问题。我昨天在后台看Romain的演示,心想——如果是一年前做,这些东西要花多长时间啊?而现在几乎可以实时完成,我甚至觉得自己的创意都跟不上它的速度了。我不完全知道这会带来什么改变,但可以肯定的是——世界上将被编写的软件数量会大幅增加,测试和改进创意所需的时间会大幅下降。你可以尝试更多想法,更快找到好点子,但具体还会改变什么,我还没完全搞明白。

距离第一家十亿级纯血Agent公司还有多久?

Q:第一家由Agent运营的十亿美元公司什么时候诞生,Agent Builder能达到那种自主水平了吗?

Sam Altman:还没呢。OpenAI此前曾非正式讨论并预测第一家单人十亿美元公司何时出现,如今也有许多关于第一家“零人公司”的猜测。

Rowan Cheung:几个月?几年?

Sam Altman:我预期是几年。但现在我们甚至可以可信地谈论——你输入一个prompt到聊天机器人,它就能运行。这本身就非常不可思议。

Rowan Cheung:不过我们看到的一些agent产品,还需要大量人工监督和反馈。什么时候才能实现agent连续一周无需反馈就能工作?

Sam Altman:我觉得Codex距离能完成一周工作并不远。虽然不一定是 2025 年能实现,但今天我和一些人聊时,他们都说——现在它已经能完成整天任务了,太快了。我很少觉得AI的进步让我晕头转向,但观察 Codex 能完成任务的时间延长速度,这次确实让我震撼。可以预期,一周级任务也不会太远了。

Rowan Cheung:技术瓶颈在哪?

Sam Altman:更智能的模型、更长的上下文、更好的记忆能力。

Rowan Cheung:所以你们有agent,各种模型升级,Codex,还能用API。回想一下,如果把20岁刚从斯坦福退学的年轻人带到现在、给他你现在掌握的所有知识,你会让他建什么?又不会建什么?

Sam Altman表示,他近期也在思考这个问题,并非常羡慕当下20岁的退学生,因为他们能构建的领域极其广阔,充满了无限机会。他坦言,过去几年自己几乎没有足够的心智空间去认真思考会做什么,但他确信有许多令人兴奋的事情可以创造。与大家交流这些项目,确实让他感到振奋。

Rowan Cheung:我最近一直在思考这个问题,也想了很多其他开发者可能也在思考——现在你能做的事情太多了。在构建这些产品时,你有没有什么建议,比如如何找到一种独特优势来维持领先?是通过分发渠道、数据,还是某种工作流模式?

Sam Altman:在抽象层面上回答这个问题总是觉得很难,因为最好的独特优势,本质上是独特的——你必须为自己摸索出来。OpenAI 花了很多功夫才找到我们的优势。一般来说,这个问题没有通用答案。

最好的答案,是你找到只适合你正在做的事情、你的产品、技术,以及你在市场上的位置和时机的那种优势。这通常也是创办新事物时创造价值的重要部分。

一条通用经验是:在实践中不断摸索。正如一句商业名言所说:“让战术成为战略。”你可以从做那些有效的事情开始,而令人惊讶的是,在这个过程中,常常会自然出现可以发展成战略的东西。

奥特曼指出,如果在ChatGPT启动之初被问及哪些会成为持久优势,他当时会表示完全不知道,可能有猜测但缺乏自信。后来,内存(memory)成为一个令人惊喜且重要的竞争优势,也是用户持续使用ChatGPT的关键原因,这在初期是未曾预料到的。你开始构建功能,然后有时候就会自然浮现出“哦,这可能成为我们一个非常持久的优势”。

GPT-6:为产品打造模型

Q:在GPT-6上,你觉得应该建立哪些优势?或者说,在构建一个产品时应该思考什么?

Sam Altman:这其实就是你必须自己去摸索的部分。我很乐意找机会一起头脑风暴,这会很有趣。但说实话,OpenAI占据了我几乎所有的思考空间,我没机会去认真考虑如何创办新公司,这有点遗憾。AI 改变了世界的很多事情,但促成公司优势的基本因素不会因此改变。比如网络效应、品牌与营销优势、用户数据,以及市场效应。如果你列一个清单,看近几年什么方式行得通,现在看大致相同,但可能会有新的战术去建立这些优势。

Rowan Cheung:最近你们推出了GDPval基准,用来衡量 AI 模型在主要知识工作岗位中实际经济任务的表现。令我惊讶的是,GPT-5排在第二,仅次于Claude的Opus模型。这你们还能把结果发布出来,非常厉害,你们对结果怎么看?

Sam Altman:首先,如果我们不愿意发布模型排名第二的结果,那就太糟了。总会有些事情我们做得最好,也会有些做得不如别人。而建立持续进步的文化方式就是——愉快而直接地承认,在某些基准或评测上,别人比你做得更好。我认为Claude团队在理解企业用例和漂亮地呈现输出上做得非常出色,所以我一点也不意外,反而受到激励想做得更好。

Rowan Cheung:这个基准会影响你们构建GPT-6的方式吗?

Sam Altman:会影响我们部分后训练(post-training)的方式,但我认为GPT-6的整体策略不会改变。

AGI:无需夸大,也不必低估

Q:你对 AGI(通用人工智能)的定义是——当它在大多数经济价值最高的工作上超越人类时。那在GDPval评分上,什么时候你会说我们已经达到了 AGI?

Sam Altman:我一直在思考这个问题。首先,像很多人一样,我对AGI有多个定义。越接近它,这个概念就越模糊。但我最关心的一点,也是让我惊喜的是,我们终于到了一个开始发生的时刻——那就是当AI能够进行新颖发现,能够扩展人类知识总量的时候。奥特曼表示,虽然不想夸大,但目前已可在社交媒体上看到诸多案例,各学科科学家指出AI已能实现一些小发现、提出新方法或解决特定问题。他再次强调,对此既不应夸大,也不应低估。这才是真正重要的事情。而我们正处在这一切的开端,并且乐观地认为未来几个月、几年我们能大力推动,这是件大事。这可能是我最关心的“AGI”指标。

Rowan Cheung:有没有特别让你兴奋的科学突破,想让AI去解决或发现的?

Sam Altman:当然,治愈疾病,发现新的物理规律,那会很棒。但即便是现在发生的小事,比如数学方面的进展,也让我觉得很重要。当GPT-4推出时,我就有这种感觉。我知道关于图灵测试存在很多争议,但大众对图灵测试的认知,曾经觉得它遥不可及,结果一旦AI通过了,人类社会基本没有更新认知。大家兴奋两周后,就开始抱怨为什么 AI 不够快,或者这不管用,让它更好。这也体现了人类的伟大——那项“AI永远的测试”就这么过去了,而我们都适应了。我感觉现在也会发生类似的事情——我们会逐渐习惯AI做科学发现。

Rowan Cheung:最近斯坦福做了一项“workslop”研究。这个词用来描述一种低回报的AI输出——表面看起来很完美,但实际上会因为返工增加额外工作量。

研究调查了1000多名办公室职员,结果显示有41%的人过去一个月里曾遇到同事产生的workslop,也就是同事使用AI生成的内容需要自己额外花时间去修改或清理。平均每次清理耗时1小时56分钟,每位员工每月因此损失约 186美元。

如果AI能像在场许多人一样将某些人的工作效率提高10倍,那么就需要系统的教育和培训,让大家明白什么时候该用AI,什么时候不该用。

Sam Altman:首先,很多人类自己也会产生类似workslop的东西,这不是AI独有的现象。比如,有些邮件只会增加额外工作,或者会议本身也可能拖慢效率。所以不必期待AI会不同。经济会自我调整,利用工具提高效率的人和公司,会比那些用工具拖慢组织的人,更能影响未来。当然,像使用任何新工具一样,会有学习曲线,但我认为速度会很快。

Rowan Cheung:OpenAI有没有做教育或培训,帮助人们更好地建立、学习这些AI的使用?

Sam Altman:有的。奥特曼指出,虽然可以提供优质的教育内容和培训,但用户总会探索各种意想不到的AI用法,例如让AI进行模仿等。不过我们确实尝试创造很多内容,帮助大家在工作流中使用AI。在Codex的一些场景中,采用速度非常快,整个公司的集成和高效使用只需几天或几周。

恶搞CEO和AGI

Q:Sora上全是恶搞你的视频,你害怕吗?

Sam Altman回应称,实际情况并没有想象中那么奇怪。看一个或许有些不适,但看上百个便习以为常了。

当时团队有人问我,可不可以让我的cameo功能开放?这是新技术,我觉得如果我都不尝试,那就是我的失误,所以我就决定做了。后面坐飞机的时候,我想会不会看起来很怪,结果刚上线时确实有点,但很快就适应了——显然这是一个充满生成视频的应用,这些内容很有趣。

Rowan Cheung:我唯一担心的是去水印的问题。今早有几家公司推出了Sora水印去除工具。如果别人可能去掉水印然后在社交媒体上发布,会影响我的个人品牌吗?这是个什么样的机制?

Sam Altman:首先,我们发布这类技术的原因之一,是因为我们看到它终将普及。未来几个月或几年,会有优秀的开源模型,任何人都能用公开的视频生成你的影像。社会最终会适应。我们发现,一种方式是提前发布并设定护栏,让社会和技术有时间共同进化。

这种方法有效。文本相对简单,视频会更难,因为视频冲击力更强,但我相信我们会学会适应。很快大家会意识到,网络上会有大量无水印、开源模型生成的假视频,这不可避免。提前让社会适应这一点,可能有价值。

Rowan Cheung:Sora的目标是生成几乎无法分辨的AI视频?

Sam Altman:目标是 AGI。他认为,高质量视频的生成是件好事,不希望未来唯一的交互界面仅限于文字。奥特曼非常期待未来能出现实时视频流的交互体验,这会不断生成全新的用户体验,并认为这是通向真正AGI一条非常有价值的路径。

Rowan Cheung:周五,你发布了一篇博客,说可能会探索对允许在Cameo中使用自己面孔的人进行收入分成。能分享一些细节吗?这个怎么运作?

Sam Altman:是的,很多时候,当你发布一个新产品时,会发现人们使用的方式与你预期的不同。我们原本认为会有少量创作者制作非常酷、非常复杂的视频并分享出去,然后有大量观众观看。确实有这种情况。但实际上,大量用户只是给三五好友制作视频,在群聊里分享,而不是在社媒里。我不确定这种使用方式能否持续,但如果持续,它会大幅影响计算资源需求与用户互动的比例。

未来可能会让人们为生成视频付费。比如你每天生成100个视频发给朋友,或者你想生成包含某位名人的视频(并且他们也同意),也许可以对生成付费分成。我们需要实验看看如何操作。

奥特曼表示,他不倾向于对一个刚上线六天的产品下定论,认为目前的高使用量可能仅是新鲜感,也可能不会形成长期使用场景。但至少到目前为止,其使用量确实庞大。

Rowan Cheung:你考虑过在Sora App中放广告吗?

Sam Altman:还没有,但这方面有趣的可能性也很大。当然,也可能有可怕的做法。与ChatGPT不同,我们可以用订阅模式获得收入;但如果Sora用户主要是在信息流中 浏览内容,那么广告可能是更自然的模式。

如果主要是私信,那又是另一种模式。我乐观地认为,也许到今年年底,或者更现实地说,到明年第一季度末,我们能理解产品的最终形态,并据此设计商业模式。我认为按生成次数收费是合理的,也值得尝试。其他商业模式则取决于产品如何发展。

AI能消灭的工作就不是工作

Q:智能时代,十亿知识工作岗位可能会首先被影响,然后才会创造新工作。你怎么看?

Sam Altman:我觉得农民不仅不会相信会发生这样的事情,他们可能会看你做的工作(互联网媒体),觉得那不是真正的工作。

种地是在提供人们真正需要的东西,养活他们,这才是真正的工作。而我们这些人,生活条件优越,食物丰富,财富充足,我们做的很多事情像是在打发时间的游戏,需要感到重要,但可能不算“真正工作”。

奥特曼表示,对当前的人们而言,这些工作感受真实,他也很感激能从事既满足又重要的事情。未来的工作可能会截然不同,或许比现在所认为的工作形式更轻松,但他相信人类的内在驱动力依然存在,会不断找到新的事务去投入。

Rowan Cheung:希望我们还能探索太空。你觉得AGI出现后,人类会重点关注什么?

Sam Altman:他希望一切都能向各个方向发展,人类能涉足所有领域。奥特曼认为太空探索很酷,但其他人可能也有各自感兴趣的方向。他期望一切皆有可能。

Rowan Cheung:如果明天可以制定一条全球政策,你会定什么?

Sam Altman:奥特曼表示,很难只选择一条全球政策。但他一直在思考AI监管的合理性及其是否会赋予大公司优势的问题。他认为,当模型变得极其强大时,应有一个全球性框架来降低灾难性风险,特别是针对最前沿的安全问题。如果能有一条全球政策实现这一目标,那将是非常理想的。

ChatGPT会成为美国版微信吗?

Q:在中国,微信几乎是一个“万能App”,购物、社交、聊天都能做。现在ChatGPT也有购物、网页搜索、Sora等功能,你们是不是想打造一个美国版微信?

Sam Altman:奥特曼否定了这一观点,并指出有诸多原因导致这种方式在美国市场行不通。他表示,OpenAI的目标是打造一个真正优秀的AI超级助手。

Rowan Cheung:为什么要把功能单独推出?比如Sora是独立App,为什么不直接放进ChatGPT?

Sam Altman:他解释说,ChatGPT对许多用户而言是最个人化的账号,将社交体验融入其中可能会显得不协调。虽然可以想象添加消息功能以促进分享和协作,但用户对ChatGPT的认知与娱乐App的认知存在显著差异。当然,OpenAI仍将许多功能整合到了ChatGPT中。

Rowan Cheung:你觉得最重要、最有用的代理(agents)是什么?最让你兴奋的是什么?

Sam Altman:可以看看 Codex 的发展,并思考在其他行业的应用。比如法律、财务建模等,是否可以有类似 Codex 的体验。已经有优秀的初创公司在做这些事情。随着技术成熟,如果这些工具在各自行业中能达到 Codex 在编码领域的水平,那将是我最兴奋的方向。他设想了一个世界:仅需与一系列代理进行对话,就能启动一家初创公司。奥特曼承认Agent Builder或Agent Kits目前尚不够完善,但通往那一目标的路径已清晰可见。

奥特曼:语音不是交互的最终形式

Q:之前你在主题演讲里提到过语音可能是AI或agent的最终形式,能详细说说吗?

Sam Altman:奥特曼认为,语音并非交互的最终形式,因为在许多情境下,语音并非合适的交互方式。

他举例说,在公共交通站点边走边讲话会令人感到烦躁。然而,在许多情况下,语音是一种非常自然的交互方式。语言本身就具有多样性,有时是语音,有时是打字,对此尚未有定论。

奥特曼表示,人们已习惯了智能音箱这类产品,尽管常被调侃,但许多人确实在使用并喜爱它们。智能音箱的不足并非概念错误,而是因为当时的AI不够强大,周边基础设施也未完善。他设想,如果只需对设备说话,它就能准确完成所需操作且几乎不构成干扰,那将是他理想中的计算机使用体验。

Rowan Cheung:你们会做语音交互吗?

Sam Altman:他指出,这需要一段时间。OpenAI需要耐心打造一种全新的设备,以在大规模上实现超高质量。这是一种完全不同的计算机使用方式,需要创造性的空间去探索。

奥特曼透露,OpenAI确实有一些令人兴奋的想法,但目前无法透露,短期内也不会。不过,OpenAI会努力创造出一种非常值得期待的产品。

TAGGED:AGIAI前沿ChatGPTGPT-6奥特曼
Share This Article
Email Copy Link Print
Previous Article MLX训练性能指标图 MacBook微调Qwen3指南:使用MLX框架为大模型赋能新身份
Next Article 20251015080912542.jpg Salesforce AI战略升级:Agentforce 360携手OpenAI与Anthropic
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205190349369.jpg
Meta战略大转向:削减30%元宇宙预算,全力押注AI
科技
20251205183721458.jpg
南部非洲古人类基因组改写进化史:20万年隔离与独特基因
科技
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技

相关内容

静态质检与动态攻防演习的区别
AI 前沿技术

AI安全的“皇帝新衣”:千亿级模型投资正建立在集体幻觉之上

2025年10月26日
李继刚在43 Talks分享现场
AI 前沿技术

李继刚解密AI时代:AI本质、提示词心法与未来人才进化论 | 43 Talks

2025年10月16日
创建ChatGPT项目并上传文件(图片由作者提供)
职业发展与学习路径

巧用ChatGPT:数据科学求职、面试与薪资谈判全攻略

2025年10月7日
GPT-5.1 Thinking思考时间调整示意图
AI 前沿技术

OpenAI GPT-5.1 全面升级:情商智商双核提升,个性化交互与模型特点详解

2025年11月14日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up