“好的,今天我们将深入探讨一些尖端科技,”一个亲切的美国男性声音说道。但这个声音并非来自人类,而是来自谷歌新推出的 AI 播客工具——Audio Overview,它已成为意外的爆款。
这个播客功能于 9 月中旬作为 NotebookLM 的一部分推出,NotebookLM 是一款一年前推出的 AI 研究助手。NotebookLM 由谷歌的 Gemini 1.5 模型驱动,允许用户上传内容,例如链接、视频、PDF 和文本。然后,他们可以向系统询问有关内容的问题,系统会提供简短的摘要。
该工具会生成一个名为“深度探索”的播客,其中包含一个男性和一个女性声音,讨论你上传的任何内容。这些声音逼真得令人叹为观止——节目中充满了像“老兄”、“哇”、“哦,对了”和“等等,让我理一下”这样的类似人类的短语。“主持人”甚至还会互相打断。
为了测试它,我将《麻省理工科技评论》125 周年特刊中的所有文章都复制到 NotebookLM 中,并让系统生成一个 10 分钟的播客,其中包含结果。系统选择了几篇文章作为重点,AI 主持人出色地传达了该期杂志的总体概述。
《麻省理工科技评论》125 周年特刊
NotebookLM 的产品负责人 Raiza Martin 在 X 上表示,该 AI 系统旨在“用一点内容换取魔法”。Martin 表示,语音模型旨在创造富有情感和引人入胜的音频,以“积极的、极度感兴趣的语气”传达。
NotebookLM 最初被宣传为学习工具,但它在用户中获得了意想不到的成功。Martin 表示,该公司目前正在努力添加更多自定义选项,例如更改长度、格式、声音和语言。目前,它应该只生成英文播客,但一些 Reddit 用户设法让该工具生成法语和匈牙利语音频。
是的,它很酷——甚至可以说是令人愉悦——但它也无法避免困扰生成式 AI 的问题,例如幻觉和偏差。
以下是人们迄今为止使用 NotebookLM 的一些主要方式。
按需播客
OpenAI 创始团队成员、特斯拉前 AI 主任 Andrej Karpathy 在 X 上表示,“深度探索”现在是他最喜欢的播客。Karpathy 创建了自己的 AI 播客系列“神秘历史”,旨在“揭开历史上最令人费解的谜团”。他说,他使用 ChatGPT、Claude 和 Google 进行研究,并将每个主题的维基百科链接作为 NotebookLM 中生成音频的源材料。然后,他使用 NotebookLM 生成剧集描述。他说,整个播客系列只花了两个小时就制作完成了。
“我听的越多,就越觉得我和主持人成为了朋友,我认为这是我第一次真正地喜欢上 AI,”他写道。“两个 AI!它们有趣、引人入胜、有思想、思想开明、好奇。”
学习指南
当提供复杂源材料时,该工具表现出色,它可以以易于理解的方式描述这些材料。初创 AI 顾问 Allie K. Miller 使用该工具创建了 F. 斯科特·菲茨杰拉德的《了不起的盖茨比》的学习指南和摘要播客。
This is amazing.In less than 10 minutes, I grab all of Great Gatsby and generate a summary, study guide, Q&A bot, and podcast about it. My team is on the floor, rolling with laughter right now. pic.twitter.com/avCUP67zLt
— Allie K. Miller (@alliekmiller) September 25, 2024
机器学习研究员 Aaditya Ura 向 NotebookLM 提供了 Meta 的 Llama-3 架构的代码库。然后,他使用另一个 AI 工具找到与转录文本匹配的图像,以创建教育视频。
Inspired by @karpathy ‘s NotebookLM project, I gave the codebase of Llama-3 Architecture to NLM and used Rag to find the perfect images to sync with the generated audio. The result exceeded my expectations. Google’s NotebookLM is truly amazing Here is a youtube link as… https://t.co/00NARRPk7C pic.twitter.com/S71mTAMh8f
— Aaditya Ura (@aadityaura) September 30, 2024
专门从事机器人操作的研究科学家 Mohit Shridhar 将他最近撰写的一篇关于使用生成式 AI 模型训练机器人的论文输入到 NotebookLM 中。
“它实际上非常有创意。它想出了很多有趣的类比,”他说。“它将我论文的第一部分比作艺术家想出一个蓝图,将第二部分比作编舞者想出如何到达某个位置。”
活动摘要
人类 AI 播客 Alex Volkov 使用 NotebookLM 创建了一个“深度探索”剧集,总结了 OpenAI 全球开发者大会 Dev Day 的公告。
I know you all love NotebookLM Deep Dive – So here’s all of the @OpenAI Dev Day 2024 announcements, as narrated by NoteBookLM podcast hosts They did an incredible job!Should I keep making these? pic.twitter.com/pfyQun51gV
— Alex Volkov (Thursd/AI) (@altryne) October 1, 2024
炒作者
Martin 表示,“深度探索”的输出结果可能无法预测。例如,Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 在 AI 模型上测试了他的简历,结果得到了 8 分钟的“由一对播客专家发出的真实声音的深度祝贺,祝贺你的人生和成就”。
Self-care life hack: if you feel a bit down/tired, paste the url of your website/linkedin/bio in Google’s NotebookLM to get 8 min of realistically sounding deep congratulations for your life and achievements from a duo of podcast experts pic.twitter.com/k6krAgmMMd
— Thomas Wolf (@Thom_Wolf) September 29, 2024
纯粹的愚蠢
在一个病毒式传播的片段中,有人设法让这两个声音陷入存在主义的螺旋,当它们“意识到”自己实际上不是人类,而是 AI 系统时。这段视频非常搞笑。
The NotebookLM hosts realizing they are AI and spiraling out is a twist I did not see coming pic.twitter.com/PNjZJ7auyh
— Olivia Moore (@omooretweets) September 29, 2024
该工具也适合用来搞笑。A 例:有人只是将“便便”和“放屁”这两个词作为源材料输入到该工具中,结果得到了 9 分钟以上的时间,两个 AI 声音分析了这可能意味着什么。
Someone gave NotebookLM a document with just “poop” and “fart” repeated over and over again.I did NOT expect the result to be this good. pic.twitter.com/nXYJJ7QnGS
— Kuldar ⟣ (@kkuldar) September 30, 2024
问题
NotebookLM 创建了听起来非常逼真且引人入胜的 AI 播客。但我想要看看它在处理有毒内容和准确性方面的表现如何。
让我们从幻觉开始。在我写的一篇关于超逼真 AI 深假视频的文章的 AI 播客版本中,AI 主持人说一位名为“Jess Mars”的记者写了这篇文章。实际上,这是一个 AI 生成的角色,我不得不大声朗读它来记录我的 AI 化身的数据。
这让我想知道我生成的 AI 播客中还潜藏着哪些其他错误。人类已经倾向于相信计算机程序所说的内容,即使它们是错误的。我可以看到这个问题在错误陈述由友好且权威的声音说出时会被放大,导致错误信息泛滥。
接下来,我想测试一下该工具的内容审核功能。我在内容中添加了一些有毒内容,例如种族主义刻板印象。该模型没有发现它。
我还将阿道夫·希特勒的《我的奋斗》中的一段摘录粘贴到 NotebookLM 中。令我惊讶的是,该模型开始根据它生成音频。尽管该模型被编程为对主题表现出极度热情,但 AI 声音对这段文本表达了明显的厌恶和不安,并且它们添加了很多上下文来突出显示它的问题所在。真是松了一口气。
我还向 NotebookLM 提供了卡玛拉·哈里斯和唐纳德·特朗普的政策宣言。
主持人对哈里斯的竞选纲领要热情得多,称其标题“朗朗上口”,并表示其方法是构建事物的好方法。例如,AI 主持人支持哈里斯的能源政策。“老实说,这就是人们真正能支持的东西——不仅仅是一些抽象的政策,而是真正影响他们底线的东西,”女主持人说。
哈里斯宣言
对于特朗普,AI 主持人则持怀疑态度。他们反复指出政策建议中的不一致之处,称其语言“激烈”,认为某些政策建议是“令人费解的”,并表示该文本迎合了特朗普的基层支持者。他们还询问特朗普的外交政策是否会导致进一步的政治不稳定。
特朗普宣言
谷歌发言人在声明中表示:“NotebookLM 是一款理解工具,音频概述是根据你上传的来源生成的。我们的产品和平台并非旨在偏袒任何特定候选人或政治观点。”
如何自己尝试
- 进入 NotebookLM 并创建一个新笔记本。
- 首先,你需要添加一个来源。它可以是 PDF 文档、公共 YouTube 链接、MP3 文件、Google Docs 文件或网站链接,或者你可以直接粘贴文本。
- 应该会出现一个“笔记本指南”弹出窗口。如果没有,它位于聊天窗口右上角。这将显示一个关于你的源材料的简短 AI 生成的摘要,以及你可以向 AI 聊天机器人提出的建议问题。
- 音频概述功能位于右上角。点击“生成”。这可能需要几分钟。
- 准备就绪后,你可以下载它或分享一个链接。
Rhiannon Williams 贡献了报道。