作者实测将亚马逊Kindle图书通过OCR转为AI可读文本用于NotebookLM和ChatGPT。虽然OCR在脚注、引用处有瑕疵,但足够理解内容。过程中发现页面标签不变但内容变化的陷阱,并给出解决方案。实验证明该工作流可行,为AI辅助阅读提供新路径。
我买了一本亚马逊Kindle书:
《公共领域与协商政治的新结构性转型》
这不是一个容易OCR的目标。学术书籍,密集的论证,脚注,引用,斜体标题,人名,数字,多语言引用。换句话说,这类书最容易暴露OCR流程的弱点。
所以它是个好测试案例。
目标不是生成完美的存档版转录,而是看输出是否足够用于个人AI辅助阅读。
read.amazon.com)打开已购图书。BookHalo是我为这个流程开发的Chrome扩展。它只用于个人阅读工作流:处理已购图书,在Kindle Cloud Reader打开,转换成AI工具更容易使用的文件。
关键是:它从渲染后的阅读视图工作。Kindle书是数据源,导出的文件是用于阅读、学习、搜索和提问的个人工作副本。

BookHalo在Chrome中运行,书在Kindle Cloud Reader里打开。扩展生成AI可读的导出文件,用于个人阅读和学习。
产品演示视频:
完整跑完了。
BookHalo跑到了书末尾,导出了PDF和TXT。截取了115个渲染页面,生成约161KB的文本文件。端到端测试在我的本地环境花了4分钟多一点。
输出不完美,但可读。
对于普通英文散文,OCR结果足够跟上作者论证。这是NotebookLM和ChatGPT工作流的关键门槛。只要AI能看到论点、案例、转折和重复术语,就能帮忙总结、组织和提问。
难啃的部分在预料之中:
这些地方出现了OCR伪影:缺空格、标点错误、偶尔的畸形短语。所以不能直接拿输出做精确引用,需要回Kindle页面核对。
但用于理解书的内容,它是有用的。
在最后一次成功运行之前,我遇到了一次有趣的失败。
Kindle Cloud Reader有时候显示相同的位置标签,但可见页面的内容却在变化。看起来读者在往前翻,但位置标签在好几屏里都停在同一个值。
这对任何依赖“位置相同=页面相同”的自动化流程来说都是问题。
第一次尝试时,因为位置没变,抓取提前停止了。但视觉上内容还在变。修复方法是:不再只看位置标签。当位置不变时,BookHalo现在同时检查页面图片。如果图片变了,就视为该位置下的子页面,继续抓取。
这个修复在这本书里起了作用。有一个难啃的章节,一个位置标签下需要多个视觉上不同的页面。
这种边界情况只有在测试真实书籍时才会遇到。
NotebookLM是基于源文件的。Google的帮助页面列出了支持的源类型:文本、Markdown、PDF、DOCX、CSV、EPUB、Google文档、网页URL、YouTube URL、图片、音频。
所以源文件质量很关键。
只给NotebookLM高亮片段,它只能从片段中回答。给更完整的文本,它就能从更完整的上下文中推理。

有用的门槛不是完美的存档级转录,而是AI阅读工具能基于它做摘要、提问和学习笔记的源文本。
导出Kindle书到文本后,可以问类似的问题:
这些不是高亮管理任务,而是源文件理解任务。
这才是将Kindle阅读转换为AI可读文本的真正原因。

一旦书变成源材料,NotebookLM就能生成学习辅助工具:摘要、思维导图、音频概述等。
这不是说OCR完美。
也不是说每本Kindle书行为都一样。不同书籍有不同排版:表格、图片、双栏、小字号脚注、特殊字体。这些需要更多测试。
而且这不是一个用于再分发的流程。
预期用途是个人阅读和学习,用你已经拥有的书。如果需要精确引用、出版或法律用途,请对照原书核实。
对我来说,实用规则是:
实验成功了。
对这本亚马逊Kindle书,导出的文本足够用于AI辅助阅读。它不是一本完美版本的纯文本,但作为摘要、学习指南、主题搜索和追问的源材料已经够用。
这就是我在意的门槛。
我不需要完美的转录来让AI阅读变得有用。我需要一个可靠的方式把书变成NotebookLM和ChatGPT能处理的形式。
这个测试表明这个流程可行。
BookHalo是我正在开发的Chrome扩展,用于Kindle Cloud Reader到AI阅读的工作流。
了解更多:
https://book-halo.com/?src=medium_amazon_com_test&medium=article&campaign=us_ai_reading
如果想知道NotebookLM的详细步骤,我还写了指南:
Chrome Web Store列表:
https://api.book-halo.com/go?src=medium_amazon_com_test&medium=article&campaign=us_ai_reading
声明:我是BookHalo的创建者。
来源:
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断