ChatGPT、Kimi等AI产品将空白首页简化成一个输入框,看似极简,实则抛弃了20年交互设计经验。数据显示,70%的新用户在第一次会话后再也不回来。问题不在模型,而在那个闪烁的光标。

三个动词,六个完整示例,“使用AI创建”只是选项之一。这是2026年一个真正为行动设计的空状态。来源:作者截图自Notion。
过去三年发布的每一个主流AI产品,空状态都是一样的:居中的文本框、placeholder文字、四到六个推荐prompt。ChatGPT、Claude、Gemini、Copilot、Cursor、Perplexity、Grok,还有中国的智谱清言、Kimi、文心一言。屏幕长得一模一样,因为设计思路一模一样。模型即产品,输入框即界面,推荐提示词是唯一的指引。
这不是品类限制,而是品类惯例——2023年第一代大模型产品上线时,几乎没经过真正的设计阶段就定型了,之后再也没有人回头重想。Bret Victor二十年前在“Magic Ink”中警告过的设计缺陷恰恰就是这种:当交互被当作信息产品的首要界面时,用户被迫从头学习如何操作每一款新软件。输入框纯靠交互驱动。每一次会话都始于一个闪烁的光标,和一个需要用户自己凭空发明的问题。
我在《聊天框不是UI范式》中写过类似的失败:聊天框只是大模型到来时没有设计时间而匆匆上马的东西,并非我们刻意选择的范式。空状态是同一个故事,只是聚焦到用户看到的第一个画面。

一个标题、一个文本框、三个推荐。“Ask anything”恰恰是动词的反面。来源:作者截图自ChatGPT。
我参与合建的一款Chrome插件,大约70%的新安装用户再也没有回来第二次。安装用户群是有明确需求的:他们搜索了这个产品、阅读了介绍、点击安装并授予了权限。他们想要我们提供的东西。但他们没留下,因为第一次会话让他们思考而不是行动。
当我们A/B测试空状态时,规律极其一致。给用户展示真实成果(一个填充好的示例、从他们自己数据中抽取的样本结果、他们想做的某件事的完成品)的版本,优于展示空白字段和“开始输入吧”的版本,领先幅度之大,任何2010年的增长团队都会只推第一个版本。
Kathy Sierra将这一差距称为Suck Threshold(挫败阈值):从安装到掌握之间的距离,用户必须经历不擅长才能变得擅长。你越快帮用户跨过这个阈值,他们就越可能留下来。空白输入框的第一次会话,恰恰扩大了这段距离。
我的数据来自Chrome扩展,但这个规律普适。看过AI产品首周留存曲线的人都知道那根形状:第一次会话后断崖式下跌,一条长长的平尾,一小撮重度用户在驱动着发布帖引用的参与数据。下跌发生在空状态,而不是模型。

悬崖就在安装和第二次会话之间。空状态里发生了什么,决定了这条曲线的形状。来源:作者根据匿名内部数据在Canva生成。
输入框并没有用更简单的东西替代空状态设计。它用“什么都没有”替代了。四十年的人机交互研究成果——初学者如何变成熟练用户、能指、示能性、识别优于回忆、渐进式展示、分步引导——在最需要它们的品类中被干净利落地抛弃了。
Jakob Nielsen的10条可用性启发包括“识别而非回忆”:用户不应该需要记住界面另一处的信息才能使用当前部分。输入框天然违背了“识别”。用户被要求在还没看到产品能力之前,用自己的话回忆产品能做什么、该问什么。
Steve Krug的《Don't Make Me Think》是主流网页UX的基本前提。输入框却是一个写着“请思考”的屏幕。先思考是该问具体问题还是探索性提问,再思考用什么词模型反应最好,再思考怎么措辞。等用户打完两句话,他们已经完成比2019年同类SaaS产品整个引导流程更多的认知工作。
Erika Hall的《Conversational Design》(2018)论证:对话式界面只有在双方有真实共享情境时才有效。全新用户的第一次会话、空白的输入框——没有任何共享情境。用户不知道产品擅长什么、不擅长什么、哪些要收费、会记住什么数据。对话无法真正开始。
精心设计的AI空状态应该具备四个特征:展示工作示例、提供起始动词、暴露已知局限、让用户先行动后说话。技术完全支持这四点。之所以没有一个大规模落地,是因为输入框是成本最低的屏幕,而整个行业之后再没去建一个成本更高的。
工作示例替换闪烁光标。不要求用户发明问题,而是在首页展示一个代表性问题的答案。Bret Victor在“Magic Ink”中的框架完全适用:信息软件应该展示,而不是交互。首页的工作示例是图形,不是交互。
起始动词替换“问我任何问题”。Linear的空状态写的是“创建你的第一个Issue”。Notion写的是“输入斜杠使用命令”。具体的动词让用户行动。“问我任何问题”是动词的反面——它恰恰是动词的缺失。
暴露局限替换静默失败。Norman的反馈原则说系统应该沟通它当前的状态和不能做什么。AI产品普遍把局限藏在答案级别的模糊措辞里。设计得当的空状态会提前告知边界:此模型无网络访问、此模型不能读图、知识截止至某日。我在《AI聊天中被遗忘的对话问题》中做过类似论证:AI产品始终隐藏自身能力的架构局限,用户为这些信息差买单。
先行动后说话替换对话优先设计。AI产品首次会话中最好的时刻,是用户意外做了一件有用的事。设计良好的空状态会刻意制造这个时刻,而不会等待用户把问题问到足够好来“挣得”一次有用输出。

技术完全支持这四点。整个品类一个都没选。来源:作者在Canva设计的图表。
哪款AI产品的空状态让你印象最深?我用过的产品里,那些先给示例后给光标的,才是我想回去的。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断