订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
2025 年将是科技巨头从向我们出售越来越强大的工具转变为向我们出售越来越强大的能力的一年。工具和能力之间的区别微妙而深刻。我们使用工具作为外部工具,帮助我们克服自身的局限性。从汽车和飞机到手机和电脑,工具极大地扩展了我们作为个人、大型团队和庞大文明所能完成的事情。
能力则不同。我们以第一人称体验能力,将其视为自我体现的能力,这些能力感觉是内在的,并且可以立即被我们的意识思维所访问。例如,语言和数学是我们人类创造的技术,我们将其加载到我们的大脑中,并伴随我们一生,扩展了我们思考、创造和协作的能力。它们是超级力量,感觉如此融入我们的存在,以至于我们很少将它们视为技术。幸运的是,我们不需要购买服务计划。
然而,下一波超级力量将不会免费。但就像我们用语言和数字思考的能力一样,我们将体验这些力量,将其视为我们一生都伴随我们的自我体现的能力。我将这种新的技术学科称为“增强心智”,它将从人工智能、对话式计算和增强现实的融合中出现。而且,在 2025 年,它将引发全球最大公司之间争夺向我们出售超能力的军备竞赛。
这些新的超级力量将由上下文感知的人工智能代理释放,这些代理被加载到我们随身携带的设备(如人工智能眼镜)中,这些设备伴随我们一生,看到我们所看到的,听到我们所听到的,体验我们所体验的,并为我们提供增强感知和解释我们世界的能力。事实上,我预测到 2030 年,我们大多数人将借助上下文感知的人工智能代理生活,这些代理将数字超级力量带入我们的日常体验。
首先,我们将向这些智能代理低声说话,它们也会低声回答,就像无所不知的另一个自我,为我们提供上下文感知的推荐、知识、指导、建议、空间提醒、方向提示、触觉提示和其他口头和感知内容,指导我们度过每一天,并教育我们了解我们的世界。
考虑以下简单场景:你走在市中心,看到街对面有一家商店。你好奇,它几点开门?所以,你拿起手机,输入(或说出)商店的名字。你很快在网站上找到了营业时间,也许还查看了有关商店的其他信息。这就是当今普遍存在的基于工具使用的基本计算模型。
现在,让我们看看科技巨头将如何过渡到能力计算模型。
阶段 1:你戴着人工智能眼镜,它可以看见你所看见的,听到你所听到的,并通过多模态大型语言模型 (LLM) 处理你的周围环境。现在,当你看到街对面的那家商店时,你只需对自己低声说:“我想知道它几点开门?”,一个声音会立即回响在你的耳边:“上午 10:30”。
我知道这与要求你的手机查找商店名称相比是一个微妙的转变,但它会让人感觉很深刻。原因是上下文感知的人工智能代理将分享你的现实。它不仅仅像 GPS 一样跟踪你的位置,它还看到、听到并关注你所关注的。这将使其感觉更不像工具,更像与你的第一人称现实相连的内在能力。
当我们被我们耳边的人工智能驱动的另一个自我问问题时,我们通常会通过点头表示肯定(由眼镜中的传感器检测到)或摇头表示拒绝来回答。这会感觉如此自然和无缝,我们甚至可能没有意识到自己回答了。
阶段 2:到 2030 年,我们不需要再向伴随我们一生的人工智能代理低声说话。相反,我们只需说出这些词,人工智能就能通过阅读我们的嘴唇和检测我们肌肉的激活信号来知道我们在说什么。我相信“口型”将被部署,因为它更私密,在嘈杂的环境中更具弹性,最重要的是,它会让人感觉更私密、更内在、更自我体现。
阶段 3:到 2035 年,你可能甚至不需要说出这些词。这是因为人工智能将学会以如此微妙和精确的方式解读我们肌肉中的信号,我们只需要考虑说出这些词来传达我们的意图。我们将能够将注意力集中在我们世界中的任何物品或活动上,并思考一些事情,有用的信息就会像我们脑海中无所不知的声音一样从我们的人工智能眼镜中回响。
当然,这些能力远不止是好奇周围的事物。这是因为与你的第一人称现实共享的机载人工智能将学会在你提出要求之前就预测你想要的信息。例如,当一位同事从走廊走来,你记不起他的名字时,人工智能会感觉到你的不安,一个声音会响起:“工程部的格雷格”。
或者,当你从商店里拿起一罐汤,对碳水化合物感到好奇,或者想知道它在沃尔玛是否更便宜时,答案就会直接回响在你的耳边或以视觉方式出现。它甚至会赋予你超能力,让你评估其他人脸上的情绪,预测他们的情绪、目标或意图,并在实时对话中指导你,让你更具吸引力、更具吸引力或更有说服力(请参阅此有趣的视频示例)。
我知道有些人会对以上我预测的采用程度和快速时间框架持怀疑态度,但我并非轻率地做出这些断言。我职业生涯的大部分时间都致力于增强和扩展人类能力的技术,我可以毫不犹豫地说,移动计算市场即将朝着这个方向发展,而且规模非常大。
在过去 12 个月里,世界上最具影响力和创新力的两家公司 Meta 和 Google 表明了他们赋予我们自我体现的超能力的意愿。Meta 首先采取了重大举措,在他们的 Ray-Ban 眼镜中添加了上下文感知的人工智能,并展示了他们的 Orion 混合现实原型,该原型增加了令人印象深刻的视觉功能。Meta 现在非常有能力利用他们在人工智能和扩展现实 (XR) 方面的巨额投资,成为移动计算市场的主要参与者,他们很可能会通过向我们出售我们无法抗拒的超能力来做到这一点。
为了不落后,Google 最近宣布了 Android XR,这是一种新的基于人工智能的操作系统,用于通过无缝的上下文感知内容来增强我们的世界。他们还宣布与三星合作,将新的眼镜和耳机推向市场。凭借超过 70% 的移动操作系统市场份额以及 Gemini 日益强大的 AI 实力,我相信 Google 将在未来几年成为技术赋能的人类超能力的领先提供商。
引用 1962 年著名的蜘蛛侠漫画,“能力越大,责任越大”。这句智慧之言实际上是关于超能力的。不同之处在于,巨大的责任不会落在购买这些科技力量的消费者身上,而是落在提供这些力量的公司和监管这些力量的监管机构身上。
毕竟,当佩戴人工智能驱动的增强现实 (AR) 眼镜时,我们每个人都可能发现自己身处一个新的现实中,在这个现实中,第三方控制的技术可以有选择地改变我们所看到和听到的内容,而人工智能驱动的语音则在我们耳边低声细语,提供建议、信息和指导。虽然意图是积极的,甚至可以说是神奇的,但滥用的可能性同样深刻。
为了避免反乌托邦的结果,我对消费者和制造商的主要建议是采用订阅商业模式。如果出售超能力的军备竞赛是由哪家公司能够以合理的月费提供最令人惊叹的新能力来驱动的,那么我们所有人都会受益。相反,如果商业模式变成了一种通过在我们的日常生活中向我们的眼睛和耳朵传递最有效的定向影响来将超能力货币化的竞争,那么消费者很容易受到我们从未面临过的精确和普遍性的操纵。
最终,这些超能力不会让人感觉是可选的。毕竟,没有它们可能会让我们处于认知劣势。现在,行业和监管机构有责任确保我们以一种不具有侵入性、操纵性或危险性的方式推出这些新能力。我相信这可以成为计算领域一个神奇的新方向,但这需要仔细的规划和监督。
路易斯·罗森伯格创立了 Immersion Corp、Outland Research 和 Unanimous AI,并撰写了《我们的下一个现实》。
DataDecisionMakers
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作技术人员)分享数据相关见解和创新的平台。
如果您想了解前沿理念和最新信息、最佳实践以及数据和数据技术的未来,请加入我们 DataDecisionMakers。
您甚至可以考虑自己撰写文章!
阅读 DataDecisionMakers 的更多内容