加入我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
SingularityNET 和人工智能超级智能联盟 (ASI Alliance) 宣布,一个名为 AIRIS(自主智能强化推断符号)的新型学习 AI 被放置在一个 Minecraft 实例中,并被完全放任自流,通过实践学习如何玩游戏。这个 AI 从 Minecraft 中的空白状态开始,仅利用游戏的反馈循环进行学习。
AI 之前也曾被用来学习游戏,但通常是在更线性的二维空间中。在 Minecraft 中,AIRIS 可以进入一个更复杂的三维世界,并逐渐开始探索和导航,以了解它能做什么,更重要的是,它是否能够在没有明确指示的情况下理解游戏设计目标。它如何应对环境变化?它能找到通往同一地点的不同路径吗?它能像人类玩家一样在 Minecraft 中发挥创造力吗?
VentureBeat 联系了 SingularityNET 和 ASI Alliance,询问他们为什么选择 Minecraft。
该公司的一位代表回答说:“AIRIS 的早期版本是在简单的二维网格世界益智游戏环境中进行测试的。我们需要在一个更复杂、更开放的三维环境中测试该系统。Minecraft 完美地符合这一描述,是一款非常受欢迎的游戏,并且具备将 AI 接入所需的所有技术要求。Minecraft 也已经被用作强化学习的基准。这将使我们能够将 AIRIS 的结果与现有算法进行直接比较。”
他们还提供了更深入的解释。
“该智能体从环境中获得两种类型的输入,以及它可以执行的动作列表。第一种输入是围绕智能体的 5 x 5 x 5 三维网格的方块名称。这就是智能体“看到”世界的方式。第二种输入是智能体在世界中的当前坐标。这使我们能够为智能体提供一个我们希望它到达的位置。在这个第一个版本中,动作列表是向八个方向(四个基本方向和对角线)移动或跳跃,总共 16 个动作。随着我们扩展智能体的功能以包括挖掘、放置方块、收集资源、与怪物战斗和制作,未来的版本将拥有更多动作。
“智能体从‘自由漫游’模式开始,并试图探索周围的世界。它构建了一个内部地图,记录它去过的地方,可以通过包含的可视化工具查看。它学习如何导航世界,并在遇到树木、山脉、洞穴等障碍物时学习和适应。例如,如果它掉入一个深洞,它会探索自己的出路。它的目标是填补其内部地图中的任何空白区域。因此,它会寻找通往它尚未看到的地方的方法。
“如果我们为智能体提供一组坐标,它将停止自由探索,并导航到我们希望它去的地方。它会探索它从未见过的区域。这可能是在山顶、深洞中或海洋中央。一旦它到达目的地,我们可以为它提供另一组坐标,或者让它回到自由漫游模式,从那里开始探索。
“自由探索和能够穿越未知区域的能力是 AIRIS 与传统强化学习的不同之处。无论你提供多少百万次训练集或多少计算能力,RL 都无法完成这些任务。”
对于游戏开发来说,AIRIS 的一个成功用例可能是自动进行软件的错误和压力测试。例如,一个假设的 AIRIS 可以运行在整个 Fallout 4 中,并在与 NPC 或敌人互动时创建错误报告。虽然质量保证测试人员仍然需要检查 AI 记录的内容,但这将加快开发过程中一个繁琐且令人沮丧的过程。
此外,这是 AI 在复杂、全方位世界中进行自我导向学习的虚拟世界的第一步。对于整个 AI 爱好者来说,这应该令人兴奋。