首页 AI > 内容

AI如何在不知道规则的情况下赢得游戏

时间:2021-01-21 19:27:29 来源:

认为人工智能对人类构成威胁的人们可能不喜欢DeepMind的最新成就。Alphabet的AI部门提出了一种新算法,该算法允许机器在不知道游戏方式的情况下击败游戏。这是一个绝对令人惊讶的发展,因为该算法将使AI适应尚未被喂食任何特定算法的现实情况。这就是为什么它听起来也很恐怖的原因。

在学会游戏后,DeepMind AI击败专业围棋玩家(AlphaGo)是一回事。但是Deepmind开发了AlphaGo Zero,它使计算机可以通过自己玩游戏来掌握游戏。它的前身是通过观察人与人之间的真实比赛来做到这一点的。Engadget回忆说,AlphaZero紧随其后。这是一种使用单一算法玩围棋,象棋和将棋的AI。这些AI创作中的每一个都知道他们正在玩的游戏规则。

MuZero是最新的DeepMind AI,不需要教这些规则。它可以自己学习,做出相应计划并获胜。MuZero在Atari游戏中可以做同样的事情。在学习规则之后,新的AI可以变得与以前的版本一样好,甚至更好。

该项目的目标是提供一种单一算法,该算法可使AI在不知道控制该场景的规则的情况下思考其下一步行动。对于象棋和围棋这样的游戏而言,这说起来容易做起来难,因为象棋和围棋这类预先定义的动作会让您成败。但是在大多数现实情况下,如果不访问本质上允许其思考的复杂算法,则AI可能难以导航。

MuZero实际上并没有为自己思考,这不是科幻小说中令人恐惧的AI。但是,如果DeepMind的算法允许计算机为未知的所有规则提供模拟的胜出解决方案,那么它确实达到了一个重要的里程碑。游戏仅是为了证明算法有效,但它可能会在不受固定规则约束的现实生活中使用。

Engadget解释说,MuZero在做出决定时会考虑三件事。首先,它将查看上一步的结果,它所处的当前位置以及下一步的最佳操作方法。DeepMind发现MuZero与以前的AI匹配。而且,时间越长,交付的解决方案就越好。即使增加了时间限制,例如限制举动前吃豆人的模拟次数,MuZero也取得了不错的结果。

字母表将在哪里使用MuZero尚待观察。DeepMind认为,机器人技术可能是一个潜在领域。

标签: AI