DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类

大千世界 2022年09月21日 13:23 295 0

　　DeepMind 又对雅达利游戏下手了!

　　这次，他们最新推出的智能体 MEME，在效果不变的前提下，比两年前的 Agent57 提速了 200 倍!

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第1张图片-大千世界

　　Agent57，是 DeepMind 在 2020 年搞的一个智能体，史上首次在所有 57 个雅达利游戏中超过了人类基准表现。

　　但它有一个致命缺陷是效率低：需要近 800 亿帧的数据训练才能实现。

　　现在，MEME 的出现完美解决了这一问题。

　　有网友看完表示：这就是真正的样本高效吧。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第2张图片-大千世界

　　话不多说，赶紧来一睹为快吧。

　　新的智能体：MEME

　　Agent57，作为首个在所有雅达利游戏中超越人类基准表现的智能体，性能上已足够先进。

　　但问题是，要想达到这一目标，背后需要 780 亿帧的庞大的经验训练，这在时间和成本上都是一笔大开支。

　　因此，以 Agent57 为起点，DeepMind 采用了一系列不同的策略，来实现训练效率上的提升。

　　他们调查了在减少数据制度时遇到的一系列不稳定因素和瓶颈，并提出了有效的解决方案，最后建立一个更加强大和高效的智能体：MEME。

　　新的 MEME 智能体主要针对 Agent57 的 4 个方面进行改善，分别是：

　　A.实现与罕见事件相关的学习信号的快速传播;

　　B.在不同的价值尺度下稳定学习;

　　C.改进神经网络结构;

　　D.在快速变化的政策下使更新更加稳健。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第3张图片-大千世界

　　为了达到这四个目标，DeepMind 采取了以下方法，与上述四点相对应。

　　A1.用在线网络进行引导;

　　A2.有公差的目标计算;

　　B1.损失和优先权归一化;

　　B2.交叉混合训练;

　　C1.无归一化的躯干网络;

　　C2.带有综合损失的共享躯干;

　　D.通过策略提炼的鲁棒行为。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第4张图片-大千世界

　　这些方法旨在提高 Agent57 的数据效率，但这种效率的提高不能以牺牲终端性能为代价。

　　因此，为了检验经过上述步骤的智能体 MEME 的效率和性能，研究团队分别在 2 亿、10 亿、200 亿、900 亿帧环境进行了训练。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第5张图片-大千世界

　　通过下图可以直观的看出，新智能体 MEME 在 3.9 亿帧时就超过了人类基准，比 Agent57 快了两个数量级，并且在将参数量从 90B 减少到 1B 的情况下，取得了类似的最终表现。

　　可以说相比 Agent57 而言，MEME 既提升了效率，又保持了性能。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第6张图片-大千世界

　　研究团队

　　MEME 的研究团队来自 DeepMind。

　　其中三位 Adrià Puigdomènech Badia、Steven Kapturowski、Charles Blundell 也是之前 Agent57 的论文作者。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第7张图片-大千世界

　　值得一提的是，Steven Kapturowski 在两篇论文中都是一作。

　　他毕业于美国科罗拉多大学博尔德分校，曾在苹果、微软、Glassdoor 等公司工作过，现在是 DeepMind 的一名高级研究工程师。

　　

DeepMind 用新 AI 超越自己：提速 200 倍，在所有雅达利游戏上胜过人类-第8张图片-大千世界

　　参考

　　[1]https://arxiv.org/pdf/2209.07550.pdf

　　[2]https://arxiv.org/pdf/2003.13350.pdf

　　[3]https://www.linkedin.cn/incareer/in/stevenkapturowski

标签： AI

本文地址： https://www.dqsj.net/keji/84365.html

文章来源： IT之家

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至23467321@qq.com举报，一经查实，本站将立刻删除;如已特别标注为本站原创文章的，转载时请以链接形式注明文章出处，谢谢！

上一篇消息称 vivo X90 标准版工程机采用 1.5K 分辨率屏幕，快充、主摄升级

下一篇微软 Surface Pro 9 曝光：搭载 i5-1235U / i7-1255U，拥有蓝 / 绿新配色

抱歉，评论功能暂时关闭!