历史最高分!腾讯绝悟AI斩获Minecraft AI竞赛冠军( 二 )
文章图片
文章图片
(不同动作的可视化结果 , AI学会了关注当前图像中的关键区域)
随着游戏推进 , 智能体与人类的策略出现了很大的分歧 。此时 , 人类数据已经很难用于指导AI 。绝悟AI使用了自模仿学习 (Self-imitation Learning)的思想 , 提出了基于鉴别器的自模仿学习算法 , AI可以从自身过往的成功与失败中获得经验与教训 , 并在察觉到当前状况不妙的时候 , 主动往更好的方向修正 。对比实验证明 , 在加入自模仿策略后 , 智能体探索到的行为更加一致 , 也可以显著降低进入危险区域的概率 。
对于合成物品等需要长链条的动作序列的任务 , 研究人员也做了细致的优化 。通过动作序列一致性过滤 (Consistency Filtering) 与基于投票的集成学习(Ensemble Learning) , 模型在合成物品阶段的成功率从35%提升到96% , 一举将最薄弱的链条扭转为了最稳定的制胜点 。
利用高度复杂、高度定制化的游戏场景作训练场 , 腾讯 AI Lab 的深度强化学习智能体正不断走近现实 。棋牌游戏 AI “绝艺”从围棋棋盘逐步走向象棋、麻将 , 策略协作型 AI “绝悟”从MOBA走向FPS、RTS , 再到如今的 3D开放世界 MineCraft 。它们迈向全新挑战的每一步 , 都让AI离解决现实问题、科技向善的大目标更近了一步 。
随着虚实集成世界逐步变成现实 , 这些研究的经验、方法与结论 , 将在真实世界创造更大的实用价值 。
来源:雷锋网
推荐阅读
- 动视暴雪被高溢价收购 坐拥大量游戏金矿的腾讯将迎来什么?
- 整个寒假最多玩14小时?腾讯游戏公布2022年寒假未成年人限玩时间
- 腾讯游戏发布寒假限玩日历:假期未成年人打游戏时间合计不超14个小时
- 《阿凡达》MMO 射击手游官宣今年上线:虚幻引擎 4 开发,腾讯海外发行
- 腾讯又一款“远古”游戏走向终结,8500多万玩家要补偿
- 韩国解说:uzi不是历史第一adc
- 上海输入性感染者数量超历史最高!张文宏最新发文,信息量大、针对性强
- 历史悠久的常州有不少特色菜,你知道几个?
- Uzi历史地位遭到质疑,李哥点赞承认Bang是史一下
- uzi风评突然反转,网友玩梗嘲笑黑历史