“可回溯过去 能处理多而杂任务 AI向真正“智能学习体”迈进”
科技日报北京2月24日,英国《自然》杂志24日发表人工智能研究成果报告称:美国团队可以追溯过去,处理许多杂务,真正改进许多杂务环境的探索方法,应用于机器人、语言理解和药物设计行业。 这样的算法总称为“go-explore”,在经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。 这个成果被认为是朝着真正的“智力学习体”的实现迈出了重要的一步。
通过加强学习,人工智能系统可以通过探索和理解许多复杂的环境来做出决定,学习如何以最佳方式获得报酬。 报酬包括机器人到达特定位置或在电脑游戏中达到一定水平。 但是,当遇到反馈少的许多复杂环境时,现阶段的强化学习算法容易碰壁,人工智能专家们非常烦恼。
美国“openai”是由多家硅谷巨头共同成立的人工智能非营利组织,推动者包括美国创业孵化器y combinator总裁山姆·阿尔特、美国太空技术探索企业( spacex )创始人埃隆·马斯克等, 此次,以推进人工智能为目标的“openai”科学家爱德兰·艾菲特、朱斯特·惠津哈和团队提出了较为有效的探索所面临的两个主要障碍,并设计了应对这些障碍的算法。
研究人员表示,“go-explore”能够全面探索环境,为确保人们不忘记有望成功的中间阶段和最终胜利(奖励)的道路而建立档案库。 雅达利在经典游戏中的得分超过了人类玩家和先进的人工智能系统,研究者使用这样的算法处理了此前无法处理的2600款雅达利游戏,验证了这样的算法的潜力。 “go-explore”在算法挑战“蒙特兹马复仇”中的得分是以前的4倍,在另一个算法挑战“玛雅人的冒险”中的得分也超过了人类玩家的平均水平。 而且,至今为止的算法一分也没有得到。
go-explore算法还需要用机械臂捡东西放在四个架子中的一个架子上,其中两个架子可以完成困在两扇门后面的模拟机器人任务。
研究人员指出,记忆并返回被期待成功的搜索区域的简单性基本上是强大而通用的搜索方法。 他们认为最新的算法可以应用于机器人、语言理解、药物设计。 (记者张梦然)
免责声明:南亚网站目录平台汇集了全国高质量的优秀网站推荐给网民,给站长提供免费网址目录提交收录的一个窗口,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站将予以删除。
阅读过本文的朋友还对下面文章感兴趣
心灵鸡汤: