机器学习领域的强化学习技术有什么用处?
来自查尔默斯大学和哥德堡大学的跨学科研究团队开发了一个框架,用于研究语言如何演变为描述心理概念的有效工具 。在一篇新论文中,他们表明,人工代理可以学习如何以类似于人类语言的人工语言进行交流 。该结果已发表在科学杂志《PLOS ONE》上 。
这项研究位于认知科学和机器学习之间的边界 。认知科学家提出了一个有影响力的建议,即所有人类语言都可以看作是进化成为一种以经典信息论的意义以接近最优的方式传达概念的手段 。哥德堡研究人员训练人工代理的方法是基于强化学习的,强化学习是机器学习的一个领域,代理通过与环境交互并获得反馈逐渐学习 。在这种情况下,代理人在没有任何语言知识的情况下开始学习,并通过获取有关他们在传达思想观念方面的成功程度的反馈来学习交流 。
重建色彩
“在我们的论文中,我们研究了代理商如何通过打几轮由发送者和听者组成的参考游戏来学习命名心理概念和进行交流 。我们特别关注了在认知科学中已深入研究的色域 。游戏的工作方式如下;发送方看到一种颜色,并通过从词汇表向听众说出一个单词来描述颜色,然后尝试重建颜色 。
根据收听者重建的精确程度,这两个代理都会收到共享的奖励 。词汇表中的单词一开始就没有意义;在游戏的多个回合中,由代理商决定单词的含义 。我们看到,从信息论的角度来看,由此产生的人工语言几乎是最优的,并且具有与人类语言相似的特性 。” Sleepcycle研究人员MikaelK?geb?ck说,他在Chalmers的博士学位论文中包含了一些结果在论文中提出 。
与哥德堡大学语言理论和概率研究中心(CLASP)计算机语言学研究人员Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起 。他是计算机科学与工程系数据科学和AI部门的学生,现在已经发表了结果 。
Asad Sayeed说:“从实际的角度来看,这项研究提供了开发与人类语言进行交流的对话主体(例如Siri和Alexa)的基本原理 。”
通过强化学习来学习交流的基本思想对于社会和文化领域的研究也很有趣,例如,由阿萨德·萨耶德(Asad Sayeed)领导的GRIPES项目,该项目研究狗舌政治 。
在将来的研究中有用
文章插图
“认知实验非常耗时,因为您经常需要对人类志愿者进行仔细的实验 。我们的方法提供了一种非常强大,灵活且廉价的方法来研究这些基本问题 。实验完全在我们的控制之下,可重复且完全可靠因此,我们的计算框架为研究认知科学,语言和交互作用中的基本问题提供了一种有价值的工具 。对于计算机科学家来说,探索各种学习机制的有效性是一个肥沃的领域 。” Devdatt Dubhashi说 。
Emil Carlsson说:“将来,我们要调查代理商是否也可以在其他领域发展类似于人类语言的交流 。一个例子就是我们的代理商是否能够重构我们在人类语言中观察到的等级结构 。”
长期存在的问题
该研究源于认知科学和语言学一个长期存在的中心问题:在人类语言的所有巨大多样性中,是否存在共同的普遍原则 。20世纪的经典作品表明,用不同的语言来描述颜色具有共同的特性 。是否有解释这些共同属性的基本原则?
认知科学家最近提出的一项有影响力的建议是,从信息论的角度来看,当语言被视为一种交流思想概念,最有效地利用资源的手段时,确实存在着这样的普遍通用原则 。
【机器学习领域的强化学习技术有什么用处?】 麻省理工学院的特德·吉布森(Ted Gibson)于2016年在CLASP上发表了一系列演讲,他在演讲中描述了从世界各地不同社会和文化中选出的人类受试者的实验结果,从而引发了一个问题:“如果人类受试者被人造计算机替代,将会怎样代理,他们会开发一种具有类似通用属性的语言吗?”
责任编辑:tzh
推荐阅读
- 又一模拟芯片厂商闯关科创板,产品面向4G/5G基站、光通信等领域!
- 高三数学学习方法及复习技巧
- 高考数学解答思路技巧
- 高中英语学习方法反思与推荐
- 高中英语学科学习方法指导
- 少儿英语学习方法总结
- 高中英语必修一的学习方法
- 高中英语学习技巧及方法概论
- 策略产品经理新人如何快速学习成长
- 刘润:我不是老师,我是学习的助手