您所在的位置:首页 > 销售技巧

热点推荐

最新推荐

MIT开发听觉神经网络模型,学会从2秒片段识别音乐类型

编辑:互联网时代网时间:2019-06-24 08:40:15阅读次数:

摘要:原标题:麻省理工学院开发的听觉神经网络模型从两秒钟学会识别的音乐片段来源类型:techxplore编译:笔智元科技[导读]新的麻省理工学院(MIT)的研究人员使用的机器学习算法深度神经网络,创建一个可以模拟在听觉任务人的表现,如识别音乐类型的模型。该模型包括一个数的信息处理单元,该模型是由大量的输入数据的训练来完成特定的任务。研究人员使用的模型阐明大脑是如何执行相同的任务。JoshMcDermott说:“第一次的模式为我们提供了一个可以执行

原标题:麻省理工学院开发的听觉神经网络模型,2秒片段识别风格学习

来源:techxplore

编译:笔

技术[导读]新智苑麻省理工学院(MIT)的研究人员使用的机器学习算法在深度神经网络,创造了人类第一次性能上听音乐识别任务模型的类型进行模拟。

该模型包括一个数的信息处理单元,该模型是由大量的输入数据的训练来完成特定的任务。研究人员使用的模型阐明大脑是如何执行相同的任务。

\

约什 - 麦克德莫特说:“第一次的模式为我们提供了能够执行机人的感官有意义的任务系统,这项工作是在一个人的水平等级进行。“他的脑与认知科学在麻省理工学院神经科学弗雷德里克部门。和Carole?。米德尔顿的资深作者,助理教授,是研究。“从历史上看,这种做法是难以理解的感觉,部分原因是因为我们没有一个很明确的理由,也没有发展的可能会发生什么型号的好方法。“

该研究报告发表在“神经元”杂志4月19日,该研究也证明了人类听觉皮层被安排在一个层次组织,就像视觉皮层。在这种类型的布置中,通过一个连续的过程的感觉信息,前面的基本信息处理,而相同的含义的更高级的功能的后处理的字。

技术研究生亚历山大·凯尔和斯坦福大学的丹尼尔Yamins助理教授麻省理工学院是论文的主要作者。其他作者是访问学生埃丽卡舒克和前麻省理工学院前麻省理工学院博士后萨姆·诺曼·艾涅尔。

造型大脑:模型学会准确地执行像人类一样的任务

\

当神经网络最早出现在20世纪80年代,神经科学家希望,该系统可用于模拟人脑。但是,从那个时代没有强大到足以建立一个足够大的模型,以实际任务,如物体识别或语音识别的计算机。

在过去的五年里,随着计算能力和神经网络技术来执行这些任务,利用神经网络的艰难现实的发展已经成为一种可能,他们已经成为许多工程应用标准。同时,一些神经科学家为这些系统是否可以被用来模拟人类大脑已经重新审视。

凯尔说:“这是神经科学的一个激动人心的机会,因为我们可以创建系统可以代替人类完成某些工作,那么我们就可以测试这些模型,他们用脑比较。“

麻省理工学院的研究人员训练他们的听力神经网络来执行两个任务,一个涉及语音,音乐其他。在演讲任务中,研究人员给模型提供了数以千计的两秒,录音的。任务是识别音频字。音乐的任务,该模型需要识别音乐的那件类型两秒钟。每个部分还包括背景噪音,使任务更现实和更困难。

在完成十万数据的训练后,模型学会准确地执行像人类一样的任务。

凯尔说:“我们的想法是,随着时间的推移,该模型成为任务越来越好。希望学习一些基本的东西,所以如果你给1种模型输入它从来没有听说过一个新的声音,它会做的很好,这已在实验中被证实。“

该模型还往往使人类片段的错误最容易犯错误。

神经网络处理单元可以一起以各种方式组合以形成不同的模型结构可影响模型的性能组合。

\

MIT的研究小组发现,这两个任务的最佳模式分为过程的两个阶段。第一阶段是任务之间共享,但在那之后,它分为两个分支,作进一步的分析:一个用于语音处理任务,另一个任务对音乐的处理。

证据分类:初级听觉皮层和其他区别

然后,研究人员利用他们的模型大约一个长期的听觉皮层的结构问题探讨:无论分级。

在分层系统,多个脑区,通过对系统的感官信息进行不同类型的计算。有证据表明,视觉皮层具有相同类型的组织结构。早期区,被称为初级视觉皮层,以简单的特征,诸如颜色或方向响应。后端区域是执行更复杂的任务,如对象识别。

然而,这是很难测试这种类型的组织是否也存在于听觉皮层,部分原因是没有一个很好的模式复制人类听觉的行为。

麦克德莫特说:“我们相信,如果我们能够建立一个模型,并进行人类相同的任务,我们可以比较的模型和大脑奇偶校验的不同阶段的不同部分,这样你就可以得到一些证据,以证明是否某些部分大脑是分层组织。“

研究人员发现,在他们的声学模型的基本特征,如频率更容易在早期阶段被提取。当在神经信息传递的连续过程重新联机,一些基本的功能越来越难以提取,以及更高的信息层面,如单词的含义变得更容易提取。

为了验证该模型能够复制人的听觉皮质级方式的声音信息,研究人员使用的功能性磁共振成像(fMRI),以测量真实的声音处理的大脑听觉皮层的不同区域。然后比较在处理相同的声音,大脑和模型的区别。

他们发现,相似度最高的大脑活动的主要听觉皮层模型的中间阶段以外的活动,则主网相呼应皮层。研究人员说,这是在一个分层的方式听觉皮层类似于视觉皮层结构提供了证据。

麦克德莫特说:“我们很清楚,初级听觉皮层和所有其他的东西之间的区别。“

笔者现在打算建立一个模型,可以进行其他类型的听觉任务,如声音位置来定位特定的声音,以探讨是否这些任务都可以通过这个文章中找到的想法,或由人的大脑进行了一些其他任务完成研究获得的新思路。

相关阅读

友情链接:

观音心经 大悲咒经文 佛经

|营销策划|销售技巧|市场公关|品牌营销|网络推广|

苏ICP备18043316号    互联网时代网版权所有    网站地图