凯旋门棋牌游戏

揭秘语言处理模型如何思考!这个数据集让机器听懂你的弦外之音

揭开语言处理模型的思维方式!此数据集可让机器理解您的超串音

聪明的东西(公共号码:zhidxcom)编辑了|李水清

知识分子8月14日消息,最近,马里兰大学的研究人员开发了一种新的语言处理模型数据集,其中涵盖1200多台难以回答的计算机。据说该数据集有助于语言处理系统理解更深层次的语义。

只要您与Siri,小艾和其他语音助手交谈过,您会发现在计算机真正理解人类语言之前还有很长的路要走。机器通常只能理解陈述的表面含义,无法理解复杂的表达和深刻的含义。因此,计算机系统需要引入更复杂的训练主题以提高“语言理解能力”。

马里兰大学的研究人员设计了一个平台,可以在平台上输入问题,不仅可以获得机器的答案,还可以查看机器应答的“思考过程”,了解哪些词触发了“关联”。机。

然后,该团队开发了一个涵盖1,200多个问题的数据集,以培养更高级的语言处理模型。这些超过1,200个问题对于人类来说可能很简单,但它们可以保留当今最好的机器应答系统。结果发表在期刊《计算语言学协会学报》(《Transactions of the Association for Computational Linguistics》)。

“目前,大多数能够回答问题的计算机系统都无法解释。人们只知道它会给出答案,但他们不知道为什么会给出答案。但经过研究,我们可以解释计算机真正理解的内容。内容“。

目前,在大多数机器问答系统中,人们只负责提问,机器只负责回答。这种方法的问题在于,当人们输入问题时,他们不知道问题的哪些特定元素会使计算机混淆。当计算机收到问题时,他们要么理解字面含义,要么理解错误或输出一些无意义的单词。

Boyd-Graber和他的团队致力于为人类和计算机开发新的方法来识别问题。该团队创建了一个计算机平台,以揭示当人们向计算机提问时计算机的想法。然后,根据机器思维的局限性,人们可以进一步编辑和改进问题?缓蟮玫礁暾拇鸢浮? Boyd-Graber是该论文的作者之一,曾在马里兰大学高级计算机研究中心和信息研究与语言科学中心工作。

在团队设计的平台中,当人们输入问题时,计算机相关的“关联”问题将按顺序出现在屏幕上,并且将标记引起猜想的单词。

例如,如果提问者写道,“哪位作曲家的海顿主题变奏灵感来自Karl Ferdinand Pohl?”系统给出正确答案“Johannes Brahms”,界面标记“Ferdinand Pohl”这个词来表示这个短语触发相应的“联想”。

在获得此信息后,提问者可以进一步调整问题的措辞,以便计算机避免“阅读错误的问题”。在这个例子中,提问者立即将“Ferdinand Pohl”改为“维也纳音乐厅的档案管理员”,这导致计算机无法回答问题。

通过人机合作,研究团队开发了1,213个计算机问题。这些问题对于计算机来说很难。经过测试,即使是当今世界上最强大的计算机系统也会输给人类。

“三四年来,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄,”马里兰大学计算机科学专业的学生和该论文的合着者史峰说。 “但是,从学术领域,本文,我们的论文仍然是学术界的第一篇。”

研究人员表示,这些问题不仅可以作为计算机科学家的新数据集,而且可以更好地理解自然语言处理的不完善之处,也可以作为改进机器学习算法的训练数据集。

研究人员将这些问题分为两大类,六个小类。

第一类是语言现象。首先是解释。例如,“从悬崖上跳下去”应理解为“做出重大决定”;然后分散语言;最后出乎意料的背景。

第二类涉及推理技巧。第一个是需要逻辑推理和计算的线索;然后是问题中元素的心理三角测量;最后合成多个部分,形成一个结论。

“人类可以概括并看到更深层次的联系,”Boyd-Graber说。 “他们可能没有像计算机那样近乎无限的记忆,但他们有能力看到树叶后面的森林。

“编程计算机语言处理的问题有助于培养更高级的语言处理模型。这样,我们可以促进计算机科学像人类一样进行交谈。”

Boyd-Graber认为,在实现这一目标之前,我们还有很长的路要走。但是,这项工作提供了一个令人兴奋的新工具,可以帮助计算机科学家实现这一目

“我们正在制定未来几年的研究议程,以帮助计算机更好地回答问题,”Boyd-Graber说。

21: 18

来源:智能事物

揭开语言处理模型的思维方式!此数据集可让机器理解您的超串音

聪明的东西(公共号码:zhidxcom)编辑了|李水清

知识分子8月14日消息,最近,马里兰大学的研究人员开发了一种新的语言处理模型数据集,其中涵盖1200多台难以回答的计算机。据说该数据集有助于语言处理系统理解更深层次的语义。

只要您与Siri,小艾和其他语音助手交谈过,您会发现在计算机真正理解人类语言之前还有很长的路要走。机器通常只能理解陈述的表面含义,无法理解复杂的表达和深刻的含义。因此,计算机系统需要引入更复杂的训练主题以提高“语言理解能力”。

马里兰大学的研究人员设计了一个平台,可以在平台上输入问题,不仅可以获得机器的答案,还可以查看机器应答的“思考过程”,了解哪些词触发了“关联”。机。

然后,该团队开发了一个涵盖1,200多个问题的数据集,以培养更高级的语言处理模型。这些超过1,200个问题对于人类来说可能很简单,但它们可以保留当今最好的机器应答系统。结果发表在期刊《计算语言学协会学报》(《Transactions of the Association for Computational Linguistics》)。

“目前,大多数能够回答问题的计算机系统都无法解释。人们只知道它会给出答案,但他们不知道为什么会给出答案。但经过研究,我们可以解释计算机真正理解的内容。内容“。

目前,在大多数机器问答系统中,人们只负责提问,机器只负责回答。这种方法的问题在于,当人们输入问题时,他们不知道问题的哪些特定元素会使计算机混淆。当计算机收到问题时,他们要么理解字面含义,要么理解错误或输出一些无意义的单词。

Boyd-Graber和他的团队致力于为人类和计算机开发新的方法来识别问题。该团队创建了一个计算机平台,以揭示当人们向计算机提问时计算机的想法。然后,根据机器思维的局限性,人们可以进一步编辑和改进问题,然后得到更完整的答案。 Boyd-Graber是该论文的作者之一,曾在马里兰大学高级计算机研究中心和信息研究与语言科学中心工作。

在团队设计的平台中,当人们输入问题时,计算机相关的“关联”问题将按顺序出现在屏幕上,并且将标记引起猜想的单词。

例如,如果提问者写道,“哪位作曲家的海顿主题变奏灵感来自Karl Ferdinand Pohl?”系统给出正确答案“Johannes Brahms”,界面标记“Ferdinand Pohl”这个词来表示这个短语触发相应的“联想”。

在获得此信息后,提问者可以进一步调整问题的措辞,以便计算机避免“阅读错误的问题”。在这个例子中,提问者立即将“Ferdinand Pohl”改为“维也纳音乐厅的档案管理员”,这导致计算机无法回答问题。

通过人机合作,研究团队开发了1,213个计算机问题。这些问题对于计算机来说很难。经过测试,即使是当今世界上最强大的计算机系统也会输给人类。

“三四年来,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄,”马里兰大学计算机科学专业的学生和该论文的合着者史峰说。 “但是,从学术领域,本文,我们的论文仍然是学术界的第一篇。”

研究人员表示,这些问题不仅可以作为计算机科学家的新数据集,而且可以更好地理解自然语言处理的不完善之处,也可以作为改进机器学习算法的训练数据集。

研究人员将这些问题分为两大类,六个小类。

第一类是语言现象。首先是解释。例如,“从悬崖上跳下去”应理解为“做出重大决定”;然后分散语言;最后出乎意料的背景。

第二类涉及推理技巧。第一个是需要逻辑推理和计算的线索;然后是问题中元素的心理三角测量;最后合成多个部分,形成一个结论。

“人类可以概括并看到更深层次的联系,”Boyd-Graber说。 “他们可能没有像计算机那样近乎无限的记忆,但他们有能力看到树叶后面的森林。

“编程计算机语言处理的问题有助于培养更高级的语言处理模型。这样,我们可以促进计算机科学像人类一样进行交谈。”

Boyd-Graber认为,在实现这一目标之前,我们还有很长的路要走。但是,这项工作提供了一个令人兴奋的新工具,可以帮助计算机科学家实现这一目

“我们正在制定未来几年的研究议程,以帮助计算机更好地回答问题,”Boyd-Graber说。

仅提供信息存储空间服务。

计算机

数据集

语言

马里兰

阅读()