针对人类语言训练的人工智能模型能否帮助我们理解狗?
密歇根大学的研究人员正在开发一种工具,可以识别狗的叫声是否传达了顽皮或攻击性,这对许多REG读者来说应该已经很明显了.
根据最新研究,想要理解他们的狗的人可能会得到人工智能的帮助.
同时,他们希望从动物的发声中了解其他信息,如动物的年龄、品种和性别.
与墨西哥国家天体物理研究所、光学和电子研究所合作,密歇根大学的团队发现,最初针对人类语音训练的人工智能模型可以作为训练针对动物交流的新系统的起点.
研究结果在计算语言学、语言资源和评估国际联合会议上公布.
计算机科学与工程学院教授拉达·米哈尔查和贾尼斯·M·詹金斯表示:“通过使用最初针对人类语音训练的语音处理模型,我们的研究打开了一扇新的窗口,让我们能够利用迄今在语音处理方面建立的知识来开始理解狗叫的细微差别.
”开展这项工作的密歇根大学人工智能实验室主任说:“关于与我们共享这个世界的动物,我们还知道很多事情.
人工智能的进步可以用来彻底改变我们对动物交流的理解,我们的发现表明,我们可能不必从头开始.
但尽管人类语言人工智能模型是在巨大的书面文本语料库上训练的,但狗不太擅长打字,它们的声音被记录下来的频率也低于人类.
为了克服这个问题,研究人员正在重新调整现有模型的用途,该模型最初是为分析人类语音而设计的.
来自各种语音技术的基础已经被训练来识别人类语音的重要特征,如语调、音调和口音.
研究人员利用人类语音模型Wav2Vec2建立了一个数据库,记录了74只不同品种、年龄和性别的狗在不同背景下的发声情况.
主要作者兼博士生阿特姆·阿巴扎利耶夫说,这些模型能够学习和编码人类语言和语音的极其复杂的模式.
本文标签: