米兰大学发布论文与猫咪叫声数据集,分类喵喵叫

作者: 神经星星

来源: HyperAI 超神经

发布日期: 2021-06-24

米兰大学计算机系的研究团队成功使用隐式马尔科夫方法对猫咪在不同环境状态下的喵喵叫进行识别,并发布了一个包含440段猫咪叫声的数据集。研究团队通过音频信号处理和模式识别算法,实现了对猫叫声的自动分类,并计划下一步结合猫咪的身体动作,继续分析猫咪的情绪特征。

米兰大学计算机系的研究团队,试图用隐式马尔科夫方法将猫咪在不同环境状态下的喵喵叫识别出来,他们还真的成功了。米兰大学的研究团队在期刊《动物福利》上发布了论文《猫在不同环境中叫声的自动分类》。他们通过音频信号处理和模式识别算法,实现了对猫叫声的自动分类。此外,团队还开放了一个包含 440 段由 21 只猫收集的叫声数据集。

猫,一直以来都是最受欢迎和喜爱的家庭宠物之一,通过对它们的行为、各类研究加强对猫的全面了解。研究团队展开的这项研究,希望能够找出猫在几个常见环境下的叫声是否存在共性和规律,能通过机器学习的方式,找到这些规律,以了解猫的行为意图或心理活动。他们选择了 10 只缅因猫和 11 只英国短毛猫两个品种共二十一只猫,仔细记录下它们的性别、绝育情况。

喵喵叫数据集发布机构:米兰大学计算机系,包含数量:440 段音频,数据格式:wav,数据大小:20 MB,下载地址:https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/。数据集收录了它们三种环境状态下的叫声,分别是:被抚摸时、陌生环境、喂食前,并严格保证每只猫在三种环境中的各种变量。

比如在收录猫咪在陌生环境中的叫声前,会让主人陪伴猫咪在环境中共处至少 30 分钟,以免激发它们的情绪波动。在保证猫咪情绪稳定后,主人离开当前环境,收录猫咪独处的十分钟里的叫声。在数据收集过程中,还需要尽量减少房屋、家具装饰等对收音的影响,团队还测试了各种收音设备,包括宠物穿戴设备,确保收音质量。基于声音文件,研究团队提取了两组声学参数,即梅尔频率倒谱系数(MFCC)和时序特征。

用这些参数使用基于有向无环图等分类方案,将问题空间进行分类。研究团队共使用了五种分类方案:DAG-HMM(有向无环图-隐式马尔科夫)、class-specific HMMs, universal HMM、SVM 支持向量机和 ESN 回声状态网络(Echo State Network)五种分类方法。实验结果发现 DAG-HMM(有向无环图-隐式马尔科夫)的识别效果最佳。

DAG-HMM 对三种状态的分类识别效果,如下:结果显示 GAG-HMM 方法对三种状态的猫叫声,都有着很高的识别率。尤其对于等待喂食状态下的声音,有着 100% 的准确识别率。这一研究结果让团队大受鼓舞,实验证明了猫叫声是可以被有效分类的。他们计划下一步的研究将尝试结合猫咪的身体动作,建立分析模型,继续分析猫咪的情绪特征。读论文,下载数据集,就能理解猫?

论文访问 https://www.mdpi.com/2076-2615/9/8/543/htm 进行阅读,数据集访问 https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/ 注册后下载。我们在年初的一篇文章《铲屎官福音:汪星人和喵星人的小情绪,AI 可以识别了》介绍过目前市面上一些识别宠物情绪的技术和产品。

也提及,动物的表达体系十分复杂,声音只是其语言的一部分,绝大多数动物还会依靠肢体动作、气味甚至生物激素,进行彼此之间的交流。所以,要想搞懂它们的情绪,人工智能的确有办法。但是我们建议主人在养育过程中,多多用心关注小主子的表现与反应,更能体会到它们真实的情绪和需求噢~

UUID: 1ec0d2ec-6c45-4779-a34a-f20d4066819a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2021年/2021-06-24_米兰大学发布论文与猫咪叫声数据集,分类喵喵叫.txt

是否为广告: 否

处理费用: 0.0039 元