来源:搜你想要的 点击数: 时间:03-20
【科技前沿】我科学家研发出可穿戴人工喉
还原准确率超90%
【科技前沿】
本报北京3月18日电(记者邓晖)一枚硬币大小的石墨烯片,贴在颈部靠近喉咙处,就能帮助发音障碍者获得新“声”。近日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声相关信号,并通过人工智能模型将其识别和合成为语音,还原准确率超过90%。
这一研究结果为语音识别与交互系统提供了一条新的技术途径,并于近日在线发表在《自然》人工智能子刊《自然·机器智能》上。
语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。一直以来,研究人员在致力改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积,而可穿戴设备能够获取高质量的原始语音或其他生理信号。然而,目前尚无充分的证据表明喉部肌肉的运动模式和反映在体表的发声器官振动中隐含着可识别的语音特征,且尚无实验证明其作为语音识别技术的完备性。
为解决这一问题,任天令团队成员开发了一款基于石墨烯的智能可穿戴人工喉,同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度,同时也具有抗噪声的语音感知能力。对声学信号和机械运动的混合模态的感知使人工喉能够获得更低的语音基频信号。此外,该器件还可以通过热声效应实现声音的播放功能。人工喉的制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台。
团队还利用人工智能模型对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。
实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。同时人工喉的抗噪声性能明显优于麦克风,在60分贝以上环境噪声下仍能保持识别能力。任天令研究团队进一步演示了它的语音交互式应用:通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词语,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。
任天令介绍,该人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。研究团队希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的用户。
广告推介
最新发布
- 门事件全集、门事件视频 历年来门事件汇总(共47个)
- 卉卉女王教你如何正确打飞机,更新更多视频
- 2018水仙二嫂与滴滴司机35分钟完整版车震视频 水仙二嫂啪啪BT下载
- 的疯了“借贷宝”成批量的女生裸照、视频,泄露
- [Ugirls尤果网]第U092期 尤果网王凌宇
- [MiiTao蜜桃社] 2016.08.09 VOL.024 李梦婷
- 南宁护士门事件曝光 护士大尺度视频下载
- 搜你想搜磁力下载工具最强最全
- 冠禽兽啊!贵州老师强暴12名女生被捕 最小者仅12岁
- 台湾43岁不老妖女史姗妮
图文信息
最新视频
- 守护一泓清水 科学回收废旧农膜“变废为宝”_2
- 创意设计赋能北疆发展 黑龙江投重金“引凤栖”_1
- 全球水资源经济委员会发布报告:到2030年淡水供应短缺将达40%
- 经济日报头版头条聚焦:去年高新技术企业突破两万家,湖北持续优化科技创新生态
- “预言”自己将被捕后特朗普现身,露面摔跤锦标赛挥拳示意_1
- 家庭药品过期了怎么办?广药集团已坚持免费回收20年
热门事件
- 中关村生命科学园被认定为大家海外人才离岸创新创业基地
- 低租金红利不再,大卖场模式难走通!沃尔玛撤离北京CBD,靠山姆能行?
- 综述:日本专家认为美欧紧缩货币政策埋下金融隐患_1
- “天外”飞仙 国风璀璨
- 俞敏洪:不要因为友情背叛对交朋友失去信心,不要因为错误决策对自身失去信心_1
- 年内首次降准落地!释放长期资金逾5000亿元 对股市楼市形成支撑