AI“读唇术”,靠什么让“失语者”重新“开口”?
[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的
原创
2020-04-06 07:30:49
来源:钉科技  

[钉科技编译]不出声,仅仅通过喉咙和下颚的皮肤震动就能知道想说什么。说道这,首先想到的可能是“古老的读唇术”。现在,人工智能可能会让这门显得颇神秘的“技艺”被更多人掌握。

之前,有科研人员研发AI唇语识别:运用机器视觉技术从视频中识别出说话人的人脸,提取此人连续说话时口型变化的特征。通过机器视觉识别,不用听声音,仅靠识别说话人的唇部动作,解读说话者所说的内容。近日,不同于运用机器视觉技术识别说话人的唇部动作的的技术,一种仅靠检测喉咙运动的“读唇术”据说也被研发出来了。

图片 1.png

据《itmedia》网站消息,近日,东京大学和索尼计算机科学研究所共同研发出的AI系统“Derma”,通过将传感器贴合在喉咙周围的皮肤上,就能成功实现从口形(无声说话)到语音的转化。

研究灵感最初来源于视听障碍者的触诊唇读法,他们会用手指触摸说话者的嘴唇和下巴周围,以此读取说话内容。也就是说,他们通过触摸障碍者嘴唇周围的皮肤得知他们的说话内容。

AI系统“Derma”应用时,在下颚皮肤的两个位置安装加速度计和角速度传感器,辅之机器学习,通过随着说话发生的下颚运动和舌肌运动引起的从下颚到喉咙的皮肤颤动,进行无声“语音识别”。(钉科技编译,消息来源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
openEuler系累计装机量突破1000万,树立操作系统产业新里程碑
2
新一代发光材料F1“全面领先”,维信诺开启OLED屏幕的“黄金时代”
3
九号公司就300元买电摩事件发布解决方案:每用户ID兑现1单
4
提升中国显示技术话语权 海信连任激光显示国际标准工作组召集人
5
“新风”吹向中国汽车,新力量雄起!
6
加速千级分区电视普及,康佳推出真镜 Mini AI-LED R8s电视新品
7
极米科技获国内知名汽车主机厂定点通知 车载布局成果显现
8
2024年手机市场最大黑马?小屏旗舰才不是没人要
9
统一链接平台来了!打破壁垒,支持跨设备、跨系统分享应用!
10
旧瓶装新酒 智能手机带火无网通信?
11
人形“智能”大热,何时能够加入我们的生活?
12
最亮的星,国家补贴叠加双十一助力家电行业销量创新高
13
“国补”遇上双十一 “价格打到怀疑人生”?
14
联想手机创十年来最高份额 小折叠占有率全球第一
15
你围观和支持谁!雷军、余承东今天同登场:小米、华为引爆广州车展
16
足不出户“登月”,进入游戏世界:赋能创作者,索尼又有新方案
17
Q3厨电业绩分化背后:消费热点从集成到分体,流行风向回归了?
18
发布显示和护眼两大创新成果 维信诺携手合作伙伴做强中国屏
19
Canalys:第三季度OPPO首超三星,领跑东南亚智能手机市场
20
2024年10月家电市场总结(线上篇)
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512