行业资讯

科学家研发人工智能声纳眼镜:识别唇语准确率95%
发布者:鸿腾智能科技(江苏)有限公司 发布时间:2023-04-10 13:06:12 点击次数:650 关闭
4月10日,美国康奈尔大学科学家研发出一种新技术,可以通过声纳眼镜进行无声交流。眼镜使用小型扬声器和麦克风来无声地读取佩戴者所说的话,使他们能够在不需要物理输入的情况下执行各种任务。
该技术由康奈尔大学博士领导。RuidongZhang对使用无线耳机的类似项目进行了改进,而之前的型号则依赖于摄像头。

SonarGlasses使用称为EchoSpeech的无声语音识别接口,它使用声纳感应嘴巴运动,同时使用深度学习算法实时分析回声特征。这使得系统能够以大约95%的准确度识别佩戴者默说的单词。
这项技术最令人兴奋的前景之一是,它可以用来将对话无声地输入语音合成器,以供有语言障碍的人使用,然后他们可以大声说出这些话。该眼镜还可用于在安静的图书馆中控制音乐播放,或在嘈杂的音乐会上口述信息。
该技术体积小、功耗低,而且会侵犯隐私,因为没有数据会离开用户的手机。这样,就没有隐私问题。该眼镜佩戴起来非常舒适,并且比现有的其他无声语音识别技术更实用、更可行。
研究人员表示,该系统只需要几分钟的训练数据就可以学习用户的语音模式。学习完成后,它可以向用户的面部发送和接收声波,感知嘴巴运动,并使用深度学习算法进行分析。echoproperties..系统目前能够识别31个孤立的命令和一串连续的数字,错误率小于10%。
该系统的当前版本可提供大约10小时的电池续航时间,并可通过蓝牙与用户的智能手机进行无线通信。智能手机处理和预测所有数据,并将结果传输到一些“操作键”,使其能够播放音乐、与智能设备交互或激活语音助手。
康奈尔未来交互智能计算机接口(SciFi)实验室正在使用康奈尔资助计划来探索将该技术商业化的可能性。
商务咨询 商务咨询
关于我们 产品展示 广告设计 客户案例 技术支持 联系我们

电话:0511-86930535(工作日)

手机:177-6865-8888(微信同号)

手机:137-7550-8287(微信同号)

零售:137-7550-7308(微信同号)