解读AI手语翻译机的技术硬核‘开云体育中国官网’

时间:2023-01-28 00:41

本文摘要:(公众号: )根据2019年3月世界卫生组织公布的最近数据,世界人口的5% (约4.66亿人)患有残疾性听力障碍。到2050年这个数据估计超过9亿。 与此同时,手语作为聋哑人被使用于多种语言,能正确理解手语的维修者寥寥无几。5月16日,腾讯优图实验室牵头深圳市信息无障碍研究会推出了“优图AI手语翻译机”。根据官方资料,用户可以通过面对翻译机的照相机展开手语传达,在翻译机的画面界面后,将手语慢慢切换成文字。

开云体育中国官网

(公众号: )根据2019年3月世界卫生组织公布的最近数据,世界人口的5% (约4.66亿人)患有残疾性听力障碍。到2050年这个数据估计超过9亿。

与此同时,手语作为聋哑人被使用于多种语言,能正确理解手语的维修者寥寥无几。5月16日,腾讯优图实验室牵头深圳市信息无障碍研究会推出了“优图AI手语翻译机”。根据官方资料,用户可以通过面对翻译机的照相机展开手语传达,在翻译机的画面界面后,将手语慢慢切换成文字。

根据公开发表资料,腾讯优图实验室创立于2012年,是腾讯的三大人工智能实验室之一。去年,腾讯优图实验室升级为腾讯计算机视觉研究开发中心。另外,与国际期刊《科学》进行协商战略合作,共享计算机视觉领域的资源和信息。手语识别技术并不是狙击多年来的任何技术发展一蹴而就,特别是近年来,优图AI手语翻译机也不是应用于手语的第一款产品,在此之前,手语识别技术已经发展了多年,国内的IT企业级科学研究大学也就此技术展开了研究微软公司的团队与中国科学院计算技术研究所合作,通过Kinect For Windows建立了手语识别软件,通过手语动作的追踪识别可以转换成普通人背诵的内容。

2018年2月,中科大宣布手语识别的论文收录在人工智能顶级学术会议AAAI 2018中。本论文明确提出了新的倒计时手语识别框架LS-HAN,需要时间分割。

开云体育中国官网

2018年3月,Magic Leap的头戴设备识别手语和文本的“官能眼镜”根据3月的新专利申请,说明了头戴设备检测和翻译手语的方法,说明了识别招牌和店面文字的方法。2018年7月,软件开发者Abhishek Singh展示了需要解读手语手势的MOD,通过相机的猎取和深入自学,在亚马逊Alexa输手势上建立了系统。

2018年12月,恋人奇艺开发的AI手语播音员在中国网络视频大会上出道,可以识别用户的声音并切换成文字,解读健听者的自然语言,使智能翻译成为手语传达。突破手语识别技术困境和传统的手语识别方法一般不对特定数据集设计合理的特征,而是利用这些特征开展动作和手势的分类。受人工特征设计和数据量的大小限制,这些方法非常受适应性、普遍性和鲁棒性的限制。

近年来,由于大数据和深度自学技术的巨大变革,人工智能算法的发展也水涨船高,特别是在计算机视觉、语音处理和自然语言处理等方面,帮助AI算法在许多应用和场景中构建落地,研究者开发了深度自学和数据驱动的算法但是,与大部分计算机问题不同,手语特有的地域性、复杂性和多样性给AI算法带来了玩耍性。不仅降低了数据收集和清除的成本,而且对该技术的落地没有相当大的挑战,无法实用化。

开云体育中国官网

现在,解决问题聋人交流问题的研究大多集中在把文字转换成手语。相反,将聋人的手语变成文字是没有办法的。根据公开发表资料,腾讯优图实验室手语识别数据集涵盖了近千句的日常传达,使用了900个常用词汇。

另外,优图AI手语翻译机需要构建句子整体的认识和翻译,用户传达的时候可以连贯地传达句子整体,不需要原作的特定完成或连接动作,需要在句子中故意中断或放慢速度。优图AI手语识别技术的构建方法根据官方资料,优图AI手语翻译机的核心技术是高度适合聋人手语传达的数据集和手语识别算法。关于AI手语翻译机的手语识别数据集、特征提取器等重要技术能力,根据官方资料整理,手语识别数据集现在AI手语翻译机的数据集涵盖了近千句的日常传达,是900个常用语。另外,收集数据集还考虑了手语传达的地域性和多样性,包括传达习惯和速度不同。

特征提取器融合了普通2D卷积网络和3D卷积网络的优点,通过2D卷积网络提取手语中的手势和身体姿势等静态信息,同时融合应用于视频的动态静态信息,从而实现完全的RGB比通过句子传递挖掘语言水平信息的该算法在动画帧和最后的输入之间追加了语言水平信息提取单元,语言水平信息提取单元利用长短网络充分考虑特征提取器提取的信息,融合动画中的相邻信息,实现语言水平的特征该单元需要算法在句子中更好地寻找词语传递的边界,提高各种地域性传递的总结能力。单句重复被充分考虑的句子中的上下文信息算法,在提取语言水平信息的基础上,综合考虑句子整体的上下文信息展开的基础上,不能输入最后的识别结果。

另外,为了提高用户使用中的允许,技术团队在手语识别之前追加了面部检测和动作检测两个模块,确认手语传达者的方位,在动作检测中判别用户是否展开了手语传达。优图AI手语翻译机的“剑走偏锋”现在AI手语识别技术受限于计算机性能、语料库丰富等因素的影响,但人工智能和图像识别技术备受瞩目,因此现在,不世出和商汤等国内独角兽企业、国内BAT、 智能语音技术提供给智能扬声器后,AI视觉技术能否提供类似的爆炸硬件产品,迄今为止引起更多关注的是参加者的大型智能照相机,腾讯优图这次发布的“优图AI手语翻译机”必然是关于能否给特殊人群带来现实,将现实应用于场景的用户有时会提示系统数据。

原创文章,发布许可禁令刊登。以下,听取刊登的心得。


本文关键词:解读,手语,翻译机,的,技术,硬核,‘,开云,体育,开云体育中国官网

本文来源:开云体育中国官网-www.szyjbc.com