技术巨头希望用无障碍技术改变世界,腾讯和Facebook都使用了AI技术
浏览:37 时间:2024-1-6

科技改变生活将贯穿技术发展的全过程。不同的技术会给生活带来不同程度的变化,不同的群体会同时感受到不同的变化。今天,很多人都期待着VR和AR技术带来的不同视觉体验以及AI技术带来的便利生活。但对于一些特殊的人来说,由于他们所听到的障碍,他们还有很长的路要走技术。

然而,国内外的技术巨头正试图通过无障碍技术改变他们的世界。更令人兴奋的是,腾讯和Facebook已经使用过AI技术。会有什么不同?

科技巨头们跨越两个时代的无障碍科技

PC的普及改变了我们获取信息,工作和生活的方式,之后手机成为人们生活中不可或缺的一部分。作为世界上使用最广泛的PC操作系统,微软已经为人们增加了许多辅助功能,如视觉,色彩识别,听觉,识字等,主要是为了支持键盘交互和屏幕阅读器。支持用户自定义,如文本,缩放设置,颜色和高对比度,并为UI的某些部分提供替换选项或备用选项。

在最新的操作系统Windows10中,微软为视障人士提供屏幕阅读器,高对比度主题,放大器等;听障人士可以使用字幕来了解试听媒体内容;行动不便的人可以通过语音识别技术解决问题。在经验方面,从微软展示的视频来看,屏幕上屏幕内容的描述速度对于视力不佳的用户来说可能稍微快一点,对于没有视力障碍的人来说,这可能有些简单。

在移动互联网时代,Android和iOS占据了市场主导地位,因此Google和Apple都为其系统增加了辅助功能。 Android的辅助功能包括一个屏幕阅读器,通过引人注目的语音反馈与设备进行交互;还有显示更改,包括字体大小,放大倍率,显示对比度和颜色;交互式控件使用语音打开应用程序并导航和修改文本;您还可以通过蓝牙将可刷新的盲文显示器连接到您的Android设备;您还可以为Android设备启用字幕和字幕。当然,基于原生Android系统的可访问性功能,手机制造商和OEM也可以在可访问性方面进行改进和创新。

有趣的是,iPhone上的可访问性功能已被广泛使用。由于iPhone Home按钮的早期故障,许多iPhone用户已经在辅助功能中启用了AssistiveTouch,这实际上是由Apple为身体残疾人士和Apple的许多辅助功能之一设计的。根据雷锋网的说法,苹果公司将残障人士添加到iOS系统的能力可以追溯到2009年iPhone 3GS的颜色逆转。后来,该系统增加了屏幕阅读技术VoiceOver,放大镜等专门开发的功能。视障者。 。今天的iOS系统为视力,听力,身体和移动技能以及学习和识字技能受损的人增加了辅助功能。

我们知道Apple在PC和移动设备上都取得了不错的成绩,因此除iOS系统外,Apple PC使用的MacOS系统还包括屏幕和光标变焦,全功能屏幕阅读器,可视闪烁提醒和隐藏式字幕支持。和其他辅助功能。值得一提的是,除了软件设计之外,Apple还在iPhone7和Apple Watch中构建了一个Taptic引擎,通过振动为用户提供触觉反馈。这种设计与Watch OS 3.0相结合,可以为视障用户提供时间。

社交巨头融合AI的无障碍技术

可以看出,微软,谷歌和苹果已经为自己的系统增加了辅助功能,因此只有一小部分人的残疾人可以享受技术带来的便利。这些系统中的无障碍技术有许多相似之处。这些地方也存在一些差异,经验也存在差异。

当然,只有系统级可访问性技术远远不够。想要获得更好体验的不同应用程序需要更具针对性的可访问性技术。值得注意的是,雷锋网发现美国科技巨头Facebook和中国社交巨头腾讯是第一批将人工智能技术融入可访问性技术的公司。

在创建可访问环境的过程中,Facebook不仅兼容应用程序中不同系统的可访问性,还将反馈集成到AI系统中,以便有视力障碍的人可以“阅读”照片内容。 Facebook希望使用自己的自动Alt-Text(AAT)技术,让屏幕阅读器用户能够理解新闻提要中的大部分或全部图像内容。

国内社交巨头腾讯也正在使用人工智能技术帮助视障用户“看到图片”并摆脱他们的社交障碍。据悉,在QQ空间独立版7.7安卓版的新功能中,其中一款采用AI技术描述图片并自动读取。具体地,使用Android系统的视障用户可以点击QQ空间APP中的图片,阅读屏幕软件将读出AI生成的图片描述。借助技术,可以“看到”网民共享的图片并深入参与。在社交场景中。

QQ空间无障碍版“ldquo;图片语音即时描述功能”

雷锋网(公众号:雷锋)了解到,具有上述功能的QQ空间APP融合了腾讯AI实验室的图像描述生成技术。该技术是由腾讯AI实验室开发的自主开发的强化学习算法。 COCO在这一类挑战中排名第一,超越了微软和谷歌等公司。

也许在没有视障人士的情况下,这种技术还不够“黑技术”,但从学术研究的角度来看,图像描述生成的研究不仅需要理解图像,还需要理解自然语言。这是一门跨学科的跨学科跨学科研究,也是深度神经网络学习能力扩展到多个数据领域的重要探索。

腾讯AI实验室开发了一种新的强化学习算法,以进一步改善图像描述(如图所示)生成的模型能力,相应的图像描述生成模型和编码器 - 解码器框架。同时,介绍了关注机制。在解码过程中,AI Lab创新地使用了多阶段注意机制。除了引入多阶段注意机制外,AI Lab开发的强化学习算法还可以进一步提高构建网络模型的训练效果。对于这个无关紧要的问题,AI Lab使用强化学习算法来训练网络模型以优化这些指标。

图片字幕

除了图片描述外,QQ还与Utu团队合作推出了OCR图像文本提取功能。具体来说,只需打开手机QQ,长按对话框中的图片即可选择< ;;提取图片中的文字”,或点击“ldquo;清扫”在文字提取中,你可以把图片智能识别文字内容变成可编辑的文字,这使得视障用户很容易在朋友发送的图片上提取文字。同时,OCR图像文本提取功能可以实现多场景应用登陆,帮助视障用户阅读书籍,食品,药品手册等。

OCR图像文本提取功能背后是U-Lab世界领先的深度学习技术,可以识别任何版面的整个文本,包括1000个中英文标签,字母,数字,标点符号等。数十种字体符合阅读和生活中大多数场景的识字需求。

手机QQ OCR识别功能

随着人工智能技术的赐福,视障用户的社交难点正在得到解决。一位视障用户经历过QQ空间,在说出“说”文字说明后自动识别图片:“医疗不能让我们恢复,但也许技术可以。另外,由于屏幕阅读软件将QQ表达式读作空信息,湖南视障用户会感到困扰。为此,手机QQ开发了表达阅读功能,不仅可以与外界顺畅交流,还可以用表情表达自己的内心思想。 。雷锋认为,有了人工智能技术的祝福,QQ将来能够更生动地阅读更多表情符号,让视障人士可以更好地使用表情符号。

QQ表情符号阅读

用无障碍技术改变世界

腾讯使用人工智能技术让更多视障用户更具社交性。事实上,早在2009年,腾讯就开始关注视障用户的使用,推动了PC无障碍技术的转型,使QQ成为中国最盲目的群体。主要的在线社交平台。 2013年,移动QQ是中国第一个支持辅助功能的APP。 2014年1月,腾讯慈善基金会和促进信息无障碍的非政府组织组成了“视障人士信息无障碍工程师”团队。

2017年,手机QQ共有1934个辅助功能,并在技术上推出了OCR图像文字提取功能,QQ表情阅读,Android平台安全支付,声纹加友,有效识别多个链接等辅助功能。 2018年3月,在中国残疾人联合会,中国盲人协会和中国互联网协会信息无障碍委员会的支持下,QQ空间推出了“无障碍人工智能技术”,通过“多媒体”向公众开放人工智能平台“。在小型程序“可访问性AI”上,第一批开放式OC技术包括OCR文本识别,语音合成和图片到语音。

目前,腾讯的大部分QQ,QQ空间,微信,腾讯,腾讯,Appbao,企鹅FM等产品都经过专门针对残障用户进行了优化。值得一提的是,QQ和QQ空间相关功能在2018年已经使用了1.6亿多次,并已成为国内视障人群最重要的在线社交平台。

腾讯在该领域的持续承诺也得到了认可。 2018年12月3日,法国联合国教育,科学及文化组织(UNESCO)在巴黎颁发了“数字技术提升残疾人权利奖”。促进残疾人包容性发展的个人和组织,通过数字技术为创造合理便利的残疾人生活条件作出杰出贡献。值得注意的是,腾讯是亚洲第一家屡获殊荣的组织,也是全球首家屡获殊荣的公司。

雷锋网小结

残疾人数仅占全球人口的一小部分,但我们很高兴看到主导PC时代的Windows系统以及主导移动时代的Android和iOS都为残障人士增加了辅助功能和社交巨头腾讯和Facebook更是一致这是第一个将AI技术应用于自己的产品,增强残疾人体验,打破社会障碍,让每个人都能感受到改变生活的技术这是技术巨头用技术改变世界的举动。

现在,我们不仅看到越来越多的公司产品开始加入残疾人的设计,而且早在2009年就看到腾讯开始关注视障用户,并希望通过最终产品满足每个人的社交需求经验。这项努力也得到了教科文组织的认可。

本文由雷锋转移。如果您需要转载,请在雷锋网上申请授权。