导读:深度学习技术在语音识别与图像识别领域应用。谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。
参考《2016-2022年中国人工智能市场专项调查及十三五投资前景预测报告》
1. 语音识别
谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。
2. 图像识别
2.1. 深度学习推动计算机图像识别率大幅提升
ImageNet 图片库有 100 多万张图片,是计算机视觉领域最大的图片库,包含 1000 种不同分类,每一类有 1000 张图片。在深度神经网络使用之前,最好的识别错误率记录是 26%,2014年 Google 错误率降低到 6.66%取得冠军,到 2015 年错误率下降到 3.46%,甚至低于人类的错误率(人类花了 24 小时训练后错误率是 5.1%)。
2.2. 计算机视觉已经成为最吸引投资的人工智能技术方向
根据艾瑞咨询统计,目前在人工智能领域,超过一半的技术类企业投资是在计算机视觉方面。
2.3. 深度学习推动多个领域图像识别广泛应用
1、人脸识别领域:深度学习技术推动下,人脸识别可以实现任意脸部遮挡及视角下的实时检测,一次性克服了人脸检测中的几项难题:侧脸、半遮挡、模糊人脸,极大提升了各种现实情况中的人脸检出效果。同时可以识别性别、年龄、表情及多种脸部生理特征,不仅可以准确识别照片中人物的性别和年龄,也提供表情、颜值(美貌指数)、戴眼镜、化浓妆、涂口红、戴帽子、头发颜色、胡须样式等超过 40 种属性,平均准确率超过 90%,年龄预测平均误差小于 3 岁。
2、视频监控领域:基于深度学习的行人检测算法能够在各类遮挡的情况下精确找出行人位臵,并能够进一步分析行人姿态和动作,可应用于交通监控、辅助驾驶、无人驾驶等。可以在行车场景、交通监控场景、卡口场景中检测多种不同角度的车辆,并同时给出车牌号码、汽车品牌、型号、颜色等物理特征。
3、图像搜索、场景识别:可以实现语义驱动的互联网规模图像搜索及排序、拥有千类物体的集合上达到世界最高准确率的物体检测算法、可在上百类的室内外场景图像中识别显著场景元素,检测和识别在任何地点的任意文字。
4、图像及视频编辑:通过深度学习可以实现实时超分辨率重构、实时降低图像压缩噪声、基于内容的图像质量评价方法得到最美观的图片等功能。
5、移动互联网领域:利用深度学习技术,Faceu、微博相机、小米 MIUI 的人脸识别分类相册等移动互联网产品开始涌现。
资料来源:公开资料,中国报告网整理,转载请注明出处(ww)。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。