深度学习技术在语音识别与图像识别领域应用

2016-10-17 08:54

手机浏览

导读：深度学习技术在语音识别与图像识别领域应用。谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域，一开始的版本就把语音识别错误率降低了 30%，国内的科大讯飞将深度学习引入，语音识别错误率近几年明显降低。

参考《2016-2022年中国人工智能市场专项调查及十三五投资前景预测报告》

1. 语音识别

谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域，一开始的版本就把语音识别错误率降低了 30%，国内的科大讯飞将深度学习引入，语音识别错误率近几年明显降低。

2．图像识别

2.1. 深度学习推动计算机图像识别率大幅提升

ImageNet 图片库有 100 多万张图片，是计算机视觉领域最大的图片库，包含 1000 种不同分类，每一类有 1000 张图片。在深度神经网络使用之前，最好的识别错误率记录是 26%，2014年 Google 错误率降低到 6.66%取得冠军，到 2015 年错误率下降到 3.46%，甚至低于人类的错误率（人类花了 24 小时训练后错误率是 5.1%）。

2.2. 计算机视觉已经成为最吸引投资的人工智能技术方向

根据艾瑞咨询统计，目前在人工智能领域，超过一半的技术类企业投资是在计算机视觉方面。

2.3. 深度学习推动多个领域图像识别广泛应用

1、人脸识别领域：深度学习技术推动下，人脸识别可以实现任意脸部遮挡及视角下的实时检测，一次性克服了人脸检测中的几项难题：侧脸、半遮挡、模糊人脸，极大提升了各种现实情况中的人脸检出效果。同时可以识别性别、年龄、表情及多种脸部生理特征，不仅可以准确识别照片中人物的性别和年龄，也提供表情、颜值（美貌指数）、戴眼镜、化浓妆、涂口红、戴帽子、头发颜色、胡须样式等超过 40 种属性，平均准确率超过 90%，年龄预测平均误差小于 3 岁。