咨询热线

400-007-6266

010-86223221

深度学习技术在语音识别与图像识别领域应用

 导读:深度学习技术在语音识别与图像识别领域应用。谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。

参考《2016-2022年中国人工智能市场专项调查及十三五投资前景预测报告

       1. 语音识别

       谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。

       2. 图像识别

       2.1. 深度学习推动计算机图像识别率大幅提升

       ImageNet 图片库有 100 多万张图片,是计算机视觉领域最大的图片库,包含 1000 种不同分类,每一类有 1000 张图片。在深度神经网络使用之前,最好的识别错误率记录是 26%,2014年 Google 错误率降低到 6.66%取得冠军,到 2015 年错误率下降到 3.46%,甚至低于人类的错误率(人类花了 24 小时训练后错误率是 5.1%)。

       2.2. 计算机视觉已经成为最吸引投资的人工智能技术方向

       根据艾瑞咨询统计,目前在人工智能领域,超过一半的技术类企业投资是在计算机视觉方面。

       2.3. 深度学习推动多个领域图像识别广泛应用

       1、人脸识别领域:深度学习技术推动下,人脸识别可以实现任意脸部遮挡及视角下的实时检测,一次性克服了人脸检测中的几项难题:侧脸、半遮挡、模糊人脸,极大提升了各种现实情况中的人脸检出效果。同时可以识别性别、年龄、表情及多种脸部生理特征,不仅可以准确识别照片中人物的性别和年龄,也提供表情、颜值(美貌指数)、戴眼镜、化浓妆、涂口红、戴帽子、头发颜色、胡须样式等超过 40 种属性,平均准确率超过 90%,年龄预测平均误差小于 3 岁。

       2、视频监控领域:基于深度学习的行人检测算法能够在各类遮挡的情况下精确找出行人位臵,并能够进一步分析行人姿态和动作,可应用于交通监控、辅助驾驶、无人驾驶等。可以在行车场景、交通监控场景、卡口场景中检测多种不同角度的车辆,并同时给出车牌号码、汽车品牌、型号、颜色等物理特征。

       3、图像搜索、场景识别:可以实现语义驱动的互联网规模图像搜索及排序、拥有千类物体的集合上达到世界最高准确率的物体检测算法、可在上百类的室内外场景图像中识别显著场景元素,检测和识别在任何地点的任意文字。

       4、图像及视频编辑:通过深度学习可以实现实时超分辨率重构、实时降低图像压缩噪声、基于内容的图像质量评价方法得到最美观的图片等功能。

       5、移动互联网领域:利用深度学习技术,Faceu、微博相机、小米 MIUI 的人脸识别分类相册等移动互联网产品开始涌现。

资料来源:公开资料,中国报告网整理,转载请注明出处(ww)。

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

数据标注产业爆发在即:政策规范引领、大模型需求激增、企业持续创新协同发力

数据标注产业爆发在即:政策规范引领、大模型需求激增、企业持续创新协同发力

我国是数据资源大国,但不是数据资源强国。2023年,我国数据资源32ZB(泽字节),保存数据仅有2.9%,2024年,我国数据留存率提升至5.1%,但仍远低于发达国家水平。数据质量低,大量数据被浪费,成为制约我国数据资源价值发挥的瓶颈。

2026年03月15日
政策加码、技术突破、需求共振 我国卫星通信行业进入规模化发展关键提速期

政策加码、技术突破、需求共振 我国卫星通信行业进入规模化发展关键提速期

需求端的持续爆发,是卫星通信行业拐点到来的核心支撑。运营商全面入局与应用场景持续拓展形成双重合力,正推动行业市场从“政策驱动”向“需求驱动”加速转型,开启规模化发展新阶段。

2026年03月11日
我国游戏行业出海深度观察:AI与品牌化共筑海外下半场 休闲品类崛起

我国游戏行业出海深度观察:AI与品牌化共筑海外下半场 休闲品类崛起

然而,自2025年以来,行业回暖态势日益显著。这种回暖在资本市场上体现得尤为明显:截至2026年2月5日,万得网络游戏指数自2025年初以来累计涨幅已接近50%,并在2026年1月一度创下2017年7月以来的阶段性新高。

2026年03月05日
模型迭代与需求共振 全球AI视频生成行业商业化落地加速 B端将迎场景深化与格局重构

模型迭代与需求共振 全球AI视频生成行业商业化落地加速 B端将迎场景深化与格局重构

2022年,Diffusion与Transformer的融合思路逐步成型;2024年OpenAI发布Sora,进一步验证了DiT架构在视频生成中的可行性与优势,推动行业迎来关键转折点。目前,字节、Google、腾讯等主流厂商及各类开源项目均向DiT框架迁移,虽各家主干技术仍有差异,但均属DiT架构内的迭代优化,AI视频

2026年03月05日
从千亿规模到百亿订单:我国算力租赁行业供需矛盾突出 企业投资热情高涨

从千亿规模到百亿订单:我国算力租赁行业供需矛盾突出 企业投资热情高涨

根据数据,2020-2024年我国通用算力规模从39.6EFLOPS增至71.5EFLOPS,预计2028年达140.1EFLOPS,2020-2028年年均复合增长率约17.11%;而智能算力增长更为迅猛,同期从75.0EFLOPS激增至725.3EFLOPS,预计2028年扩至2781.9EFLOPS,期间年均复合

2026年02月26日
智能算力高增驱动 我国算力服务器电源行业迎发展机遇 国产厂商竞逐蓝海

智能算力高增驱动 我国算力服务器电源行业迎发展机遇 国产厂商竞逐蓝海

算力服务器电源是算力基础设施的重要组成部分,我国已形成脉络清晰的产业链体系。在AI产业快速发展、算力规模持续扩容,尤其是智能算力高速增长的背景下,算力服务器市场需求攀升,而这也为算力服务器电源行业带来重大发展机遇与广阔市场空间。其中高性能品类增速尤为显著,预计其将成为行业增长的重要动力。目前国内厂商正积极布局,行业竞争

2026年02月05日
全球视角下中国工业软件行业:增速凸显、结构分化 AI引领国产软件发展新征程

全球视角下中国工业软件行业:增速凸显、结构分化 AI引领国产软件发展新征程

近年来,受益于工业产业升级,中国工业软件市场规模增速显著高于全球整体增速。2019-2025年全球工业软件市场规模由4107亿美元增长至5490亿美元,期间CAGR为5.0%。2019-2025年中国工业软件市场规模由1720亿元增长至3390亿元,期间CAGR为12.0%。

2026年02月03日
全球AI加速卡市场迎来爆发式增长:中国为主要驱动力 英伟达稳居龙头地位

全球AI加速卡市场迎来爆发式增长:中国为主要驱动力 英伟达稳居龙头地位

当前在人工智能技术迭代与商业化应用加速落地的双重驱动下,全球AI加速卡市场正迎来爆发式增长。数据显示,2024年全球AI加速卡以收入计的市场规模约为1190.28亿美元,同比增长144%。预计2028年全球AI加速卡市场规模将达到5257.70亿美元,2024-2028年期间CAGR为44.97%。

2026年01月30日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部