咨询热线

400-007-6266

010-86223221

深度学习技术在语音识别与图像识别领域应用

 导读:深度学习技术在语音识别与图像识别领域应用。谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。

参考《2016-2022年中国人工智能市场专项调查及十三五投资前景预测报告

       1. 语音识别

       谷歌内部第一个部署深度神经网络的小组首先将深度学习引入语音识别领域,一开始的版本就把语音识别错误率降低了 30%,国内的科大讯飞将深度学习引入,语音识别错误率近几年明显降低。

       2. 图像识别

       2.1. 深度学习推动计算机图像识别率大幅提升

       ImageNet 图片库有 100 多万张图片,是计算机视觉领域最大的图片库,包含 1000 种不同分类,每一类有 1000 张图片。在深度神经网络使用之前,最好的识别错误率记录是 26%,2014年 Google 错误率降低到 6.66%取得冠军,到 2015 年错误率下降到 3.46%,甚至低于人类的错误率(人类花了 24 小时训练后错误率是 5.1%)。

       2.2. 计算机视觉已经成为最吸引投资的人工智能技术方向

       根据艾瑞咨询统计,目前在人工智能领域,超过一半的技术类企业投资是在计算机视觉方面。

       2.3. 深度学习推动多个领域图像识别广泛应用

       1、人脸识别领域:深度学习技术推动下,人脸识别可以实现任意脸部遮挡及视角下的实时检测,一次性克服了人脸检测中的几项难题:侧脸、半遮挡、模糊人脸,极大提升了各种现实情况中的人脸检出效果。同时可以识别性别、年龄、表情及多种脸部生理特征,不仅可以准确识别照片中人物的性别和年龄,也提供表情、颜值(美貌指数)、戴眼镜、化浓妆、涂口红、戴帽子、头发颜色、胡须样式等超过 40 种属性,平均准确率超过 90%,年龄预测平均误差小于 3 岁。

       2、视频监控领域:基于深度学习的行人检测算法能够在各类遮挡的情况下精确找出行人位臵,并能够进一步分析行人姿态和动作,可应用于交通监控、辅助驾驶、无人驾驶等。可以在行车场景、交通监控场景、卡口场景中检测多种不同角度的车辆,并同时给出车牌号码、汽车品牌、型号、颜色等物理特征。

       3、图像搜索、场景识别:可以实现语义驱动的互联网规模图像搜索及排序、拥有千类物体的集合上达到世界最高准确率的物体检测算法、可在上百类的室内外场景图像中识别显著场景元素,检测和识别在任何地点的任意文字。

       4、图像及视频编辑:通过深度学习可以实现实时超分辨率重构、实时降低图像压缩噪声、基于内容的图像质量评价方法得到最美观的图片等功能。

       5、移动互联网领域:利用深度学习技术,Faceu、微博相机、小米 MIUI 的人脸识别分类相册等移动互联网产品开始涌现。

资料来源:公开资料,中国报告网整理,转载请注明出处(ww)。

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

北美主导全球量子计算市场 政策推动下中国实现飞跃 应用尚处早期 行业前景可观

北美主导全球量子计算市场 政策推动下中国实现飞跃 应用尚处早期 行业前景可观

2019年,谷歌用53-Qubit的量子计算机证明了量子计算系统可以解决传统计算机无法处理或效率极低的问题,量子计算迎来元年。目前全球已有近 250 家企业布局量子计算产业,其中北美地区以43.86%的份额占据市场主导地位,代表企业包括微软、谷歌等,技术路线各异。从国内市场看,2003年,第一个量子计算研究小组成立,标

2025年06月06日
我国机器视觉行业活跃壮大 汽车、光伏等应用带来增量 国产国际竞争力待增强

我国机器视觉行业活跃壮大 汽车、光伏等应用带来增量 国产国际竞争力待增强

投融资市场持续火热、行业规模不断壮大,我国成全球机器视觉发展最活跃地区之一。从下游市场看,近年来,我国机器视觉市场增量主要来自汽车、半导体、医药和光伏四大领域。

2025年06月05日
我国机器人动力系统行业分析:政策频发+下游需求强劲推动 市场规模稳步扩大

我国机器人动力系统行业分析:政策频发+下游需求强劲推动 市场规模稳步扩大

作为衡量国家科技创新与产业竞争力的核心指标,机器人在促进产业升级、保障国家安全、服务民生健康等领域发挥战略性作用,已成为全球主要经济体抢占科技制高点的关键赛道。目前,我国已经将机器人产业列为战略重点,通过政策引导、研发投入及产业链协同推动技术突破与规模化部署,驱动机器人产业持续高速发展,进而带动我国机器人动力系统市场规

2025年06月03日
BC端共赴新蓝海 我国字库行业扩容 双寡头格局稳固 数字、个性、专业化趋势显著

BC端共赴新蓝海 我国字库行业扩容 双寡头格局稳固 数字、个性、专业化趋势显著

我国字库行业梯队化竞争格局明显。其中,汉仪字库、方正字库凭借优势的服务及丰富的行业经验,处于字库行业第一梯队,总市占率高达 75%。第二、三梯队企业规模较小,总市占率仅为25%,汉仪字库、方正字库双寡头地位稳固。

2025年05月31日
国产应用初显峥嵘 我国AI编程行业正迎来“百模大战” 产品仍有优化空间

国产应用初显峥嵘 我国AI编程行业正迎来“百模大战” 产品仍有优化空间

此外,AI编程产品仍有优化空间,主要体现在“技术+产品”方面。例如,技术方面,AI编程需要沿着强化学习Scaling的方向继续前进,进一步优化训练数据和算法,提高代码的准确性和可靠性;产品方面,面对垂直领域与复杂业务流程,AI编程工具需要更多结合行业与工作流know-how。

2025年05月30日
中国高速视觉行业增速快于全球 外企占主导 中科视界突围 美国出口管制下国产替代强化

中国高速视觉行业增速快于全球 外企占主导 中科视界突围 美国出口管制下国产替代强化

高速视觉行业进入中国仅20年的时间,属于具有代表性的战略新兴产业,由于存在技术壁垒,头部企业主要为海外品牌,国内企业多通过与国际高速摄像机龙头建立合作关系,成为其承销商来进入市场,具备自主研发能力的企业较少,包括中科视界、深视智能等。其中,中科视界近年发展迅猛,已成为高速视觉领域头部企业。

2025年05月25日
我国电脑操作系统行业:国产厂商正崭露头角 鸿蒙系统填补技术空白实现自主可控

我国电脑操作系统行业:国产厂商正崭露头角 鸿蒙系统填补技术空白实现自主可控

目前我国已有一批优秀的国产操作系统成功实现自主研发与生产,并逐步进入规模化应用阶段,且相关产品的安全性、稳定性均已实现跨越式发展,正加速从“能用”迈向“好用”,打破了海外厂商垄断格局。据流量监测公司StatCounter统计显示,Windows操作系统在中国的市场占有率已从2020年的87.09%下滑至2023年的80

2025年05月23日
我国网络安全硬件行业规模达百亿级 产品更新需求下头部优势企业将占据更多份额

我国网络安全硬件行业规模达百亿级 产品更新需求下头部优势企业将占据更多份额

近年来,我国对网络安全的重视程度不断提升,推动了网络安全行业的快速发展。作为保障网络安全的重要基石,网络安全硬件也迎来增长机遇,市场规模达百亿级。全球经济下行带来新安全需求,我国网络安全硬件开始与更多的新技术如AI、云计算、大数据等相结合,持续推出新产品以提高网络安全防护的效率和准确性。目前来看,下一代AI防火墙、零信

2025年05月22日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部