咨询热线

400-007-6266

010-86223221

智能语音优势及威胁分析:核心及辅助技术升级 本土企业研发水平有待提高

       智能语音行业是以语音为研究对象,对语音语义进行识别、理解以及生成,使机器具备自然语言处理能力,并且利用其核心技术赋予机器“听觉”、“理解能力”以及“语言能力”。 智能语音技术涉及多类型个学科,其核心技术包括语音合成、语音识别、声纹识别、自然语言理解、语音去噪等关键技术。

智能语音技术分类

智能语音技术分类

简介

语音合成

语音合成技术是通过计算机将外部输入的文字信息转变成自然流畅的语言,赋予机器“讲话”的能力。语音合成技术覆盖声学、语言学、数字信号处理、计算机科学等多个学科。语音合成技术的实现过程主要分为文本分析和语音合成两个步骤。文本分析是基于语言学原理,将文本标准化,将原始文本中的数字、缩略语等转换为对应的标准词,然后进行语言处理。在文本分析的过程中,系统将为每一个字词赋予单独的语音脚本,并依据规则对文本进行分割标记,将文字序列转换成音韵序列。语音合成技术通过不同的算法,将音韵序列生成语音波形,合成高质量的语音流输出。

语音识别

语音识别技术是将人类语音中的词汇内容转换成计算机可以处理的输入内容的技术。语音识别技术通过将用户输入的指令进行特征提取,形成特征数据流,然后与系统中已有的语音模型进行比对,寻找系统中最为接近的语音内容。实现语音识别的过程主要分为四步:(1)选择识别单元,即确定选择识别的对象,然后根据识别对象的语音特点、词汇量大小等条件确定识别对象为单词、音节或音素;(2)提取特征参数,从语音波形中提取出重要的反应语音特征的相关信息;(3)建立声学模型和语言模型,进行训练和识别;(4)是后期的处理,包括音字转换、词法、句法和文法的处理等。

声纹识别

声纹识别技术是基于声纹信息识别人类身份的生物特征识别技术。声纹识别技术通过提取发声者独有的声门开合频率、口腔大小形状及声道长度等声学特征,进而识别出发声者的身份。声纹识别技术的作用主要包括两方面:(1)发声者辨认,主要用于在从某一语音材料的若干发声者中寻找指定发声者;(2)发声者确认,主要用于确认某一语料是否由指定发声者发出。声纹识别技术实现原理和语音识别技术原理类似,但声纹技术识别主要是对其发声者身份的进行判断,因此实现过程相较于语音识别更简单。未来,声纹识别技术的主要发展方向为降低发声者身体状况、说话的方式、录音信道及环境噪音对声纹信息的干扰,提高声纹信息技术在干扰因素下的识别准确度。

自然语言理解

自然语言理解技术是通过利用处理语言技术,使计算机理解人类语言的含义,并通过对话的方式回答用户提出的问题。自然语音理解技术指将表达语音的一种方式映射为计算机能理解的表达方式,其使用原理是根据上下文辨识一个多义词在指定句子中的确切意义,并根据句子的结构和词义推导该句子的句义。未来,自然语音理解技术将引入部分规则机制,利用规则和统计结合的方式弥补计算机对系统语言理解的不足。同时自然语言理解技术将开放学习机制,修正统计数据,弥补语料统计数据的局限性。

语音去噪

语音去噪技术通过控制语音通信过程中的语音质量,提高系统对于语音理解的准确性,缓解噪音污染对于语音收录影响。在语音通信的过程中,实现波束形成、回声消除和噪声抑制都需要复杂的算法和大量的信号处理,回声消除算法是目前语音去噪技术较常用的算法类型。有效的回声消除算法需要持续的在一颗DSP芯片上运行,但有限的DSP芯片资源有限将影响数据传输的高效性和实时性,影响语音处理算法的算力以及语音处理系统的性能。语音去噪技术的成熟度是提高语音识别系统性能的保障。未来,语音去噪技术将不断提高与实际环境使用的结合度,减少噪音干扰对语音语义识别的影响。

数据来源:公开资料整理

       根据数据显示,2018年,我国智能语音行业市场规模为157.9亿元,较上年同比增长56.6%;2019年,我国智能语音行业市场规模为**亿元,较上年同比增长**%。

2015-2019年我国智能语音行业市场规模及增速
 
数据来源:公开资料整理

       一、 优势分析

       (1)智能语音核心技术升级发展:语音合成技术方面,在语音合成技术中最具代表性的语音合成方法为HMM模型,可以在不受人工干预的情况下,构建较小尺寸的合成系统,适合应用于嵌入式设备。近年来,语音合成技术的发展已接近自然人的发音水平,并从单一广播风格发展至拥有语调、情绪的程度。语音合成技术的发展为智能语音在车载导航、移动终端等设备的应用奠定基础。

       语音识别技术方面,我国语音识别技术发展较快,其发展水平已实现与国外同步。语音识别技术的发展推动了语音听写技术在医疗、报社、银行、电信等领域的应用,同时推动嵌入式识别系统进入智能终端领域。伴随以语言学为基础的文法模型的转变,语音识别技术可以保证计算机更好的理解自然语言。并且人工神经网络技术在语音识别领域的应用,可以有效缓解噪声环境下的语音识别准确度不高的问题,助力智能语音设备为用户带来较好的消费体验。

       声纹识别技术方面,声纹识别技术通过探测语音信号提取用户独有的声门开合频率、口腔大小形状及声道长度等声学特征,进而识别发声者身份。声纹识别技术的应用可以有效解决远程身份认证、网络交易、生存认证等问题,并且保障信息传输的安全性、完整性和可靠性。因此,声纹识别技术的发展推动智能语音在国家安全、电话银行、智能门禁等领域的广泛应用。

       (2)辅助技术的发展为行业发展提供契机:在智能语音行业中,深度学习、大数据、云计算等辅助技术的发展提高了语音识别的准确率、降低了数据存储所需的硬件成本,为智能语音行业的发展提供契机,助力智能语音行业发展。

       深度学习方面:深度学习是推动智能语音行业发展的关键性技术,基于深度神经网络的语音识别技术和机器翻译技术可以大幅提高自然语言处理的准确率,为用户带来较好的消费体验。深度学习技术可以伴随数据规模的增加不断提升其性能,当海量数据持续输入存储,设备的分辨性能将不会被影响,同时保证智能语音系统使用的流畅性。深度学习技术的应用使机器可从数据中直接提取特征,产品设计者无需对每一个问题设计特征提取器,设计环节的简化将有效节省产品设计及生产成本,降低技术难度。深度学习技术的应用推动智能语音行业技术门槛的降低,吸引更多行业参与者布局智能语音市场,推动行业发展。

       云计算方面:云计算服务为智能语音设备提供强大的运算能力和资源整合能力,提高智能语音后台技术的智能化水平,使终端设备获得云端服务器级别的运算能力,进一步提高语音识别能力,推动智能语音技术应用逐步落地。各智能语音服务商可以在传统云计算结构上建立新的服务层,提高智能语音设备在语音识别、自然语言处理等方面的核心能力。

       大数据方面:大数据技术的发展为智能语音后端数据存储提供支持。大数据技术特有的分布式存储技术能够将单一体量巨大的语音数据文件切分成不同模块,使其能够存放于多台计算机所建构的集群中。多台计算机之间通过相互通信,将集群内的存储空间进行资源整合、数据虚拟化,并向外提供文件访问服务的文件系统。大数据技术在智能语音领域的应用极大的降低了数据存储所需的硬件成本。

       (3)语言交互优化用户的消费体验:语言交互是利用语言信息进行交互的技术,在空间上打破了用户与智能设备的距离限制。语音交互技术的发展帮助用户实现了本能表达,解放消费者感官的占用,优化用户的消费体验。除改善用户体验的优势外,语音交互还具有明显的速度优势。在用户与智能语音进行语音交互时,语音输入效率明显高于文字输入效率。自然语言处理技术的发展缩短了语音识别的处理时间,具有明显的效率优势。

我国智能语音行业优势
 
数据来源:公开资料整理

       二、 劣势分析

       (1)行业基础层技术存在短板:目前,我国智能语音行业基础层的核心关键技术积累较薄弱,算法、芯片及基础元器件的原创科技实力与国外企业相差较大。智能语音行业基础层核心技术实力欠缺,如芯片、传感器等核心元器件,不仅影响行业原创科技成果的输出,并且核心技术或生产环节长期依赖国外,不利于我国智能语音企业建立国际竞争优势。

       (2)语音识别技术的“鲁棒性”问题凸显:在智能语音硬件的真实使用场景中,方言、噪音、远场、断句等情况不可避免。语音采集地点变更导致的环境及背景噪音差异、语音信号传输载体方式多样导致的传输信道差异,都将造成语音信号的频谱畸变,导致智能语音系统对于用户需求的准确识别产生偏差。语音识别技术的成熟度将影响各应用领域智能生态的构建及发展,语音识别技术的“鲁棒性”问题亟待解决。

       (3)自然语言处理技术尚不成熟:自然语言处理(NLP)技术主要包含三个层面,分别为词法分析、句法分析、语义分析。在语义分析层面,机器对句子的理解只能做到语义角色标注层面,即标出句中的句子成分和主被动关系等,词义消歧是制约自然语言处理(NLP)技术的最大阻碍。语音识别系统在完成切词、标注词性以及词语识别后,需要对每个词语进行理解。但由于一词多义的情况无法避免,机器无法比拟人力基于语言环境和知识储备消除各种歧义的能力,因此基于自然语言处理技术的语音识别系统在实际操作情况并不理想。

我国智能语音行业劣势
 
数据来源:公开资料整理

       三、 机遇分析

       (1)政策支持:近年来,我国相继出台多项政策推动包括智能语音在内的人工智能产业发展。如2017年,工业和信息化部制定《促进新一代人工智能产业发展三年行动计划(2018-2020年)》。《行动规划》按照“系统布局、重点突破、协同创新、开放有序”的原则,为人工智能行业的发展提出了多方面的任务。

我国智能语音行业相关政策

颁布日期

政策名称

制定部门

主要内容及影响

2015

《中国制造2025

国务院

加大科技创新力度,推动移动互联网、云计算、大数据等技术在智能制造领域的突破

2017

《新一代人工智能发展规划》

国务院

以提升新一代人工智能科技创新能力为主攻方向,发展智能经济,建设智能社会,维护国家安全,构筑知识群、技术群、产业群互动融合和人才、制度、文化相互支撑的生态系统

2017

《促进新一代人工智能产业发展三年行动计划(2018-2020年)》

工业和信息化部

《行动规划》按照“系统布局、重点突破、协同创新、开放有序”的原则,为人工智能行业的发展提出了多方面的任务

数据来源:公开资料整理

       (2)智能语音行业大力发展深度集成语音AI芯片:深度集成语音AI芯片利用主要算法和芯片架构深度集成,将芯片和语音识别算法技术组合成语音模块,放置在设备中。用户只需向设备发送指令,设备中的语音模块通过麦克风将语音导入设备变成电信号,语音模块再将电信号提取出来进行运算,从而实现“人机交互”。深度集成语音AI芯片拥有较大的数据存储空间,无需将语音语料上传至云端进行计算,保护信息安全性。深度集成语音AI芯片降低了设备的数据运算量及功耗,在节约设备运行成本的同时,提高智能语音处理速度,提升消费者的用户体验。

       (3)智能语音行业构建智能语音专利池:目前我国智能语音行业进入快速成长期,语音技术在各下游场景的商业化应用日益广泛,推动智能语音产业分工的细化以及科学技术的密集化。落地的智能语音产品会涉及众多专利技术,且分属于不同所有者,众多的专利请求、复杂的专利授权、以及高额的专利侵权赔偿等问题将阻碍智能语音新技术的实践运用。智能语音行业建立智能语音专利池,将有效降低交易成本,消除专利实施中的授权障碍,减少企业间的专利纠纷、有利于专利技术的推广应用。

       四、 威胁分析

       (1)人工智能芯片垄断威胁:人工智能芯片作为智能语音产业的核心,芯片的技术成熟度将影响智能语音设备的性能。人工智能芯片行业的技术门槛较高,海外厂商技术领先,中国人工智能芯片较依赖进口,导致智能语音服务商的制造成本居高不下,压缩企业利润空间。

       (2)软件服务竞争威胁:智能语音算法主要应用于数据的计算、分析和语音识别,由于算法及算法框架的技术门槛较高,以Facebook、谷歌、IBM、微软为主的海外科技巨头占据算法行业较大的市场份额,国内仅有少数几家科技公司(如百度)拥有针对算法的开放平台,核心环节技术实力薄弱削弱中游智能语音服务商的国际竞争实力。

威胁我国智能语音行业发展因素分析

数据来源:公开资料整理(zlj)

        欲了解更多内容,请参阅我们的行业分析报告:
        《2021年中国智能语音市场调研报告-市场供需现状与发展动向研究
        《2021年中国智能语音产业分析报告-产业运营现状与发展趋势研究

        行业分析报告是决策者了解行业信息、掌握行业现状、判断行业趋势的重要参考依据。随着国内外经济形势调整,未来我国各行业的发展都将进入新阶段,决策和判断也需要更加谨慎。在信息时代中谁掌握更多的行业信息,谁将在未来竞争和发展中处于更有利的位置。

        中国报告网专注于行业分析与产业研究,多年来持续追踪数千个细分行业,是业内领先的资深行业分析报告提供方,曾为数千家企业(包括多家世界五百强企业和数十家国内五百强企业)提供了详实的行业分析报告,并获得了客户认可。

        报告订购咨询请联系:
        电话:400-007-6266   010-86223221
        客服微信号:guanyankf
        客服QQ:1174916573
        客服邮箱:sales@chinabaogao.com

更多好文每日分享,欢迎关注公众号

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

多维度分析我国小游戏行业现状 技术与变现效率有望全面升级、优化

多维度分析我国小游戏行业现状 技术与变现效率有望全面升级、优化

现阶段小程序游戏的变现模式主要包括内购付费、广告变现、混合变现三类。目前,由于内购付费的占比快速提升,以及低成本短周期、短触达高转化变现效率、社交关系沉淀提升用户粘性等优势带动小游戏市场规模较快增长。

2024年04月24日
多国政策不断 全球量子计算行业潜在市场空间广阔 中国市场崛起迅猛

多国政策不断 全球量子计算行业潜在市场空间广阔 中国市场崛起迅猛

长期来看,随着通用量子计算机技术不断演进和专用量子计算机在特定领域的广泛应用,量子计算行业规模持续扩大,预计2035年有望达到8117亿美元,行业也将进入全面成熟和商业化的关键阶段,商业潜力进一步释放。

2024年04月07日
大模型加入有望开启搜索引擎行业新篇章 百度、微软等大厂围剿AI搜索

大模型加入有望开启搜索引擎行业新篇章 百度、微软等大厂围剿AI搜索

根据数据显示,2021年,我国搜索引擎行业市场规模达1240亿元,近五年CAGR为8.2%,预计2025年市场规模将达1680亿元,同比增长7%;截止2022年6月搜索引擎用户规模为8.41亿人。

2024年03月23日
我国电竞游戏行业:实际销售收入实现增长 射击类游戏占比最多

我国电竞游戏行业:实际销售收入实现增长 射击类游戏占比最多

2023年因为疫情期间诸多负面因素明显消退,用户消费意愿和能力有所回升;游戏新品集中面市并有爆款出现,与长线运营产品共同撑起收入增长;普遍采用多端并发方式,对收入增长产生明显助益,使得我国游戏市场实际销售达到3029.64亿元,较2022年同比增长13.95%,首次突破3000亿关口。

2024年03月11日
大模型为自动驾驶行业注入“强心剂” 华为、比亚迪等展开技术布局

大模型为自动驾驶行业注入“强心剂” 华为、比亚迪等展开技术布局

而L3之所以重新出现在人们视野,主要还是不少车企正在布局的城市NOA,让L3 1有一定的落地基础。例如,奔驰、蔚来、小鹏、理想、阿维塔以及供应商领域的毫末智行都拿出城市NOA的规划,雷军更放话将在今年底开通100个城市领航NOA。

2024年03月08日
我国卫星导航与位置服务行业现状分析 关联产值突出 核心产值相对较小

我国卫星导航与位置服务行业现状分析 关联产值突出 核心产值相对较小

随着北斗卫星导航系统对我国经济社会发展的辐射带动作用日益显现,应用深度广度持续拓展,2017-2023年我国卫星导航与位置服务总产值由2550亿元增长至5730亿元,预计2024年我国卫星导航与位置服务总产值将达6355亿元。

2024年03月07日
“合纵连横”上演 我国游戏直播行业竞争或现“新格局” 新市场机会渐显

“合纵连横”上演 我国游戏直播行业竞争或现“新格局” 新市场机会渐显

但是,此次游戏直播平台突然“合纵连横”,也引发外界的猜测,甚至有人开始质疑“游戏直播行业卷不动了,开始抱团群暖了?”其实,纵观这几年市场发展现状可以看出,我国游戏直播行业市场规模增速放缓,面临着流量见顶的瓶颈期。根据数据显示,2021年,我国游戏直播行业市场规模为948亿元,同比增长11.8%,

2024年03月05日
全球AI算力行业现状分析 规模增长速度快 中国AI芯片国产化率仍有待提升

全球AI算力行业现状分析 规模增长速度快 中国AI芯片国产化率仍有待提升

随着人工智能技术发展,AI算力行业迎来发展机遇,实现快速增长。根据数据,2021-2022年全球智能算力规模(换算为FP32)由232 Eflops增长至451Eflops。

2024年02月07日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部