首页 > 公众号研报 > 计算机视觉:血腥战场(深度)

计算机视觉:血腥战场(深度)

作者:微信公众号【计算机文艺复兴】/ 发布时间:2022-05-03 / 悟空智库整理
(以下内容从国泰君安《计算机视觉:血腥战场(深度)》研报附件原文摘录)
  This browser does not support music or audio playback. Please play it in Weixin or another browser. 披着羊皮的狼 音乐: 谭咏麟 - 天地 行业深度系列 1. 计算机视觉:人工智能主要应用领域 1.1. 计算机代替人眼识别,运用算法处理解释 计算机视觉是机器认知世界的基础,也是AI应用前景最为广阔的细分领域之一。计算机视觉指使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解、分析图像以及图像序列的能力。简单来说,类似于人类依靠双眼进行外界视觉感知,计算机视觉就是借助光学、电子元器件给计算机提供一双眼睛,并依靠人工智能的算法去教会计算机如何使用眼睛获取有用信息。 计算机视觉以准确率、召回率和误报率作为衡量指标。近年来,随着深度学习算法的发展,在计算机视觉领域,很多研究成果已取得接近甚至超过人类视觉系统的突破性进展。计算机视觉技术通常以准确率、召回率和误报率作为衡量指标,准确率是指提取正确的信息占全部需要待提取信息的比例,召回率是指算法选择报告样本中正确样本的比例,误报率是指算法选择报告样本中错误样本的比例。通常情况下准确率越高、召回率越高或误报率越低则表明计算机视觉算法的性能表现越好。 计算机视觉不同于机器视觉,运用算法对图像、视频进行处理和解释。以图像识别举例,对于机器视觉,在识别某个图像的时候,系统不需要知道这个东西是什么,而只需要做标定。比如工程师拍了很多角度的路标的图片作为样张,然后把它送到模型里。经过训练,系统在看到新的照片时就可以通过损失函数来判断它和样张的相似度,从而识别是不是路标。而计算机视觉则是先描绘路标的轮廓,把它的特征表述出来,检测的时候直接识别轮廓,如果轮廓相似度比较高系统才认为它是路标。 1.2. 计算机视觉核心技术,层层递进 计算机视觉系统五大方向。近来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。参考《人工智能标准化白皮书》的说法,根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。 1)计算成像学:计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机应用科学方面,计算成像学可以提升相机的能力,从而通过后续的算法处理使得在受限条件下拍摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超分辨率等。 2)图像理解:图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等;高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统,如刷脸支付、智慧安防、图像搜索等。 3)三维视觉:三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解或者直接理解三维信息。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。 4)动态视觉:动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视觉问题可以定义为寻找图像元素,如像素、区域、物体在时序上的对应,以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。 5)视频编解码:视频编解码是指通过特定的压缩技术,将视频流进行压缩。视频压缩编码主要分为两大类无损压缩和有损压缩。无损压缩应用于磁盘文件的压缩等,而有损压缩的应用广泛,例如视频会议、可视电话、视频广播、视频监控等。 计算机视觉系统包含五大基础功能。虽然计算机视觉系统的结构形式很大程度上依赖于其具体应用方向,但它们有些功能是几乎是每个计算机系统都具备的。计算机视觉现在可实现主要功能包括图像获取、预处理、特征提取、检测/分割、高级处理等。 2. 人工智能商业成熟度提升,计算机视觉加速发展 2.1. 数据、算力和算法驱动,人工智能迈入快车道 在数据、算力和算法的进步与驱动下,近年来人工智能商业成熟度不断提升,行业进入加速发展阶段。与此同时,人工智能与传统产业的融合发展,彰显出了巨大的市场潜力,吸引了包括国内外科技巨头、解决方案及设备供应商、传统行业龙头企业以及人工智能企业等各类企业,积极参与到各个层面及细分领域的发展布局和市场竞争中。各类企业因资源禀赋、创新能力、经营策略等方面的差异,其经营模式、产品服务及应用领域等各有侧重。行业内主要企业具体情况如下: 人工智能行业产业链可分为基础层、技术层、应用层。 基础层:主要包括芯片、软件框架、传感器、服务器、数据(集)等软硬件及服务,为技术层提供算力、数据等底层支撑,是人工智能发展的重要基石。 技术层:主要通过基础层的算力、数据支持,进行海量模拟训练和机器学习建模,为人工智能提供核心的算法与应用技术,主要包括以深度学习为代表的算法模型,以及计算机视觉、智能语音、机器学习、生物特征识别、知识图谱等关键技术。技术层是人工智能发展的核心,对应用层的智能化发展起到决定性作用。 应用层:基于基础层与技术层,面向特定应用场景需求而形成的软硬件产品或解决方案。人工智能应用广泛,可有效赋能下游领域实现人工智能应用,为其转型与发展注入强劲新动能。 2.2. 人工智能核心计算机视觉,场景应用快速扩展 作为人工智能行业的率先取得突破、应用场景明确的关键分支,计算机视觉产业链也可分为基础层、技术层、应用层。基础层包括硬件支持、算法支持和数据集;技术层包括视觉技术平台、视频识别、图片识别和模式匹配;应用层包括计算机视觉技术在智慧城市、智慧安防、智慧物流、智慧金融、手机终端和智慧商业等领域的应用。随着机器学习的不断推进,图像及视频识别准确率持续提升,计算机视觉算法向着高效求解复杂问题、进行全局优化的方向发展。 计算机视觉技术实际应用的技术领域不断扩展。从最初的静态人脸识别和光学字符识别起步,逐渐扩展到了人脸识别分析、活体检测、人体识别分析、物体检测识别、行为识别分析、人体重识别、医疗影像诊断技术等诸多种方向。 除了技术越发成熟,计算机视觉技术与场景结合的应用领域也越来越广泛,除应用较早的安防、金融、互联网等领域之外,城市治理、楼宇园区、医疗影像等创新领域正逐步实现应用,成为计算机视觉技术快速发展的重要支撑,计算机视觉领域市场规模仍处在高速增长阶段,中国有高达42%的企业应用计算机视觉相关技术。 2.3. 技术持续提升,带动千亿级规模市场 近年来,全球高度重视计算机视觉的研究和应用,在核心技术和产业化应用上的研发投入持续增加。计算机视觉技术主要基于使用神经网络的深度学习算法,神经网络和深度学习的快速发展极大推动了计算机视觉的发展,使其成为人工智能行业中成熟度相对更高、商业落地较早的技术。数据量的爆炸式增长、算力的大幅提升、深度学习算法的日益优化也是计算机视觉行业快速发展的三大因素: 1)数据为深度学习算法提供训练支撑。海量的应用场景数据为计算机视觉算法提供训练基础,从而使得计算机视觉算法精准度提升,让机器最终实现精准的视觉识别。 2)人工智能芯片的发展不断提升计算机视觉算力。GPU、FPGA、ASIC 等专用芯片具有良好的并行计算能力,大幅提升了数据处理速度,缩短了计算过程和模型架构调整时间,为计算机视觉的发展提供了算力支持。 3)深度学习算法的发展有效提升计算机视觉准确度。深度学习算法是以多层神经网络为基础,以海量数据为输入的规则自学习方法。它能够通过输入的海量行为数据对规则中的参数进行调整,让机器通过数据训练,在数据库中自行归纳物体特征,而后依照其归纳出的规律对物体进行识别。 2021年,我国计算机视觉核心产业规模和带动相关产业规模分别为989.6亿元和3079亿元,占人工智能核心产业和带动相关产业规模的比重分别达到49.5%和40.0%。通过对下游行业需求统计测算,2021年,中国计算机视觉核心产品的市场规模已接近千亿元大关。此外,与计算机视觉相关的计算机通信设备销售、工程建设、传统业务效益转化等带动相关产业规模超过3000亿元。 2.4. 四类企业划分市场格局,参与者众多导致竞争惨烈 目前,人工智能行业的主要参与者可分类为国际机器视觉企业、综合型科技企业、技术型科技企业及智能化转型的硬件厂商等四大阵营。因为参与企业众多,又不存在绝对的技术壁垒,造成了企业低价争取项目,在部分垂直领域疯狂价格战的场面。这也是很多人工智能或者计算机视觉公司迟迟无法盈利的重要原因。在此情况下,一些公司选择另辟蹊径,进入竞争者较少的垂直行业,避开价格战。 1)国际机器视觉企业:康耐视和基恩士等国际企业作为传感器和测量仪器的主要供应商,在工业自动化的发展历程中打造了底层开发的研究基础,形成了种类丰富的机器视觉产品体系,系机器视觉领域的先驱者。 2)综合型科技企业:以百度、华为等为首的综合型科技企业全面布局人工智能的基础层、技术层和应用层,既着力于开发计算和开放平台,面向人工智能云边端的自主研发芯片产品,又注重结合场景,提供行业解决方案和消费级产品并已实现规模化销售,系人工智能行业的重要参与者。 3)技术型科技企业:商汤科技、依图科技、云从科技、格灵深瞳、科大讯飞、云天励飞、虹软科技、汇顶科技、寒武纪等技术型企业以计算机视觉、语音识别、人工智能芯片等分支技术方向为出发点,顺应行业趋势,迅速发展壮大,系人工智能行业的中坚力量。 4)智能化转型的硬件厂商:海康威视、大华股份等硬件厂商以传统的摄像头为基础,通过硬件的智能化转型切入人工智能行业,系人工智能行业的重要参与者。 中国计算机视觉厂商具有基于基础算法进行改进和优化并形成各自特有算法的技术能力。据 IDC 统计,2019 年商汤科技、旷视科技、云从科技、依图科技四家企业占国内计算机视觉应用市场份额的 51.40%。 而计算机视觉的下游应用包罗万象,既可以直接输出通用的技术,也可以结合垂直行业的痛点提供相应的产品与解决方案。针对垂直行业类,一般根据场景和需求区分不同落地行业,其中以泛安防为大头,互联网、金融、工业、医疗等为辅构成主要应用行业,具体如下: 1)泛安防领域(包括公安、交通、社区、文教卫等),深受政策及财政支持,多年以来一直是计算机视觉乃至整个国内人工智能产业实际落地的重要基石。2021年,国内泛安防领域计算机视觉核心产品市场规模达到531亿元,占计算机视觉总核心产品规模的70.7%,预计到2026年将接近1000亿元。 2)互联网领域,在互联网/ICT/安防等领域巨头大力推进AI开放平台业务的环境下,计算机视觉算法技术将通过API调用模式快速扩张,2026年有望突破300亿元。 3)金融领域,主要通过计算机视觉产品技术完成人脸识别及证照识别等工作,由于前期市场需求已大部分得到满足,未来数年市场将保持稳定中速增长。 4)工业领域,有设备在线监测与运维、智能检测运维、智能辅助运输和工业视觉质检等方向,但由于需求有限,预期未来市场增长平稳。 5)医疗领域,是近两年时间内计算机视觉应用最火热的领域之一,尽管现阶段市场规模仍较小,但随着以计算机视觉技术为核心的AI医学影像辅助诊断产品及新型智能医疗器械在各级医院及医疗机构的铺开,医疗领域的计算机视觉核心产品规模将超过100亿元。 2.5. 技术和应用驱动行业增长,未来发展走向融合、综合 行业趋势转向技术协同、综合性竞争。近年来,视觉人工智能的多数研究都集中在深度学习、检测和分类面部/手部/姿势、3D 传感技术等方面。随着识别准确度的提升空间趋小,研究重心将逐渐转向技术协同、融合与应用。同时随着人工智能覆盖日常生活、科研、商业创新以及国家安全等社会运行的基本要素,一大批行业得到人工智能的赋能,在解决行业需求痛点的基础上,竞争维度也将逐步从单一技术领先性竞争转向综合服务能力竞争。在计算机视觉的赋能下,助力优化全产业链结构,同时也逐步创造了产业新领域,实现增长新动能。 1)端云架构协同、技术融合与应用是大势所趋。在计算机视觉领域内,将终端设备演进为小型数据中心集群,并与云端高效协同将成为研究重点之一。终端设备的铺设和数据量的增长将使面向云端的传输压力倍增,这要求端侧完成部分云侧的图像处理功能。而在终端逐渐提高的算力要求,例如更加准确的实时识别,也需要端云架构的协同整合。在识别技术趋于成熟的今天,端云的深度结合与协同将成为识别技术的重要依托,如何将两侧的架构进行不断耦合优化也将不会局限于计算机视觉技术,而成为人工智能技术层共同探索的方向。目前,业内的部分研究也在突破对识别准确度的单一聚焦,转向更加综合的计算机视觉问题,如图像描述、事件推理、场景理解等。未来,视觉人工智能将与其他的智能技术协同融合,评判因素也将由准确性延伸至识别的灵活性、推测的合理性。例如,融合自然语言处理技术来完成图像描述,将图片翻译为一段文字。 2)计算机视觉人工智能行业的竞争维度逐步从单一技术领先性竞争转向综合服务能力竞争。随着AI算法技术的不断进步,视觉人工智能企业技术成熟度均已达到较高水平,同行业企业间的技术差异正在逐渐缩小,行业技术进步所带来的边际改善效应正在衰减。在更多场景下,竞争者之间的技术水平都已经可以较好地满足用户的需求。故而,视觉人工智能领先企业间的竞争正从过往的以技术领先性为核心的技术研发竞争逐步转向以用户需求理解和应用场景落地为核心的技术应用竞争。 各行业结合计算机视觉技术的发展趋势和相应市场的驱动因素也均有差异性。例如,面向企业的计算机视觉软件,是为了企业在各种场景中实现数字化运营,主要驱动因素包含运营管理改善、用工效率提升、用户体验增强;面向城市管理的计算机视觉软件主要为了通过海量数据训练来改善人工智能模型,从而保证居民居住安全、改善交通环境、提高城市管理效率等;面向消费端的视觉技术软件为消费者带来媒体、娱乐、社交活动及医疗方面的创新服务,其市场的主要驱动因素包含IoT设备激增、用户对AI体验需求增加以及AI在医疗行业的广泛应用等;面向汽车的视觉技术作为汽车智能化革命的一部分,以有效训练AI模型并不断提高自动驾驶能力,结合云服务使车辆实时与环境交互,提高自动化安全性能。从具体应用领域看,安防影像应用占比最高,安防、金融领域渗透率最高,已形成规模化应用。 合规声明:本文节选自已经入库的正式研究报告,如需报告原文请后台留言。 - end - 欢迎加入产业交流群! 欢迎所有对计算机产业研究和投资感兴趣的盆友(包括云计算、网络安全、医疗IT、金融科技、人工智能、自动驾驶等)后台留言加入我们的产业交流群。我们的目标是建立系统的计算机产业研究框架,提高整个A股的IT行业研究水平,减少韭菜数量,普度众生。 人工智能及自动驾驶相关报告 1. 如何研究一家AI公司? 2. 从汽车业务商业模式看中科创达和人力外包公司的不同 3. 中科创达:汽车“四化”下加速成长 4. 三谈中科创达:做事情眼光最重要 5. 智能座舱:智能汽车产业大变局中的投资机遇(40页深度) 6. 德赛西威:领先的汽车电子玩家,未来出行变革创领者(深度) 7. 科大讯飞:个性化学习手册改变了什么?(深度) 8. 科大讯飞:你绝对没见过的区域型订单详细拆解(深度) 9. 科大讯飞核心竞争力与增长点分析(50页PPT) 10. 科大讯飞:疫情防控让教育订单商业模式发生怎样的变化? 11. 从Nuance的沉浮看科大讯飞的核心竞争力 12. 格灵深瞳:技术领先到商业落地,计算机视觉场景为王(深度) 13. 一张图看懂AI公司 14. AI+自动驾驶:模糊的正确胜过精确的错误 15. 从主芯片视角研究智能驾驶内在产业逻辑 16. 科大讯飞:区域订单统计 17. 对中科创达的一些理解 18. 英伟达汽车芯片业务发展史 19.自动驾驶路测数据中的秘密 20.Mobileye:被篡位的自动驾驶芯片老霸主(深度) 21.中科创达:牵手地平线成立合资公司 22.黑芝麻:国产自动驾驶芯片独角兽,用芯赋能未来出行(深度) 23.经纬恒润:汽车电子隐形冠军(深度) 法律声明 本订阅号发布内容仅代表作者个人看法,并不代表作者所属机构观点。涉及证券投资相关内容应以所属机构正式发布的研究报告内容为准。市场有风险,投资需谨慎。在任何情况下,本订阅号中信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。本订阅号运营团队不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。本订阅号所载内容为原创。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的,需明确注明出处,且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。