浅析人工智能的计算机视觉
时间: 2024-06-01 07:53:19 | 作者: 照明非球面
- 产品介绍
中央明确指示要加快推进国家规划已明确的重大工程和基础设施建设,其中要加快、数据
当前人工智能理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。据IDC统计,2018年我国人工智能市场规模为161.9亿元,预计到2022年市场规模将接近700亿元,年复合增长率超过50%。据中国人工智能学会和罗兰贝格咨询公司预测,2025年市场规模将达到3万亿美元。
以深度学习为代表的人工智能算法的出现极大推动了视觉人工智能行业的发展。计算机视觉是人工智能行业的最大组成部分,与其他细分的比较来看,计算机视觉技术应用的市场规模也远远大于其他细分。
计算机视觉(Computer Vision) 人工智能主要应用领域之一,起源于20世纪80年代的神经网络技术,通过使用光学系统和图像处理工具等来模拟人的视觉能力捕捉和处理场景的三维信息,理解并通过指挥特定的装置执行决策。2015年以来,全球科技界和产业界高度重视视觉人工智能研究和应用,在核心技术和产业化应用的研发投入持续倍增。
计算机视觉能极大提升机器的图像感知能力和认知能力,因此应用场景十分广阔,商业化变现空间大。根据前瞻产业研究院的统计,国内人工智能企业中,有高达42%的企业应用计算机视觉相关技术,其次是语音和自然语言处理,分别占比24%、19%,两者之和才与计算机视觉占比相当。在安防影像分析、泛金融身份认证手机和互联网娱乐、批发零售商品识别、工业制造、广告营销、自动驾驶、医疗影像分析等领域都具有巨大应用价值。
视觉人工智能行业的发展,离不开技术的驱动:一方面诸如GPUFPGAASIC等一系列的出现极大提升了芯片计算能力,突破了传统CPU的算力瓶颈;另一方面以深学习为代表的AI算法的崛起,使得AI视觉的识别能力有了很大的提高。硬件算力的提升以及软件算法的进步都对视觉人工智能的发展起到了重要的推动作用。
计算机视觉的工作流程包含四个模块:检测、分类、跟踪与语义分割。具体为成像设备首先捕获图像,然后对每个图像进行预处理,提取特征后输入到分类模型中。
计算机视觉是采用图像处理、模式识别、人工智能技术相结合的手段,着重于一幅或多幅图像的计算机分析。图像可以由单个或者多个传感器获取,也可以是单个传感器在不同时刻获取的图像序列。在消费级领域,随着数据量上涨、运算力提升和深度学习算法的发展,计算机视觉技术越来越多地被应用在各类消费级应用场景中,典型的如人脸识别服务,具体包括人脸检测、人脸关键特征点、人脸对比、人脸搜索、人脸属性、人脸聚类、人力活体检测等。
计算机视觉实现了计算机“看得懂”,人脸识别、OCR和图像结构化是其主要应用场景。计算机视觉是用计算机模拟人眼对目标进行识别、跟踪和测量,并且对图形进行处理,即实现计算机“看得懂”。
根据亿欧智库《2019计算机视觉人脸识别市场研究报告》显示,2018年中国计算机视觉人脸识别市场规模为151.7亿元,预计2021年将达530亿元,年均复合增长率53%,市场规模增长迅速。
上游基础层基础层:主要包括CPU、GPU等芯片硬件,深度神经网络、循环神经网络、卷积神经网络等算法,以及由真实数据和模拟数据共同构成的数据集。核心芯片被Intel、Nvidia等传统芯片厂商把控,新型芯片厂商尚未崛起,规模应用有待时日;开源平台以谷歌的Tensorflow、Facebook的Caffe等为主,其它企业的深度学习框架多为二次开发;
中游技术层主要包括视频识别、图片识别、模式匹配等嵌入式视觉软件,以及一站式解决方案。算法,初创企业占优;云计算,几乎被AWS、Google Cloud、Azure、阿里云等垄断。
下游应用层:为计算机视觉的落地场景,包括智慧安防、智慧金融、手机应用、无人驾驶等商业领域。垂直行业龙头占据场景,技术层初创企业向上渗透。
安防影像分析的市场需求驱动此类企业的技术研发。在云边融合的架构下,近年来安防行业头部厂商纷纷推出自家智能化产品和解决方案。
作为人工智能范畴中最关键的子领域之一(人类从外界获取的信息中有80%~85%是依靠视觉实现的),计算机视觉技术的愿景是利用摄像机等视觉传感装置来代替人眼对物体进行识别、跟踪和测量,再由计算机处理这些视觉信息,从而达到像人眼一样对事物进行感知和认知,直接对应安防监控系统“看得懂”的需求。
近年来基于深度学习的智能语音、计算机视觉、自然语言处理等技术开始向各个应用领域渗透,全球人工智能产业规模快速增长。为抢占人工智能高地,谷歌、微软、阿里巴巴、百度、腾讯、IBM、Facebook 等国际知名企业均持续增加在人工智能领域的资本投入。美国、中国、英国、德国、日本等国家也分别出台人工智能相关支持政策及国家战略规划,为整个产业的发展创造良好的政策环境。
3.创业公司:包括商汤科技、依图科技和旷视科技等企业,普遍以细分领域为发力点,布局思路各异。
在商汤、旷视、依图等头部企业看,各家战略思路差异明显。商汤致力于构造平台,专注底层基础应用,力图在完善平台后于其他领域快速落地。旷视则在致力于在安防、金融、零售、汽车、教育等广泛领域提供软硬件一体化的解决方案。依图则表现出对安防、医疗两大领域的专注深耕,依托产品化、工程化能力深入落地。
按照中国信息通信研究院的统计结果,目前中国人工智能应用市场主要由五个领域构成,其中,由于近几年中国互联网娱乐、广告传播和公共安全视频监控市场的高速发展,计算机视觉市场规模以37%占比大幅领先。而在机器视觉领域的细分市场构成中,安防行业又以67.9%占据大部分份额,这得益于中国公共安全视频监控建设的庞大市场。根据《安防+AI人工智能白皮书》的预计,在2020年全球智能安防产业规模将实现106亿美元,中国将达到20亿美元。
人工智能行业是一个典型的技术驱动型行业,技术的核心在于算力、算法和数据三个方面。GPU及AI专用芯片的出现突破了传统CPU的算力瓶颈,数据运算速度和处理规模爆发性增长,从而为大数据的分析提供硬件上的支持。越来越多的应用领域正持续积累着日趋丰富的大数据,海量的图像和视频内容为深度学习提供了有力的数据支撑。
视觉人工智能行业的快速发展一方面得益于现阶段算力的大幅提升及算法的大幅改善(国内算法甚至已经达到国际水平),另一方面则受益于下游应用市场的广阔空间。机器学习、深度学习等算法能力的不断增强促进了视觉人工智能行业的高速发展。
上一篇:【48812】VSDC•壹周报 ▏机器视觉技能!无人驾驭量产轿车前装ADAS视觉感知计划 下一篇:计算机视觉就业前景