深度解析计算机视觉:人工智能重点赛道
时间: 2024-07-03 14:58:22 | 作者: 照明非球面
- 产品介绍
计算机视觉是AI在中国落地最顺利的技术。和语音相比,计算机视觉是一条更有技术深度,更多应用场景的好赛道。
从目前的落地进展来看,移动互联网/安防领跑,零售/物流跟进,医疗/无人驾驶的商业化有待成熟。
以商汤、旷视、深兰、依图、云从为代表“视觉五虎将”企业战略出现向平台企业或软硬一体化公司发展的分化趋势,以扩博等新计算机视觉公司也在各领域快速崛起。
计算机视觉是中国AI市场的最大组成部分。根据中国信通院2018年2月发布的报告数据,2017年,中国AI市场中计算机视觉占比37%,以80亿元的行业收入排名第一。
安防影像分析是目前计算机视觉最大的应用,据艾瑞咨询预测,2017年占比约67.9%。其他主要使用在包括广告、互联网等。
从AI领域融资规模来看,根据CBInsight的统计,2016年中国计算机视觉公司融资总额占AI总体24%,远超出美国的7%。
最近几年机器视觉行业实现加快速度进行发展的背景是:2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,同年Google在开源自己的深度学习算法。
这些带动中美两国的科学家把计算机视觉算法运用到安防、金融、互联网、物流、零售、医疗、制造业等不同垂直行业。
但在实际的运用当中,由于数据可得性,算法成熟度,服务的容错率等因素的影响,落地的速度慢慢的出现分化。移动互联网/安防领跑,零售/物流跟进,医疗/无人驾驶发展较慢。
金融领域:人脸识别在金融领域已出现多种解决方案,伴随识别准确率上升,远程开户已在互联网金融行业得到普遍应用,人脸支付、刷脸取款等开始被各大银行采用。
1)人脸与身份证信息的人脸比对技术壁垒相比来说较低,服务容易陷入同质化竞争,而手脉识别高难度技术的玩家又很少;
2)无现金趋势影响刷脸取款等服务的普及,银行对更复杂的AI服务仍持较谨慎态度。
零售领域:AI在零售行业的应用不是简单的无人零售,而是需要利用AI技术改造零售流程,实现提高效率减少相关成本的目的。AI公司除了提供技术以外,在大多数情况下要提供包括一系列咨询战略方案在内的整体方案。
医疗领域:医疗数据碎片化严重,各种疾病需要的影像资料不同,数据标注需要有专业医师参与,成本高,进展慢。导致发展低于预期。
无人驾驶:无人驾驶涉及采集摄像头、雷达等多种数据,并根据多重数据来进行车辆、物体、道路、行人等不同识别后进行决策。我们大家都认为离实现通用无人驾驶还早,在限定场景下实现商用的机会较大。
提高预测精度,降低数据标注成本随技术的持续不断的发展,计算机视觉能够识别信息的种类从最初的文字信息,到人脸,人的体态识别,以及各种不同的物体。
能够识别的精度也从最初的人1:1比对,到用于门禁系统等1:N比对,以及用在黑名单监控等场景的M:N动态监控。除了提高算法精度以外,提高数据标注的效率也是计算机视觉公司重要的课题之一。
商汤科技、扩博智能等AI公司也通过运用半监督学习、迁移学习(transferlearning)、主动学习(activeLearning)等技术,提高数据标注的自动化程度,达到提高效率,减少相关成本的目的;深兰科技等以生成式对抗网络(GAN, Generative Adversarial Networks )向近年来复杂分布上无监督学习方法领域迈进,用GAN生成的图像来做数据增强。
企业发展的策略开始分化,商汤向左,旷视向右,深兰横向9大领域发展的计算机视觉技术在中国的快速落地,吸引了众多以算法为核心竞争力的AI初创公司效仿,拥有强大数据采集及软件开发能力的网络公司,海康、大华、宇视等深耕安防行业的公司,以及华为、平安等科技行业巨头。
各类公司初始时在产业环节中各有偏好:初创企业在算法与模型训练上占优;互联网公司则拥有天然的数据优势;安防企业则凭借极强的工程能力加速安防项目落地。后起之秀如扩博则选择细分市场广泛落地。
从行业机会而言:互联网巨头利用自己强大的数据优势和丰富的内部应用场景,提升自身业务场景的增值服务,如阿里巴巴的淘宝拍立淘、腾讯优图在手机QQ与微信的应用、今日头条的短视频甄别等。
AI头部初创企业近年来融资动作频繁,受到长期资金市场的青睐,在资金方面暂无瓶颈,然而面临互联网巨头的挑战,商汤等初创企业或应依托已有的独立设计算法的能力,构建平台型解决方案,在研发能力与方案落地速度上取胜。
AI头部勇于探索商业模式的公司布局思路各异:在商汤、旷视、深兰等头部企业看,各家战略思路差异明显。商汤致力于构造平台,专注底层基础应用,力图在完善平台后于其他领域快速落地。旷视则在致力于在安防、金融、零售、汽车、教育等广泛领域提供软硬件一体化的解决方案。深兰则表现出对无人驾驶、智能机器人,生物智能,AI芯片等领域的专注深耕,依托产品化、工程化能力深入落地。
经过一年多的发展,各个公司依据自己资源禀赋的不同,企业战略出现了分化,经过市场的锤炼,在AI领域必将出现下一个BAT。
商汤科技成立于2014年,员工人约2,000人。主体业务是计算机视觉技术和深度学习算法,创始人汤晓鸥是全球知名人工智能学者。2001年,他建立了香港中文大学多媒体实验室,现任香港中文大学信息工程系系主任。
Parrots是商汤自主研发的深度学习平台。这样的平台包括商汤多年积累的算法库,以及支持超深的网络规模、超大的数据标注及训练的软件开发平台。
加上其自主搭建的深度学习超算中心,大大加速了深度学习训练和算法模型的迭代速度。这样的平台及技术上的支持,将让研究人员的工作更为聚焦。这是商汤能够同时赋能十几个行业的强大基础。
AI赋能智慧安防,SenseFoundry保障城市安全。安防是AI重要的落地场景,SenseFoundry是商汤为智慧城市专门开发的城市级超大规模视频分析平台,它可以扩展至10万路级别、千亿级别非结构化图像特征分析处理,可以对人脸、行人、车辆、非机动车进行识别和分析。
同时,该平台能够直接进行自我训练,利用业务过程中累积的数据,通过训练系统,自动提升技术指标。该平台可以轻松实时监控100万人脸,并对长达数月的千亿级数据来进行轨迹还原。目前,公司已在深圳成功部署SenseFoundry平台。
AI赋能2C端,手机及娱乐互联网行业受益。针对手机行业,商汤提供SensePhoto图像处理方案,基于深度学习,帮助智能终端实现人脸解锁、人脸检测、照片背景虚化等功能。
商汤已与众多国内厂商建立合作,比如VivoX20,OPPOR11s均利用了商汤的技术,面部识别迅速,用户点亮屏幕瞬间就可以解锁。针对娱乐互联网行业(短视频、直播等),商汤SenseAR识别和绘制能力已从“脸部”扩至“全身”,能轻松实现对手势、肢体动作的全方位精确描述和跟踪,成为互联网娱乐领域的“黑科技”,比如主播做出心形手势,屏幕则会出现爱心气泡。
截止2018年初,SenseAR为接近200家国内外App提供服务,占亚太市场的80%,每天服务10亿以上互联网终端客户。
2011年10月,旷视科技在北京中关村成立。创始人印奇、唐文斌毕业于清华大学姚期智计算机科学实验班。公司现任首席科学家孙剑是前微软亚研院首席研究员,公司正式员工约1,400人。
旷视科技是一家“端到端”的AI+IoT解决方案提供商,旗下拥有全球最大的人脸识别开放平台Face++和第三方人脸身份验证平台FaceID。
深兰科技是一家图像识别领域公司,成立于2014年10月,始终致力于人工智能基础技术探讨研究和应用开发,为零售、生物智能、无人驾驶等领域赋能。
智能零售是深兰科技切入的第一条人工智能赛道,从2015年开始连续推出多款有关产品和解决方案:2015第一家无人零售店店,2016年发布“quiXmart快猫智能零售系统”,2017年6月发布“AI自贩柜”,2018年初推出办公室货架的升级产品“小兰系列”。
深兰科技认为基于动态视觉解决方案的无人货柜,相对于传统自动贩卖机的优势主要有以下两点:
一方面升级用户购物体验,在购物过程中让用户都能够近距离感受商品再支付,另一方面不限制商品形状,可以丰富商品品类,扩展无人零售柜的应用场景范围,如贩卖鲜食等。在技术层面,深兰科技采用动态视觉技术,解决了静态视觉解决方案限制货柜货品摆放数量,导致填充率低的问题,将坪效提升了3-4倍。
除此之外,深兰科技无人货柜增加智能异常行为检测功能,可以检测用户出没出现不符合购买行为的其他动作,辅以人工判断,通过蚂蚁信用分和深兰支持的别的产品(办公楼闸机、公交付费系统)约束用户行为,降低无人货柜货损率。
据公司提供数据,目前深兰科技的无人零售业务已与蒙牛、伊利等品牌合作,并已有相关这类的产品落地。
深兰科技在生物智能领域深耕手脉识别技术,使用近红外摄像头捕捉手掌血管分叉点,基于这一生物特征形成数字编码作为用户的唯一加密ID,进行用户身份的识别。由于手脉识别基于人体内部的血管生长特征,无法被仿冒和复刻,相比主流的人脸识别和指纹识别有更强的安全性。
目前,深兰科技的手脉识别技术已应用于深兰闸机、深兰结算台等产品中。2017年2月基于该技术,公司联合蚂蚁金服推出“takego结算系统”。
据公司介绍,深兰闸机已经被确认为上海智慧城市底层技术,未来将会应用于地铁、公交、酒店、校园、写字楼等场景,代替门禁、公交卡等终端,最终实现城市“一手通”。由于实现手脉识别前端需要红外摄像头这一硬件设备,目前公司产品主要依赖进口,成本比较高。远期来看,公司有意基于国内的低成本红外摄像头,进行自主改造升级,实现硬件国产替代。
无人驾驶深兰科技采用主流的计算机视觉与多传感器融合的自动驾驶解决方案,为城市公交车和移动零售赋能。
深兰科技认为,未来城市公交场景和零售业务可以深度结合,提供公交车上的零售服务,在无人驾驶技术的助力下,司机可以兼职移动零售销售员、公交车服务员等。在移动零售领域,深兰科技配合“叮咚打店”APP提供叫店服务,发布芭提雅无人零售车,为广大购买的人提供随时随地的购物服务。
依图科技由加州大学洛杉矶分校统计学博士朱珑、前阿里云计算专家林晨曦联合创办。2012年成立至今,依图科技致力于AI创新性研究,战略定位十分清晰,在行业布局上收敛,深耕安防与医疗领域。
安防领域:占据公司营收的八成以上。目前,依图安防领域误报率已达百亿分之一,其“蜻蜓眼TM”平台已应用于中国多地省市区公安系统。
着力提升产品化与工程化能力。通过访谈,依图认为在计算机视觉当前的ToG、ToB阶段,要塑造起算法、产品化、工程化、商务能力均优的总实力,并强调产品化、工程化能力的重要性。
依图科技已经与北京协和医院、华西医院、浙江省人民医院、复旦大学附属肿瘤医院等多家顶级三甲医院合作,推出了care.ai医疗智能全栈式产品解决方案,为医院提供跨科室的多场景应用系统和数据分析平台,同时积累了海量的医疗大数据处理经验。
目前,依图科技主要从单病种任务层级、跨学科诊断层级、临床路径优化层级三个层级解决医疗行业痛点。
1)单病种任务层级:依图科技单病种已覆盖乳腺、肺、心血管、脑科学等多门类,开发的肺癌影像智能诊断系统现在已达到敏感度95%以上,医生采纳率92%以上,提高了医生的阅片效率。
2)跨学科诊断层级:依图科技利用系统基于先进NLP技术和机器视觉算法,对病历、病理(例:化验结果)、医疗影像(例:CT影像)等多模态数据来进行结构化和深度解析,以满足科研、临床、教学、管理等多场景需求。
3)临床路径优化层级:2018年,依图科技联合腾讯睿知和广州市妇女儿童医疗中心,推出“问诊熊”导诊小程序。医生可直接读取查询码读取病患病情,提高双方效率。
云从科技是中科院重庆研究所孵化的计算机视觉与人工智能科技公司,成立于2015年4月,创始人周曦博士师从四院院士、“计算机视觉之父”黄煦涛,带领团队多次获得计算机视觉国际比赛冠军。云从科技也参与了人脸识别国家、行业标准起草与制定。
目前,云从科技是中国银行业人脸识别第一大供应商。为积极推动中科院与公安部的全面合作,推出火眼大数据平台、铁路人证票核验系统、生物识别引擎、智慧鉴身产品簇和集成生物识别系统IBIS等一系列应用系统平台。
另外,云从科技推出人脸互动大屏终端,智能门禁、人脸动/静态业务应用平台服务器、刷脸自动售卖机等多款智能硬件,结合云从自由技术,满足多种场景下的需求。
2018年3月,云从与全球最大芯片制造商intel合力打造推出“炬眼”智能人脸识别相机,可识别相机全面分析处理实时画面,识别出人脸后将“人脸图像”转变为“特征数据”再传回中央系统。
扩博智能2016年11月由严治庆等设立,总部在中国上海,在北京和大连设有分支机构,在新加坡设有分公司,美国西雅图设有研发中心。主体业务是利用计算机视觉技术为风电、零售和运营商等传统行业公司可以提供端到端一体化智能服务。
视觉+风电:为解决风电行业风机叶片巡检和设备寿命管理问题,扩博智能推出了扩博博云平台。利用搭载了计算机视觉技术的智能无人机,对风电设备做无人智能化巡检,帮助传统风电企业推动设备资产精细化管理,提高运营效率。智能巡检平台可提
高风机叶片巡检效率40倍,且识别率达95%。视觉+零售:零售行业中,存货管理、经营销售的策略等问题对商品销量、单客购买力有很大影响。
扩博智能为零售领域打造了线下零售实时智能监测平台扩博智维,利用视觉技术采集货架商品信息,通过结构化技术处理数据,并整理分析产生量化数据,对存货和商品进行实时追踪,帮助零售商实时掌握产品动态、分析销售数据,来提升重复购买率和产品销量。
视觉+运营商:通过扩博智能研发的无人机数据即服务平台,通信运营商利用自身的LTE网络即能向无人机客户提供定制的模组、网络、平台一体化方案。
上一篇:盘点]让机器看懂世界 计算机视觉公司Top10 下一篇:计算机视觉的兴起与发展趋势