快好知 kuaihz

计算机视觉究竟是个怎样的行业?

  5月1日外媒消息,微软刚刚发布了 Windows Vision Skills 的预览版本,是一个 NuGet 包集合。

  微软显然在试图让开发者通过一组简单的API,去解决复杂的计算机视觉问题。目前包含的一组 API,适用于实现特定类型的计算机视觉技能,例如骨骼检测器与情感识别器。

  或许未来交友网站将为网上视频聊天的男女提供一项必备增值服务:可以通过对方的表情分析来判断对方的偏好和情绪,这样直男们可以在作死的边缘及时刹车,以免由于莽撞毁了自己终身幸福。

  

  当然,微软的这个做法,是作为一个平台去给独立的开发者赋能。相比之下,中国国内的各家计算机视觉公司,则大多在各自选定的领域越扎越深。

  例如,华为的AI研究中心“诺亚方舟实验室”,正在六个方向上苦苦探索:底层视觉、3D视觉、语义理解、数据生成、视觉计算、视觉与多模态的融合;旷视科技的志向是基于人脸识别来构建城市级智能物联网系统;腾讯优图目前给杨姐印象最深的应用就是帮助失散儿童找到亲生父母以及远程医疗看片子——目标应该是远程医疗这个巨大的市场。

  当然,还有众所周知的AI独角兽头部企业商汤科技,这家公司已在2018年融到C+轮总共超过16亿美元的融资。

  商汤在中国的AI计算机视觉领域里一直是一家独特的存在,融资额最高,落地性最强,产学研的体系最成熟,无论从技术上还是市场上,都有自己的发展路径。

  当然,行业里还有别的很多同样做计算机视觉的公司,这里我们不多说了。

  目前中国现在的计算机视觉技术已经过了前期埋头只开发技术的阶段,而是到了第二个阶段:落地和打造平台化优势的阶段了,这里我们举个商汤科技的例子。

  吹技术没有用,落地才算有价值

  FaceU的变脸技术大家已经熟悉:变脸、加特效、搞美颜……据了解,亚太市场80%以上的短视频、相机、直播APP用的都是商汤的技术。不过恐怕很多人并不知道商汤科技还干了些什么。

  在这里,杨姐可以提醒大家注意,未来尽量找那些使用了AI卫生管理技术的餐厅去吃饭,因为那样你吃的东西安全性会相对高一点。为什么呢,因为商汤科技搞了一套专门给餐厅用的SenseKitchen智慧餐厨卫生预警系统。

  听这个名字就知道了,是一套专门针对餐厨场所合规性分析的智能视频分析产品,可及时发现餐厨违规行为和卫生问题,比如说,厨师带没带口罩,有没有穿工作服戴厨师帽,甚至餐厅里有没有老鼠这个系统都能“看出来”,并且能智能预警,提高监管效率,降低人工审查成本。

  坦白地说,其实2018年市场监管总局就发布了《餐饮服务明厨亮灶工作指导意见》,但是大家用脚趾头想也知道,即便餐厅里有个大屏幕直播后厨,又有谁能一直盯着看呢,而且如果按照每门店4路视频计算,一天的存储需要消耗至少1G的资源,多数为本地离散存储,边缘端存储成本高。

  据说商汤的这套预警系统已在上海、内蒙应用落地,江苏也即将上线应用,仅上海静安和杨浦区就覆盖百家餐厨,所以未来希望商汤公司也能搞个标志——“商汤舌尖保障之眼”啥的……挂餐厅门口,估计大家就会安心许多。

  再举个栗子:“道路千万条,安全第一条,行车不规范,亲人两行泪”大家都是很熟悉的,但却总有人不那么自觉。

  商汤想了个办法,他们搞了一套司机监控系统——SenseDrive DMS。这个系统的最大功能就是通过扫脸来判断司机是不是疲劳了,开车有没有分心,还能对司机的身份进行识别。试想一下,如果滴滴要求所有快车司机都装一套,是不是还能判断出是不是有人借别人的车接活?

  

  目前遍布上海各区域的上百条“驿动班车”线路中,已有38条线路车辆完成了应用这套系统的智能化改造

  但是,以上仍然还只是小意思,接下来姐给大家讲个斗智斗勇的故事,非常有趣。

  要斗智斗勇 不要伪需求

  大家都知道房地产这个行业成交金额大,但是恐怕很多人不了解,房产中介和房地产公司自己销售提成是不一样的哦!

  一般来讲,房地产公司在开一个新的楼盘时会同时安排销售员和中介进行销售,楼盘销售员的销售提成较低为0.1%-0.5%,而房产中介的销售中介费就比较高,大约能到3%-4%。这里面可就有了10倍左右的空间。

  假如一套房子100万,如果是房产公司的销售人员卖出去,至多赚几千,而中介就能多赚个三四万。这样的不均衡也就造成了售楼销售员与中介之间逐渐达成了“潜规则”,对销售员来说最好的选择当然是把房子交给中介卖,然后两个一起分更高的提成了。

  这件事肯定很令房企不开心,地产行业里称之为“飞单”。但是不开心也没用,如何识别出这种不规范的黑行规绝对是“不可能完成的任务”。然鹅,这件事却让人工智能给轻松解决了。

  商汤科技的办法是,加入基于人脸的身份验证,通过人脸识别和标签化管理来“盯”违规行为,同一个客人再次到访的客户历史明细,到访是否有销售人员陪同,初次到访是否有报备等等,如果系统显示中间异常换人……吼吼,就可以坐下来聊聊了。

  听说商汤这套智慧案场解决方案系统目前已经帮助融创、世茂、奥园、万科等大佬规范了案场销售。截止目前,商汤这个“智慧案场”解决方案已经累计抓拍100多万人次,机拍次数达到4000多万。

  

  商汤科技智慧案场解决方案Demo展区

  所以,大家了解了吧,商汤科技早就不是单纯的“识脸”了,而是利用人脸识别技术为基础,让更多人工智能解决方案巧妙地解决各个行业切身痛点的公司。当然,这并不是一蹴而就的,也不是谁想做就能做的:他们还有自己“挑客户”的原则。

  他们最大的拒绝理由,就来自“真假需求”这个维度。

  举个栗子,空调厂商,不是董明珠阿姨那个哈,曾经跟商汤科技提出个想法,如果能通过人脸识别,给老人自动把空调设成28度,给年轻人设定为24度,温度自适应,岂不是美哉?这个需求就被商汤认为是个“假需求”——如果老人和年轻人在同一个屋子里出现呢,那到底该怎么设定?更何况,这原本是遥控器就能解决的事,真心用不着人脸识别,且不说安装系统的成本相对于带来的方便程度来说,实在太撕裂人心了。

  再举个栗子,比如说一个公园曾经也提了个需求——很多人在公厕里一次拿好多手纸,能不能做个人脸识别的系统,每个人一次最多拿十张?艾玛,面对这个灵魂拷问的要求商汤感觉实在没法答应,虽然这个需求是真的,但在经济上很不划算,因为这套系统的成本要远比厕纸要贵很多倍好么——这个案例其实跟超市里也想用人脸识别来管理存包柜差不多。

  燃鹅,超市却有个不同之处,就是如果安装了人脸识别反馈信息的屏幕,是可以运营这个屏幕用来卖广告的——毕竟来超市的都是有购物需求的人,如果能识别他们,并且根据过往采购需求来推送一些相关广告,肯定是大受广告主欢迎的。

  这个想法不错,据说正在酝酿中——未来还真有可能落地。而在杨姐看来,这绝对是可行的,因为在无人驾驶的公交站上,已经有厂商正在计划通过人脸识别来让站台的大屏幕上进行千人千面的广告推送。

  所以,商汤的未来应该是向着这种针对行业、场景的解决方案提供商发展。而关键的问题是,商汤的解决方案最大的特点在于能够让这些应用场景更加“低成本”。就如同智慧厨房那个案例,由商汤来统一解决云端存储和计算,餐厅无疑最为轻松。

  商汤科技联合创始人、副总裁杨帆认为,任何一个行业或企业自己去做智能化投入成本都太高,只有很少的大公司才搞得起。那么大量的中小公司怎么办?就需要商汤这样的公司来提供平台化的能力,并且可以同时跨很多个行业,70%-80%的能力都是可以共享的,个性化的只需要做20%-30%,这样能够大大降低行业的边际成本。

  商汤的方法论

  商汤身上有三个标签:产学研一体化、打破行业边界和原创型公司。

  相比其他行业,人工智能对于产学研的需求非常高,结合非常紧密。而商汤可以说在产学研的结合方面有自己独特的优势,高校联合、学术体系等,都成了商汤不断加强自己核心竞争力的关键入口。

  比如说去年上海人工智能大会上,商汤联合麻省理工学院、清华大学、上海交通大学、南洋理工大学等全球15所高校共同发起“全球高校人工智能学术联盟”,打造世界顶尖的人工智能学术交流平台,持续推动国际学术交流与人才培养。

  商汤科技还联手麻省理工成立MIT-商汤科技人工智能联盟,共同致力于全方位人工智能原创技术的研发,涉及领域包括计算机视觉、脑科学智能算法、医疗图像、机器人等。此外,商汤与香港中文大学、清华大学、北京大学、浙江大学、上海交通大学等高校也有深度合作,不仅让高校人才深度参与工业界的技术落地研究,也形成了商汤科技人才供给的保障。

  这绝对是一个以“智力”“技术”为生产力的行业,而产学研所带来的人才效应的结果就是——在去年美国盐湖城举行的全球计算机视觉顶级会议 IEEE CVPR 2018 (Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议)上,大会总共录取了来自全球论文979篇,商汤科技一家就有44篇论文入选,全球范围内仅次于谷歌的45篇。

  所以,制造业的核心竞争力是规模优势,但在AI这个领域,真的是产学研能力决定了未来的高度和远度。

  而这个行业的另外一大特征就是“没有边界”!

  人工智能是个全新的行业,各种场景和应用都需要去挖掘。美国之所以领先全球,就在于强大的技术基础和资源实力,不断进行边际的拓展和创新的尝试,而其他国家一直都是跟随者。

  相比其他AI企业,商汤的业务范围可谓是最广,最关键的是这个公司还盈利。而商汤所做的事就是不断深化下沉一些相对成熟的场景,同时更多地拓展新的应用和落地,就像前面杨姐写的那些案例,已经都在各个行业开始深度扎根场景。

  所以,商汤目前所做的事,更像是一家具备强大研发中心和先进制造设备的生产工厂大平台,各种满足不同行业需求、可定制化满足细分场景的人工智能应用和解决方案就像流水线一样,源源不断地被快速生产出来。

  而商汤拓展业务遵循的工具链理论:70%的成熟技术和产品+30%的创新,也成为了其持续打破行业边界,快速满足客户应用需求实现应用落地的关键。所以,计算机视觉这个细分行业里,在很多方面商汤都已经走在了前端。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:竟是  竟是词条  视觉  视觉词条  怎样  怎样词条  计算机  计算机词条  行业  行业词条