融资6亿美元背后:解密商汤的科技“硬核”丨我有嘉宾付费阅读
我有嘉宾 · 2018-04-17
摘要
你看过科技展上的安防系统演示吗?监控探头下熙熙攘攘的十字路口,6条车道上的各色车辆以超过20公里的时速交错穿行,电脑系统通过快速捕捉和识别,实时在屏幕上显示这些车辆的型号、牌照号、车主信息,行人的性别、出行方式,甚至身份证号。
如果不是亲眼看见,肯定以为那是几十年后才有的事件,至少在电影《鹰眼》里,那是21世纪中期才有的技术。可这项技术现在就已经被一家中国公司发展到可以成熟应用的程度了。数据屏幕的左上角,显示着这家公司的名称,SenseTime商汤科技。
从成立伊始,商汤科技就在以外人很难读懂的步伐规划着未来。直接从只有谷歌这类巨头才会做的底层技术起步,公司刚刚开始稳住脚跟,他们又宣称要将人工智能技术应用于上百个行业,并把触角伸向了海外,如今这些曾经被外人怀疑的计划都已经成为现实。
上周,商汤科技公布了新一轮6亿美元的融资。这使它的估值超过了45亿美元,成为全球估值最高的人工智能创业公司。创立仅3年多,就已经垄断了150多位人工智能深度学习方向的博士,拿下了国内外400多家行业头部客户,连续3年间,业务年化增长超过400%,而且还在不断刷新着人工智能领域的融资记录。
如今,当多数人仍在怀疑AI技术的商业化落地和造血能力时,公司的创始人、CEO徐立已经有足够的资本为自己站台。他在此次融资后接受采访时说,世界会变成一张由大数据编织的网格,拼凑出群像和每个人的画像。在机器的作用下,人类对自己和周围世界的认知可能会变得前所未有的清晰。一个在数据和算法主导下高效率运转的社会,未来可期。
硬核的科技公司
这些年风口一个接着一个,在雷军那句“风口上的猪都能飞”的经典论断之下,动辄几十亿的估值已经不是什么新鲜事了。但是在AI这个行业,风口虽然一直都在,但在变现和技术落地的压力之下,风从来没有真正大起来,在这个行业里能快速成长的,凭的都是硬实力。
自商汤科技创立的2014年开始,人工智能领域一直都是投资热点,商汤科技的竞争对手当时就包括了旷视科技(Face++)、依图科技、格灵深瞳等等。
2017年7月,商汤科技获得的B轮融资达到4.1亿美元,创下当时AI行业最高单笔融资纪录,在那前后的AI行业融资虽然都很大,但跟商汤科技远不是同一规模,当年5月,依图科技获得3.8亿元人民币的C轮融资;再早一点,旷视科技的C轮融资,也“仅”有1亿美元。
当时投资圈就说,单看商汤科技的收入其实无法撑起这样的估值,但是团队背景以及这个团队做出的产品已经足以成为被投资人看重的成绩。而从创立初期开始,商汤科技一直都有着一个纯粹的“硬核”科技团队。
2014年年中,独具慧眼的IDG资本合伙人牛奎光看到了一篇计算机视觉论文,这篇论文由香港中文大学汤晓鸥教授领导的研究组发表。从这个论文上可以看到,这个小组当时开发了一个名为DeepID的深度学习模型,在数据库上获得了99.45%的识别率,超过了人眼识别的精准度,在计算机领域,也超越了Facebook的同期算法。
仔细搜索这个实验室的资料,他还发现,2011年至2013年期间,全球计算机视觉ICCV/CVPR顶级会议中,深度学习领域有29篇顶会论文,汤晓鸥团队占了14篇。牛奎光立即飞到香港,拜访汤教授。这次拜访被传为佳话,也成为商汤科技这家公司成立的基础。
2014年10月15日,商汤科技正式成立。11月,公司即宣布获得IDG数千万美元A轮融资。公司创始团队即是汤晓鸥实验室的博士,其中包括在这里读博士3年,博士后驻站3年的徐立。
这个团队的强大之处,从他们所获的荣誉就可以看得出来。2014年9月,商汤科技创始人之一的邱石博士等人首次出征ImageNet竞赛,在大规模物体检测比赛中就以40.7%的成绩荣获世界亚军,成绩仅次于谷歌的43.9%。
ImageNet竞赛是人工智能领域的权威竞技场,斯坦福华裔学者李菲菲(FeifeiLi)为视觉领域收集了大规模“图像分类和物体检测”的数据集。该数据集最初包括一个1000类图片分类的任务,后面又增加了200类静态图片物体检测任务。但凡在计算机视觉领域要证明自身实力,参加ImageNet竞赛几乎成必选项。
次年,ImageNet竞赛新增一项视频物体检测的任务,视频是连续的图像,比静态图像中的物体检测复杂度更高,商业价值也更高,举例来说,一旦可将视频中的所有物件识别出来,品牌商就可按物体搜索,进行定向的品牌植入。
在该项新任务的比拼中,赛事主办方选择了30类别的物体,成立不到1年的商汤科技联合香港中文大学多媒体实验室组成的团队,在28个类别中准确率最高,整体准确率62%,也远高于第二名的51%,以压倒性优势领先,实现夺冠。
高筑人才与硬件壁垒
由于落地端被大众所接受,因此经常有人把商汤科技定义为一家人脸识别公司,但创始人徐立非常不认同这种标签,他总强调,“我们是中国拥有原创技术的人工智能平台公司,不是一家人脸识别公司。”实际上,目前公司只有一小部分员工在做人脸识别,大部分的研发人员在搭建深度学习的平台化能力。
在深度学习方面,行业里早已有成熟的框架,国内绝大多数AI公司使用谷歌、脸书等人工智能开源框架Tenserflow和Torch。但商汤却从一开始就砸钱自己搭建底层框架。这就如同一家手机行业的公司宣布,自己既不用IOS技术也不用安卓,而是另开发一个系统。
2014年到2016年,正是中国的AI产业起飞的年代。商汤科技并没有把最初的思路用在造血、变现或者是流量方面,而是专注于打造自己的核心优势,高筑壁垒。公司最初的融资,被用在两个方面,一是硬件建设,二是广纳高级人才。
2014年,公司初创时没有超算中心,这对于人工智能公司来说,等于缺少最基础的生产工具。可这超算中心并不是所有公司都建得起的。到B轮融资之前,公司已经建起了6000多块GPU的超算中心,每块英伟达GPU的采购价格是3到4万。
这还不是最花钱的部分,商汤研究员闫俊杰博士曾做过估算,在超算中心里按下那个标有“Run”字样的按钮,一次数据训练迭代整体花费至少50万元。徐立说,“而我们有150多个博士天天都需要在算法平台上按run,这还不算每年追加的数亿元GPU集群采购预算。”
另一方面,徐立早就意识到人才对于公司发展的重要性,所以商汤科技默默布局了这场人才争夺战役,让自己成为“人才垄断战”中的领跑者。
“在公司成立前后,那个阶段上我们做的很关键的一点,就是把圈子里能够找到的,这个方向上的研究生、博士生都招进来,全部聚集在一起,形成了一个大的人才圈。2015年3月,阿尔法狗打败李世石之后,大家注意到了人工智能,这时候再想去做布局,发现市场上已经没有人了,再招一个本科生,还需要再培养几年。”徐立说。
如今这150位深度学习领域的博士已经成为商汤科技最有价值的资产。但在当时看来,徐立主导的这两笔投入,都是极为冒险的行为,成立近一年的商汤科技“基本上没有收入”,公司一度面临资金链断裂的风险。
投入终归会有回报,2015年初工信部出台规定,要求到年底,电话用户实名登记率要达到90%以上,而中国移动当时尚有1.3亿用户未进行实名认证,如果完全采用线下认证的方式,营业厅将会面临巨大的压力。
中国移动决定建立线上实名登记认证系统。商汤科技参与投标的人回忆,这是他见过的最严格的一次招标。大多数招标中的技术评比,都是各自把技术讲解比较一下,就进入到了商务报价,但中国移动这次要求投标的企业把服务器、训练平台都拿到招标现场,中国移动提供100万业务数据,直接在现场进行训练,“相当于组织了一次学术竞赛。”
将近1个月后,结果终于出炉,此前“籍籍无名”的商汤胜出,并与中国移动达成了长期合作。
通过与中国移动的合作,不仅缓解了公司的资金压力,而且迎来了商业化的开始,商汤科技的人工智能技术与金融、安防、互联网娱乐、AR、智能手机等条线开始真正启动。
商汤科技的案例证明了,一个真正有实力的公司是不用为变现发愁的,把自己的核心优势做足,获得客户便是水到渠成的事。徐立自己也说,当别的公司无法抄袭你的时候,他们就会购买你的技术了。
从机场和金庸小说里学习管理
徐立很少谈及自己的成长经历。在众多采访者的眼中,徐立都不像一个典型的IT创业男,他是个精力充沛,想象力无穷无尽,嘴里不时蹦出最新流行词汇的年轻人。但在这层表象之下,他同时又有着诸多让人咋舌的标签:拥有十余年计算机视觉、模式识别、图像处理领域的研究和产品开发经验,在视觉领域国际顶级会议、期刊上发表论文50余篇,被业界评为“创新商业领袖”。
在他的带领下,商汤科技在短短三年间,凭借在人脸识别、图像识别、自动驾驶、人机交互、医疗图像、人工智能芯片等多个领域的领先技术,成为计算机视觉界的领航企业。
一个刚走出大学的博士生,何以成为一个富有远见的高科技企业领袖。徐立自己说,对他影响最大的两个人分别是自己的父亲和作家金庸。
在徐立的眼中,父亲是一个敢于冒险,勇于走在时代前沿的人。“父亲很多事情都是他自学的。早年父亲在国企,在外人眼中已经捧上了铁饭碗,但他后来毅然选择去了外企,做外企的第一批工程师,然后又出去创业,其实他走的是一条很有创新精神的路。”徐立认为,父亲对自己有很大的影响,但在他整个学生时代,是“没有人管的”孩子。
为了高中有一个好去处,“没有人管的”徐立做了他自认为“现在想起来都好笑的事情”,但这却无意间成为他命运的关键转折点。要想进好的中学,除了成绩好外,还要另辟蹊径,当时有一个办法是参加竞赛,获得直升名额或者其它通道。“我几乎参加了学校所有的竞赛。”
由于竞赛成绩都非常优异,所以徐立进入了复旦大学附属中学——上海最好的高中之一。
关于学生时代对自己人生产生的重大影响,徐立认为:“第一不信权威,很多情况都是自己探索。第二个是培养自己的自信心,这一点很重要。”
作为一名学习计算机视觉如此“专业而冷僻”的理工男,徐立常会被问道:“作为一个技术出身的人,转到管理岗,管理经验从哪里来?”他表示,自己的管理经验有两个来源,一个是“机场管理学”,一个是“金庸管理学”。
徐立说,“误机的时候,我就看机场书店里的各种管理学书籍,还有各种商业大佬,如马云、柳传志、王石等人的视频,翻来覆去地看,所以我觉得机场是个好地方,我的管理经验一部分来源于此。”
学以致用也是徐立擅长的事情。徐立小时候还是个“金庸迷”。“金庸的书,这么多年看下来,便也有了心得。”徐立称之为“金庸管理学”。
完成6亿美元融资后,徐立将对这笔钱的使用比喻为“存钱模式”,存钱是指如何建立自己的壁垒,怎样获取更多利润。而存钱是为了做两件事:水平做产品,垂直做打通。用产品矩阵覆盖市场的同时,在垂直产业链里进行深度整合。