2014年9月19日,曼哈顿华尔街11号的纽约证券交易所内挤满了人。中国互联网巨头阿里巴巴集团这一天公开上市,并且创下美国历史上融资规模最大的IPO记录。阿里巴巴把它变成了一项盛事,公司的高管、主要投资人和来自全球的媒体都聚集在这个地方。马云说:“梦想总是要有的,万一实现了呢。”于是,整个中文社交网络都被这句话燃起了热情。
不过,对这家公司而言,声势浩大的IPO还有一个顺带的好处:它的全球影响力的增加带来的对顶尖科技人才的吸引力。实际上,普渡大学计算机系和统计系的终身教授、后来蚂蚁金服的首席数据科学家漆远,当时就同阿里巴巴的CTO王坚一起参加了阿里巴巴的IPO活动。
在纽约的上市活动结束之后,阿里巴巴紧接着就在硅谷宣布成立一个新的部门:iDST(数据科学与技术研究院institute of Data Science&Technologies)。同时,在美剧《硅谷》第二季的片头,阿里巴巴的名字和Facebook、Google、Uber、甲骨文等一起出现。
不过,似乎没有人能描述出iDST的职责和它对公司的作用。它的名字表示它要研究数据科技——此前,马云已经把下一个时代命名为DT时代,也就是数据科技时代。但一个单纯的研究院显然对一家商业公司作用不大。商业史上两个最成功的企业研究部门是贝尔实验室和施乐帕罗奥托研究中心,事实证明它们虽然对技术的进步贡献卓著,但对自己的公司却没有太大助益。当然,它们为公司博取了名声。不过,如果是为了公关效果和提升股价,iDST却几乎从来没有公开在媒体上露过面。
iDST的两位创始人之一漆远,1995年时开始做人工智能与机器学习,并应用于指纹和人脸的检测与识别,大脑成像分析,及银行用户行为监控等领域。2005年他就在麻省理工学院开发大规模机器学习系统使用海量CPU并行分析人类基因组数据,解码生物基因组与基因调控网络,2008年开始研究今天让英伟达(Nvidia)股价飙升、成为人工智能领域重要玩家的GPU芯片,做机器学习加速。后来王坚回忆说,他想要招揽漆远加入阿里巴巴组建iDST,同时把当时蚂蚁金服的总裁井贤栋和蚂蚁金服的CTO程立介绍给漆远。聊完之后,王坚说:“我也吃惊他真的非常果断就来了”。
王坚对漆远说,阿里巴巴是坐在金山上啃馒头。金山是阿里巴巴拥有的丰富数据,这些数据的价值并没有被挖掘出来,“数据就是土壤,但如果在这片土壤上没有盖起大楼,土壤本身就没有价值。”因此,建立超大规模机器学习平台这个伟大的任务,“就交给你了”。6年前,在游说王坚加入阿里巴巴时,当时阿里巴巴的首席人力资源官彭蕾说过类似的话,阿里巴巴的平台上产生了丰富的数据,但公司却拿它束手无策,“希望你(王坚)来拯救我们。”
IDST的另一位创始人金榕是美国密歇根州立大学终身教授,曾获得过美国国家科学基金会奖(漆远也获得过该奖)——有超过200位诺贝尔奖得主都获得过这个奖金的资助。正式加入阿里巴巴的iDST之前,他曾在阿里巴巴旗下的互联网广告平台阿里妈妈做过一年的技术顾问,帮助解决一个大规模算法优化问题,把广告展示的收入提高了15~20%。此前金榕从未在工业界工作过,“对我来说,是第一次感觉理论的东西原来可以改变生活”。
那一年的顾问生活非常美好。他没有固定的上下班时间,公司的业务人员对他尊敬有加,而他又能看到自己的理论影响现实并且创造收益,“我以为产业界科学家的生活一直都是如此”。于是,当王坚发出邀请之后,虽然对要在两个国家之间频繁旅行感到犹豫,金榕还是接受了这份工作。
不过,这两位雄心勃勃的科学家,将会很快感受到,“理论的东西改变生活”并没有那么容易。
金榕在IDST的第一个工作任务,是帮助聚划算做算法优化。他用“很辛苦”来概括那一段工作的状态。
用算法来提升聚划算的GMV(商品交易总额)在技术上并不困难。如果想要提升交易量,那么,只需要把价格低的商品排列到搜索结果和推荐选项的前列。低价总是可以刺激购买。但是,如果在排序和推荐上,出现的总是更低价的商品,这就意味着网站吸引来的目标用户群,其收入水平在不断降低,“用户从二三线城市一直掉到四五线城市,整个内涵完全变了”。不过,如果要提高优质高价产品在推荐和排序中的权重,交易量和成交总额又会下跌。
这就是金榕和他的团队开始面对的两难:“你帮业务团队把GMV提升了,大家还是会认为这不是个有价值的事情。”如果你不能帮助业务团队把GMV提升,那好,你连可见的有价值的贡献也没有做出。可是,“到底怎样才是有价值的事情,没有人有确切答案。”
每一次会议都陷入僵局。业务部门挑战来自iDST的技术诸神,他们是否真的能够理解这家公司正在做的事情,并且用技术来帮助业务团队实现目标。从未在公司工作过的技术先知们对这种挑战茫然失措。直到两年多后,文质彬彬的金榕才意识到:首先,挑战姿态是阿里巴巴这家商业公司的业务团队一贯采取的方式,他们希望的是同样强有力的回应;其次,当时聚划算面对的情况,更像是希望能够完成商业模型的转换,“在整个集团看来,科技并不是算算数字,并不是只要把点击率提高,它想要能够把商业模型做好”。
有一次,碰到当时阿里巴巴集团的COO张勇(花名逍遥子),金榕说,他希望能够把技术团队融合到业务团队中,“以真实的业务场景为出发点,去考量和认知(技术)”。
漆远面对的是一种类似于“二十二条军规”的境遇。王坚交给他的任务是建立超大规模机器学习平台。他把自己的核心团队放在了北京的阿里妈妈办公室。这些一直生活在21世纪互联网时代的技术精英,马上就体会到19世纪蒸汽机时代的生活,“站在窗前看不到对面的楼,我们自己买了空气净化器,人人发口罩,在室内也戴着口罩工作”,“这是非常恶搞的生活,像故事一样”。
到了2月份,整个公司都要做新财年的战略规划。在漆远的设想中,他要建立的大规模机器学习平台可以同时为阿里妈妈和天猫服务。他向集团CTO王坚提交了一份申请几千台服务器的计划。但在讨论之后被公司否决了。
在阿里巴巴,每一位新加入的同事都有一位mentor(导师)。mentor会帮助新同事更加顺利地融入到这个以强价值观闻名的公司。漆远的mentor正是整个阿里巴巴集团价值观的最重要守护者之一,同时兼任阿里巴巴首席人力资源官和蚂蚁金服CEO的彭蕾。彭蕾在2月份找漆远聊了一次,告诉他业务部门对他的观感:“听说他们觉得你一不懂业务,二不懂痛点……”
他遇到了一个“鸡生蛋和蛋生鸡”的问题:如果没有服务器,他的团队没有办法验证自己的算法和程序;但是公司不能批给他服务器,因为他不能证明自己的算法和程序更好;他不能证明自己的算法和程序,因为他没有服务器可以跑程序;他没有服务器可以跑程序,因为他不能证明自己的算法和程序……
在一连串的挑战下,到了2015年的7月,iDST的人马分成了三个部分:漆远和几位同事加入蚂蚁金服;金榕和他的团队加入了淘宝和天猫的搜索部门; 漆远做语音的团队留在了阿里云。IDST这个名称仍然保留,只是从直属集团,变成阿里云下的一个部门。
这只是大公司内的寻常场景:即使是公司内的研究机构,也有可能找不到技术的落地场景,得不到同在公司的业务部门的认可。在向技术的跃进和帮助技术找到应用之间,存在着一道玻璃城墙。要击碎这道城墙,需要更多策略和耐心。