2014年9月19日,曼哈顿华尔街11号的纽约证券交易所内挤满了人。中国互联网巨头阿里巴巴集团这一天公开上市,并且创下美国历史上融资规模最大的IPO记录。阿里巴巴把它变成了一项盛事,公司的高管、主要投资人和来自全球的媒体都聚集在这个地方。马云说:“梦想总是要有的,万一实现了呢。”于是,整个中文社交网络都被这句话燃起了热情。
不过,对这家公司而言,声势浩大的IPO还有一个顺带的好处:它的全球影响力的增加带来的对顶尖科技人才的吸引力。实际上,普渡大学计算机系和统计系的终身教授、后来蚂蚁金服的首席数据科学家漆远,当时就同阿里巴巴的CTO王坚一起参加了阿里巴巴的IPO活动。
在纽约的上市活动结束之后,阿里巴巴紧接着就在硅谷宣布成立一个新的部门:iDST(数据科学与技术研究院institute of Data Science&Technologies)。同时,在美剧《硅谷》第二季的片头,阿里巴巴的名字和Facebook、Google、Uber、甲骨文等一起出现。
不过,似乎没有人能描述出iDST的职责和它对公司的作用。它的名字表示它要研究数据科技——此前,马云已经把下一个时代命名为DT时代,也就是数据科技时代。但一个单纯的研究院显然对一家商业公司作用不大。商业史上两个最成功的企业研究部门是贝尔实验室和施乐帕罗奥托研究中心,事实证明它们虽然对技术的进步贡献卓著,但对自己的公司却没有太大助益。当然,它们为公司博取了名声。不过,如果是为了公关效果和提升股价,iDST却几乎从来没有公开在媒体上露过面。
iDST的两位创始人之一漆远,1995年时开始做人工智能与机器学习,并应用于指纹和人脸的检测与识别,大脑成像分析,及银行用户行为监控等领域。2005年他就在麻省理工学院开发大规模机器学习系统使用海量CPU并行分析人类基因组数据,解码生物基因组与基因调控网络,2008年开始研究今天让英伟达(NVIDIA)股价飙升、成为人工智能领域重要玩家的GPU芯片,做机器学习加速。后来王坚回忆说,他想要招揽漆远加入阿里巴巴组建iDST,同时把当时蚂蚁金服的总裁井贤栋和蚂蚁金服的CTO程立介绍给漆远。聊完之后,王坚说:“我也吃惊他真的非常果断就来了”。
王坚对漆远说,阿里巴巴是坐在金山上啃馒头。金山是阿里巴巴拥有的丰富数据,这些数据的价值并没有被挖掘出来,“数据就是土壤,但如果在这片土壤上没有盖起大楼,土壤本身就没有价值。”因此,建立超大规模机器学习平台这个伟大的任务,“就交给你了”。6年前,在游说王坚加入阿里巴巴时,当时阿里巴巴的首席人力资源官彭蕾说过类似的话,阿里巴巴的平台上产生了丰富的数据,但公司却拿它束手无策,“希望你(王坚)来拯救我们。”
IDST的另一位创始人金榕是美国密歇根州立大学终身教授,曾获得过美国国家科学基金会奖(漆远也获得过该奖)——有超过200位诺贝尔奖得主都获得过这个奖金的资助。正式加入阿里巴巴的iDST之前,他曾在阿里巴巴旗下的互联网广告平台阿里妈妈做过一年的技术顾问,帮助解决一个大规模算法优化问题,把广告展示的收入提高了15~20%。此前金榕从未在工业界工作过,“对我来说,是第一次感觉理论的东西原来可以改变生活”。
那一年的顾问生活非常美好。他没有固定的上下班时间,公司的业务人员对他尊敬有加,而他又能看到自己的理论影响现实并且创造收益,“我以为产业界科学家的生活一直都是如此”。于是,当王坚发出邀请之后,虽然对要在两个国家之间频繁旅行感到犹豫,金榕还是接受了这份工作。
不过,这两位雄心勃勃的科学家,将会很快感受到,“理论的东西改变生活”并没有那么容易。
金榕在IDST的第一个工作任务,是帮助聚划算做算法优化。他用“很辛苦”来概括那一段工作的状态。