要回答这个问题,先从计算角度来分析,从目前人工智能行业的发展情况来看,由于人工智能算法涉及大量的矩阵计算和并行数值计算,下一代计算已经显示出从串行迁移到并行计算的趋势。过去的计算以CPU为代表,主要为串行指令而优化;而未来的计算可能以GPU为代表, 为大规模的并行运算而优化。
软件决定硬件的规律在历史上反复出现,如果大规模的并行计算成为主流,那么支配这些计算的机器学习框架则可能发展成为一个计算的“操作系统”,一个好的机器学习框架背后是一套完整的开发者工具和一个庞大的开发者社区,上层直接和应用层或者其他中间层交互,下面则是与计算设备交互。
援引《纽约时报》的说法,“人工智能时代利害攸关的不在于这些零零碎碎的创新,而是可能控制的一种全新的计算平台。”
以TensorFlow为代表的分布式机器学习框架就是一个很好的例子,Google很明显在不断地开源其深度学习算法,以推动TensorFlow成为工业界的事实标准。TensorFlow是核心,周边的库和框架比如TensorFlow Serving, TF-Slim等都是其生态系统的关键组件。向上对应用和算法,向下对硬件,都保持垂直整合的压力和绝对的统治力,让上下游的公司丧失战略可差别性,并越来越多地依赖核心部件的提供者,成为附庸。
而机器学习框架背后则是一条产业链,但是当产业链中的某一环是垄断时,它就会蚕食整条产业链的大部分利润。
理论上一个垄断的分布式机器学习框架可以左右硬件厂商的命运。往严重说,假设有一天TenslorFlow在业内获得垄断后决定渐渐放弃GPU支持,转而或者倾向于支持TPU的优化,那么英伟达等GPU厂商会面临巨大威胁。
而更可能发生的事情是,如果Google真的用TeensorFlow主导了分布式机器学习框架,那么Google肯定不希望硬件厂商一家独大,而希望他们成为无差别的硬件提供商。以芯片制造商英伟达为例,他们到时候会面临两个选择,要么选择和Google深度合作为其打工,要么选择放弃这个方向做其他的芯片。
同样如果TensorFlow优先或者深度优化某些Google Cloud的机器学习云计算相关的API,Google在这个机器学习云领域也会取得巨大的优势。事实上,Google内部版的TensorFlow就和Google Cloud深度绑定优化,其他厂商用的开源的TensorFlow在性能上处于劣势。再到应用层,垄断的TensorFlow也有权决定优化某些特性,从而让Google在应用层面上获得优势。
再往严重点说,个人、公司甚至国家在人工智能领域的自主发展都可能被垄断的机器学习框架所控制。
这个担忧并不是危言耸听,地平线机器人技术创始人&CEO、百度深度学习研究院( IDL )创始人、深度学习领域专家余凯也对硅谷密探表示了同样的忧虑,“放任TensorFlow成为世界上占统治地位的人工智能开发平台对世界是危险的。尽管这个平台目前是开源的,但是随着时间的推移,人工智能变得越来越强大,这个系统会变得极端复杂到失去透明性,而且会很可怕的变成全世界数据,计算,硬件,编译器等的标准制定者。这样会导致一个不健康的生态,阻碍年轻人掌握技术的自由,让个人,公司甚至国家在人工智能领域的自主发展,最终被一家商业公司所控制。”