针对这件事情,网站 Hacker News 上照例爆出了非常有营养的讨论。(下面的信息由新智元编译整理,时间是2017年2月22日。)
用户 eigenman:
[对于这件事]我一点都不奇怪。我曾经在 Anderson 的白血病部门工作,他们请我来分析他们的“大数据”。他们想知道哪些细胞显示病情复发,但只能提供两个患者的数据,而且这两个患者还都分别接受的不同的治疗。我尽了最大的努力,但还是没法说服负责这个项目(译注:“项目”的原文用词是“show”)的医生去获取更多(更好)的数据,更别提做机器学习了。他们认定数学是能够撒在数据上的神奇调料,能把垃圾变成科学论文。我不奇怪 IBM 也遇到同样的问题。
此外,整件事情都跟我理解的制度文化(institutional culture)一致。现在有很多“我也行”科研(me-too science),就是重复那些更有名的高校的更好的工作。我打赌我当时在 Anderson 医院的老板听到 IBM 的提案后,想的是“我超越斯坦福的机会来啦”。但是,他们完全没有考虑过喂给这套系统的数据;事实证明,范围和基础设施变了,数据也有影响。
>>对此,用户 rscho 回应说:
作为医生,我能从另一个角度看问题,我完全同意你的说法。因为临床上也开始实行“不发表就死亡”的原则,整个医学研究领域都变得极其不诚实。没受过科学教育(临床医学绝对不是科学)的人就应该被禁止领导科学项目!