Bottom up and top down

这篇文章还是我的研究感悟,想动笔久矣。

研究无非就是两种思路:归纳法和演绎法,其他不过是二者不同比例的混合。从牛顿时代起,演绎法占据主流,也就是说力图通过理性的思维去认识和改造世界。这种思想推动了无数伟大的发现,尤以理论界为最,比如门捷列夫的元素周期表,爱因斯坦的相对论,阿兰古斯的宇宙暴涨模型,希格斯粒子的预言及发现。大众心中最牛的演绎法例子大概是图片里的福尔摩斯(另一张图当然是大反派莫里亚蒂教授啦),但原著中写着他有着庞大的知识库,依然是个归纳法天才。然而近些年来,很多研究不再能走演绎法的道路,因为认识到世界太复杂了,复杂到很多问题不能用单一的理论模型去求解。作为一名工科狗,我更能举出身边的很多例子。比如模式识别领域曾经风靡一时的专家系统早就不再吃香,代之以各种概率统计模型。一个专家的经验知识始终有限,多人多个样本提供的统计规律才有说服力。李开复当年在研究语音识别时就有同样的思路转变,当然这是陈年旧事。

做实验时,没有几项实验结果是与最初预测一致的。于是乎一张张气不过的面孔上写着这样的话:实验结果不对,一定是实验出问题了。但是,对于一个新领域来说,往往不是实验错了,而是理论本身就需要修正。把一个复杂的化工过程,电网系统,或交通系统简单用几个动态方程写出来,已经作了很大简化,忽略了很多细节。很多新思想来自于自然而非思维,比如先有了金属热处理,然后才启发出了模拟退火算法。数学伟力的top down得以让科学家们计算出了冥王星的存在以及E=mc2,但更伟大的发现一定来源于对自然的观察。有一次一位做通信的日本教授作了一场光触媒的报告。我提了一个问题:您是怎么研究这两个相距甚远的方向的。他说他在通信中用到光学传感器,后来观察到了光触媒的潜力,从而进入了这个领域。这是做研究的正确思路,发现问题而不是发明问题。

之前几个朋友在一起聊天,说起另外一个朋友准备解决油田管道里偷油的检测问题。之前想的很简单,连续测管道各点压力,如果有一点压力迅速下降,则一定是有偷油贼在行动。结果在实践中发现行不通,因为偷油口处的压力差并没有大到能检测出来,换句话说,管道其他正常地方的压力差可能比偷油口还要大,因为油的流动有涡流存在。我们当时讨论了几种可能的替代方案,比如流量差,比如巡线机器人,但都被很轻易的找出漏洞。讨论到最后,我的结论是,要想真正找出解决方案,就要找一个偷油口,把所有数据都采集上来分析,看看和其他正常部分究竟最本质的区别是什么,这就是bottom up。大部分老牌汽车企业的汽车更靠得住,就是因为他们的故障诊断数据库更完整,有着更完善的bottom up数据及解决方案。我博士毕业那阵子,兴起了一个名词叫数据驱动。现在就更加简练而广为传颂了:大数据。大数据目前还被形形色色的炒着概念骗着钱,但在竞争激烈的当代,它很快就会进入寻常百姓家。大多数只会炒概念的人不过是牛型气球,一根小针就会让他破掉。抬头看天,低头做事,脚踏实地,凡莫如是。