预测|为什么大家都不戳破深度学习的本质?!( 二 )


为什么说「预测」是智能的基础? 平常 , 人们理解的「预测」步子迈得太大了 , 就好比从一发球就要精准地算出其落点 , 而人脑的「预测」更像是「应激」 , 球动我动 , 一点点微调 。 现代社会发展得太快 , 让我们看不清概念的历史面貌 , 因而更容易被表象的迷雾困惑 。 当我们走回历史的起点 , 迷雾自然散去 。 智能 , 于我们最大的益处是什么?并非创造什么 , 而是生存下去 。 人类无时无刻不在「生存」还是「发展」之间纠结 。 但很少有人看到:发展 , 不过是为了应对未知的生存挑战 。
我们应该怎么去定义智能呢?也许演化的历史能告诉我们更多 。 智能 , 是帮助人类生存下去的一种能力:是让我们可以在溪流中叉到游动的鱼儿的能力 , 是让我们可以只靠一幅模糊的图像就判断出是朋友还是猛兽……我们应该去研究那些「如何保持平衡」之类的问题 , 而不是什么弹道求解问题 , 那不是大自然的进化目标 , 自然也得不到什么大脑的机制 。
所有生存问题都可以归结为一个元问题:如何识别出这个问题中的那些个恒定不变的东西 。 比如:溪流中的鱼、回家的方向……如果说智能中还存在别的成分 , 比如:想象、创造工具、解决问题 , 都可以规约到某种抽象手段上 。 归根结底 , 人类解决一切问题的方法只有一个——运用抽象 , 在更高维度上调和矛盾 。
一切绕不开「恒定表征」(invariant representations) 。
抽象的本质 就如同人们在认可了「负数」这一概念之后 , 终于能将「加法」&「减法」这两种表象上完全不同(一个增加 , 一个减少)的运算 , 统一为「整数域上的加法」 。 从更高的维度调和矛盾 , 这正是大脑皮层的构造方式 , 也是其工作原理 。 不断在现象中找到共同点 , 提取出来 , 取个名字;这些名字又成为了上一层抽象的基石(或者叫「词汇」) 。 这样一层一层 , 直至得到那个智能的圣杯——恒定表征 。
举个例子 , 我们是如何识别边缘的呢?
我们先来考察一小块3×3的视网膜 , 分别标记为#1~#9(如下图所示) 。 当一条竖线出现时(#1 , #4 , #7均被激活) , 电信号传递到第二层 。 第二层的每一个神经元 , 分别响应视网膜上一组细胞被激活的情况 。 比如:第二层最左边的那片神经元 , 响应的是单个视网膜细胞被激活的情况 。 再比如:第二层左二那片神经元 , 响应的是任意两个视网膜细胞被激活的情况 。 以此类推……
大数据 边缘识别:最下层是视网膜细胞;当某个视网膜细胞组合被激活后 , 会激活其上一层的相应神经元;而上一层神经元的某个组合被激活后 , 又会链式地激活更上一层的神经元如果我们把时间的因素考虑进去 , 假设信号并不会马上消失 , 而是随着时间衰减 , 那么只要时间够短 , 输入(#1 , #4 , #7)、(#2 , #5 , #8)、(#3 , #6 , #9)这三组刺激 , 就会在第三层激活某个神经元 , 代表「发现一条竖线」 。
看 , 其实每一个神经元都是一个「单词」(或是「概念」/「抽象」/「特征」) 。 只不过低层神经元描述的「单词」抽象程度更低 。 比如:第二层那个#(1 , 4 , 7) 神经元代表的是「在视网膜的最左边出现一条竖线」 , 而其上层那个则没有「在视网膜的最左边」这一约束 。
记忆的角色 神经元可以在5毫秒内完成信息的收集-整合-输出 , 相当于运算速度为每秒200次 。 人类可以在半秒内(相当于100步)识别图像、作出选择……100步 , 机器可做不到 。 在人类已知的算法里面 , 也许只有「打表」(把答案事先存储在记忆中 , 用时并不作计算 , 而只是提取)可以做到 。 所以 , 整个大脑皮层就是一个记忆系统 , 而非什么计算机 。