返回信息流有一个广为流传的误解——人们能从离散的电影、电视的帧中看到连续的运动是由于“视觉暂留”。
很小的时候就不知道从什么科普书中接受概念,竟然到现在也没怀疑一下。不小心在搜索中看到百度知道令人发笑解释:“视觉暂留现象……其具体应用是电影的拍摄和放映……感光细胞的感光是靠一些感光色素,感光色素的形成是需要一定时间的”。尤其是接下来的那句“视觉暂留现象首先被中国人发现,走马灯……宋时已有走马灯……”;文中透露出的急于炫耀中国古代文明光辉无限的自卑感非常黑色幽默。
回到正题。wiki上搜到persistence of vision会有比较全面、符合逻辑的解释。其中专门有一句说,“视觉暂留”现象和电影、动画中看到的运动没有关系。这类现象是apparent motion——即表现出来的(观察到的)运动。真正的物体可能没有运动,但人眼有种机制使得大脑觉得有运动。
首先再说说“视觉暂留”的事情。顾名思义,“视觉暂留”就是观察到像会在大脑中持续一段时间。相对应的现象是直升飞机螺旋桨(或者是风扇)转起来后看到的是一个饼状的东西,即由于暂留,把动态的看成静态图像。在这一点显然是和电影中把静态的看成动态的是相反的。即使暂留在电影中起了作用——假设它能把帧中间的间隔填上——看到的也只是一断断静止的图像。
何以产生运动感呢?
早在70时年代,Reichardt就通过对昆虫复眼的研究提出了correlation的模型。之后的很多年中,也有很多其他模型,比如motion energy, spatio-temporal gradient等出现。在这里只简单介绍一下Reichardt的correlation模型的原理,其他模型的大体思想都相似。
现阶段学术界对于大脑视觉系统有个比较公认的观点,即视觉系统是一个分层的、由特殊到一般的结构。在最低层,大量的神经元被用来感受特定的运动方向、特定的速度、特定的频率、特定的位置。比如一个神经元只对以3cm/s的速度向右运动、空间频率为4cycle/pixel的正弦条纹有响应(由于任何信号都能分解成正弦波的线性组合,所以一般都研究单频的正弦波)。在高一层,会把低层的响应综合起来(pooling),来达到位置、尺度等等的不变性。比如有三个低层神经元,分别只对尺寸为1cm、3cm、5、cm左右的物体有响应,并且都连到同一个高一级的神经元。通过一个max操作,即取三个响应的最大值,这个高一级的神经元就能对尺寸在1cm到5cm的物体都有响应,类似一个集合求并的操作。总之,视觉系统通过最初把所有情况的分开,然后再逐级的综合,层层上升,来达到对某种状态的感知,同时也不丧失不变性(invariance),即一个鸡蛋近看是鸡蛋,远看还是鸡蛋,虽然它们在视网膜上的像差别很大。
Reichardt的贡献就是在于提出了一种机制,解释只对特定运动方向和速度敏感的神经元是如何实现的。原理非常简单。
l
昆虫复眼每个单独的小眼睛都相隔了很小的距离,物体在它们中产生的像相隔了一小段时间。在如图的这种结构中,只有当物体朝右以一定方向运动时,左边的单眼(以小圆圈表示)经过一段延时后,到达小方块时才和右边的单眼的像是一样的。如果速度或方向不一致,左右两单眼到达小方块的像会相差一个相位。小方块做一个相关运算(correlation),即把两个信号相乘然后沿时间平均,然后输出。只有当两个信号刚好匹配时,输出才是最大的;在其他时刻,输出则较小。这变是相关模型。
以下的小演示也阐述了这个概念
附件(3.2KB) reichardbell.mov
Move your mouse over the green receptors. When two responses arrive at the bell at the same time, the bell rings.
如果无法显示,去如下地址
http://neurovision.berkeley.edu/Demonstrations/matthew/reichardt.htm
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #3768同步于 2008/11/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【科普】眼睛对运动的感知
zixu1986
2008/11/26镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。