别把「想躺平」的锅甩给我,Nature子刊说这是多巴胺犯的错 | 协和八( 二 )


别把「想躺平」的锅甩给我,Nature子刊说这是多巴胺犯的错 | 协和八
文章图片
图片来源于网络
随后在80年代 , 研究人员们已经能够记录猴脑中的多巴胺能神经元(包括中脑到前脑部分的腹侧被盖区、黑质)的电信号 , 其短暂的激活放电能够触发即刻运动 , 这种间歇性的多巴胺放电最初被解释为支持「行为激活」和「动机唤醒」 , 换句话说 , 就是激活动物当前的行为 。
到了90年代 , 随着「奖励预测误差(rewardpredictionerrors , RPE)」概念的出现 , 关于多巴胺的理解又出现一次急剧的转变 。 这是基于一个关键的观察:多巴胺细胞会对意料之外的刺激事件做出反应 , 但如果这些刺激成为预期内的 , 它们的应答就会减弱 。
RPE思想起源于较早的「学习理论(learningtheory)」 , 特别是后来发展起来的计算机科学领域的强化学习 。 RPE概念的要点是价值更新 , 也就是对未来奖励的预估 , 而预估的参考是基于过去的事件 。
举个小栗子 , 我小学的时候每次考100分就会吃一顿烧烤 , 第一次获得奖励的时候由于是预期之外的事件 , 心情简直嗨到极点 , 而后来当我发现每次考100分就会吃到烧烤时 , 这样的奖励就变成了可预期的 , 而带来的兴奋度就会有所削减 。 借助这样的调整 , 大脑能够帮助我们判断利益的最大化价值 。
别把「想躺平」的锅甩给我,Nature子刊说这是多巴胺犯的错 | 协和八
文章图片
图片来源于网络
由于多巴胺细胞的放电类似于RPE过程 , 而且RPE是「学习理论」的概念 , 所以强调多巴胺在学习中的作用就显得很自然 。 后来的光遗传学研究也的确证实RPE编码细胞具有多巴胺能细胞的特性 , 并且能够调控学习行为 。
对于多巴胺调控学习行为的机制 , 有观点认为它与多巴胺调节纹状体突触可塑性是吻合的 , 它能增加纹状体释放多巴胺 。 而反过来也能够解释缺少多巴胺时的「躺平」表现 , 多巴胺缺乏可能被看作是一个不断削减的RPE过程 , 它将行为的价值更新为零 , 因此会逐渐呈现这种渐进的、消亡性的行为 。
然而 , 多巴胺参与持续动机的观点也从未消失——相反 , 它被行为神经学家普遍认为是理所当然的 。 动机是向前看的:它利用对未来事件的价值估计来适当激励当前行为 。 相比之下 , 学习是回头看的过程 , 大脑会利用近期发生的行为和状态更新其价值观 。 当然 , 一个很直接的想法就是——多巴胺两方面都能兼顾 , 而这也是目前的主流理论 。
那么一个小问题来了——多巴胺是如何成为这样的「时间管理大师」 , 一面回顾过去 , 同时又展望未来呢?
别把「想躺平」的锅甩给我,Nature子刊说这是多巴胺犯的错 | 协和八
文章图片
图片来源于网络
目前普遍的研究认为多巴胺的学习和动机的发生是在不同时间尺度上的 , 即通过多巴胺能细胞刺激的频率、程度和时间不同 , 而导致下游不同的通路的激活 。 而这方面的研究突破有赖于一个很重要的技术——微透析 , 它已被广泛用于直接测量大脑多巴胺水平 。
伏隔核(NAc)中多巴胺的微透析研究提示 , 腹侧/内侧纹状体与自主活动以及其他动机相关的标志物水平呈正相关 。 不过这个技术有一项限制 , 就是它无法达到很高的时间分辨率 , 最低是以分钟为单位 , 也因此无法精确地对应多巴胺瞬时水平和行为 。 尽管如此 , 微透析发现的这些缓慢的变化也传递着一种动机信号 , 长程多巴胺浓度改变可能调控着对时间分配和觅食决策的动机 。
但是微透析测量上的缓慢变化并不代表多巴胺水平改变也是缓慢的 , 一项研究使用微透析和快速扫描循环伏安法 , 在一项概率奖励任务中测量大鼠NAc多巴胺 。 结果证实 , 微透析测量的多巴胺与奖赏频率(奖励/min)相关 , 但即使微透析时间分辨率提高到1min , 多巴胺的波动也与我们采样的一样快 , 即没有发现多巴胺水平缓慢波动的现象 。