习惯化觅药行为的神经调控机制探究_范文写作网,金妮·韦斯莱,炒饭娘,扳手菜单

金妮·韦斯莱,炒饭娘,扳手菜单

　　Abstract：The transition function impaired between goal-directed and habitual behavioral strategy are the main reasons of the formation of habitual drug-seeking behavior. Previous studies thought that the weakening ability of the prefrontal cortex to control the dorsomedial striatum, which is in charge of goal-directed system, mediated the habitual behavior. However, recent studies have found that the direct and indirect pathways of the dorsolateral striatum (DLS) can selectively regulate goal-directed and habitual systems. In addition, the projects from motor cortex to DLS can modulate the neurons' synaptic plasticity of dopamine D1 receptor (D1DR) and D2 receptor (D2DR) bidirectional, regulating the synergistic or antagonistic effects between direct and indirect pathways.Recent studies have also revealed that the amygdala, as a key brain area for regulating emotions, can mediate the functional connection between the nucleus accumbens and DLS in the habitual drug-seeking behavior through the functional transformation between the central amygdala and the basolateral amygdala. Moreover, there is a competitive relationship for the regulation of habitual drug-seeking behavior between D1DR and D2DR neurons in the striatum. In view of these, this paper will focus on the mechanism of abnormal brain functions, which are associated with the defects of the conversion in behavioral strategies accompanying with habitual drug use, in the cell-specific and the circuit-specific ways.

　　Keyword：habitual drug-seeking; transition of behavioral strategies; neural circuits; striatum; dopamine;

　　药物成瘾发展的过程中, 与成瘾者初期将用药行为与奖赏结果联结 (action-outcome association, A-O) 的娱乐性的目标导向性用药行为不同, 长期慢性药物依赖后用药行为的性质发生了根本改变, 表现为由药物相关环境或线索诱发的难以停止、自动化的刺激-反应联结 (stimulus-response association, S-R) 的习惯化用药行为, 具有“强迫性”特征.在一般情况下, 当面临厌恶结果时目标导向系统会取代习惯化系统重回主导地位.然而, 长期用药会使目标导向策略与习惯化行为策略的转变功能受损, 这个过程被认为促使了强迫性觅药行为的发生[1].因此, 关注成瘾过程中目标导向性行为和习惯化行为策略转换异常将有助于更精确地理解强迫性用药发生的神经基础, 对阐明药物成瘾的神经生物学机制具有重要的意义.

习惯化觅药行为的神经调控机制探究

　　习惯化觅药行为主要与腹侧纹状体 (ventral striatum, VS) 向背侧纹状体 (dorsal striatum, DS) 的功能迁移有关[2], Gorbit等[3]进一步发现习惯化觅药行为的建立还存在从背内侧纹状体 (dorsomedial striatum, DMS) 向背外侧纹状体 (dorsolateral striatum, DLS) 的功能转变.DMS主要参与目标导向性行为, 接收联合皮层的谷氨酸能投射;DLS主要参与习惯化行为, 接收感觉运动皮层的谷氨酸能投射.随着不断用药, DMS控制的目标导向系统的功能逐渐受损, 而DLS控制的习惯化系统的功能不断强化, 从而弱化了A-O对行为的控制能力, 使S-R处于主导行为的稳固地位.以往研究显示, A-O系统功能受损可能源自眶额叶皮层 (orbitofrontal cortex, OFC) 对DMS神经投射功能的减弱[4,5].但最新的利用光遗传、钙成像等技术研究发现, DLS的直接通路和间接通路可选择性调控目标导向系统和习惯化系统[6,7], 这大大扩展了以往研究对DLS的认识.新近研究还显示, 皮层可以通过长时程抑制 (long-term drepression, LTD) 或长时程增强 (long-term potentiation, LTP) 双向调控DLS内D1受体 (dopamine receptor, D1DR) 和D2受体 (D2 dopamine receptor, D2DR) 类神经元的突触可塑性, 从而调控直接通路和间接通路的活化状态[8].杏仁核 (amygdala, Amy) 可通过中央杏仁核 (amygdala central nucleus, CeA) 与基底外侧杏仁核 (basolateral amygdale, BLA) 间的功能迁移介导伏隔核 (nucleus accumbens, NAc) 与DLS间的连接[9], 从而参与A-O和S-R联结间的转换.此外, 纹状体内D1DR和D2DR对目标导向和习惯化策略的调控存在竞争关系[10], 提示多巴胺 (dopamine, DA) 受体系统可能是习惯化觅药行为产生的分子基础.因此, 深入理解目标导向和习惯化策略转换缺陷的神经环路基础和分子机制是阐明习惯化用药行为的关键, 并能够为开发针对性的干预措施提供依据.

　　1、习惯化用药假说及其动物模型

　　规律性用药向强迫性用药转化的行为学基础被认为是目的性行为向习惯化行为转变的结果[11].操作性行为涉及两种不同的联结学习系统:目标导向性和习惯化[12,13].目标导向性学习是基于操作性行为与奖赏结果的联结过程, 如果奖赏物贬值, 操作性行为将明显下降或停止.然而, 习惯化学习通过强化操作性行为与奖赏物相关线索的关系形成刺激-反应联结, 即使奖赏物贬值, 操作性行为也不会受到影响.习惯化行为本身不具病理性, 而是一种有效的信息加工方式, 个体仍有调整行为策略的能力.但在某些情况下, 例如药物成瘾者对药物相关的环境线索所拥有的高敏感性, 使药物相关线索诱发成瘾者难以控制的习惯化觅药及用药行为, S-R联结的习惯化系统夺得对行为的主导地位, 使得习惯化行为变得持久稳固且难以消退.此时的习惯化行为则为一种病理性行为[14].并且, 随着用药程度的加深, 习惯化觅药行为最终可能发展为强迫性行为.因此, 习惯化觅药被认为是药物成瘾的过渡阶段, 并且其形成的可能原因是目标导向性系统与习惯化系统之间的失衡[1,15].

　　一般来说, 随机比率程序训练的个体倾向使用目标导向的策略, 因为奖赏率和反应速率之间存在很强的关联性;而随机间隔程序训练的个体倾向于使用习惯化策略, 因为奖赏率和反应速率之间存在不确定性[16,17].并且, 成瘾药物的长期暴露会打破目标导向和习惯化系统间的平衡, 使个体更倾向从目标导向性行为策略转向习惯化行为策略.这种效应在有药物接触史的人类被试和动物模型研究中均得到证实, 自然奖赏习惯化研究中发现, 可卡因、甲基苯丙胺或酒精敏化处理的大鼠, 在有限的训练后对食物贬值测试不敏感[3,18,19,20];人类的急性酒精暴露削弱目标导向行为并使行为倾向于习惯化[21].这些证据提示, 药物接触会加速目标导向与习惯化系统间的失衡, 使习惯化系统发挥主导作用.而且, 进一步的证据表明, 长期酒精依赖小鼠在强化了习惯化学习的同时也损伤了动机学习, 长期尼古丁或可卡因自身给药 (self-administration, SA) 处理也得到相似结果[22,23,24].提示, 长期药物依赖可能导致目标导向和习惯化系统间形成竞争关系, 习惯化系统获得对行为的主导控制, 最终使个体的行为策略转换能力受损.因此, 针对成瘾过程中行为策略转换缺陷的神经环路基础是理解习惯化觅药行为的关键.

　　最初研究习惯化觅药行为的模型, 主要通过长期大剂量可卡因SA的FR1 (fixed ratio 1, FR1) 训练或者经过长期的二级强化程序SA训练来实现[25,26].通过不断用药或降低用药行为伴随药物奖赏的发生机率 (contingency degradation) 来增强S-R行为[27].然而, Gremel等[5,28]采用一种随机间隔 (random interval, RI) 的SA训练程序可在较短时间内建立习惯化觅食和酒精依赖行为:首先, 动物经历FR1训练, 该阶段动物压杆即可得到奖赏, 撤离觅求目标则停止压杆, 即A-O行为;然后, 进行RI程序, 使得奖赏和操作行为间存在不确定的时间间隔, 动物偏向于使用习惯化行为策略, 此阶段动物的行为策略从A-O向S-R转变;最后进行贬值测试, 此时动物使用S-R策略进行习惯化觅求行为.该动物模型有利于研究觅药行为从依赖药物 (奖赏物) 向依赖条件性刺激 (用药线索/环境) 发生不可逆转变这一动态过程 (形成、表达及维持) 中神经环路的调控异常.并且, 现有研究利用成瘾药物掺杂氯化锂, 进行尼古丁和可卡因习惯化训练的奖赏贬值测试[23,24].此外, Zapata等[29]采用一种觅药-用药的训练范式, 证实了以消退方式 (无奖赏物) 进行药物奖赏的贬值测试也是可行的.值得注意的是, 以往对于纹状体或皮层在习惯化用药行为中的研究多为静态实验, 这可能是由于行为训练程序和技术等的限制.然而, 随着动态成像及光遗传等新兴技术的出现, 能够追踪伴随行为的特异性神经网络的变化过程, 也能更真实地揭示与习惯化觅药行为形成的各个阶段相关联的脑环路的功能异常.

　　2、纹状体的主导作用

　　一系列研究显示, 药物成瘾是由目标导向性向习惯化行为转变的渐进过程, 而其神经基础是从以NAc为代表的VS向DS的功能迁移[30].大量研究表明, 当暴露用药线索时, 可卡因SA训练的初期大鼠腹内侧纹状体 (ventromedial striatum, VMS) 的DA释放量增加, 但随着训练时间的延长, VS内的DA释放量反而显着地减少;而在DLS中, DA释放量在训练初期没有明显变化, 在训练后期的习惯化觅药中显着增加[31,32].并且, 在形成SA的大鼠NAc核心部 (nucleus accumbens core, Acb C) 注射AMPA受体拮抗剂LY293558能降低早期的觅药行为[33], 用药后期DLS (而非NAc) 双侧注射多巴胺受体拮抗剂α氟哌噻吨 (α-flupenthixol) 或LY293558均显着降低大鼠觅药行为[34].提示, VS参与对早期觅药行为的调控, 此时觅药行为是目标导向性行为, 但随着用药程度加深, DS将取代VS的功能.因此, 随着VS向DS的功能迁移, 用药个体将产生S-R联结的习惯化觅药行为.

　　目前认为DS是参与习惯化行为建立和表达的重要脑区, 特别是DLS在习惯化觅药行为中发挥主导作用.啮齿类动物的DS可进一步分为两个功能亚区:DMS和DLS脑区, 分别类似于灵长类的尾状核和壳核.在人类和动物研究中发现, DMS主要参与目标导向行为, 接受包括前额叶皮层 (prefrontal cortex, PFC) 在内的大脑联合皮层的神经投射, 而DLS主要参与习惯化行为, 接受感觉运动皮层的神经投射[35,36,37,38].可卡因成瘾习惯化研究表明, 在习惯化觅药行为形成的早期阶段, 后背侧纹状体 (posterior DMS, pDMS) 双侧注射α-flupenthixol会降低觅药行为, 而前背侧纹状体 (anterior DLS, aDLS) 给予同样处理则不受影响.然而延长训练时长后, aDLS (而非pDMS) 双侧注射α-flupenthixol会削弱习惯化觅药行为[39].提示, 觅药行为的早期阶段, 主要是参与目标导向的脑区pDMS调控觅药行为;而当形成习惯化觅药行为时, 参与习惯化行为的脑区aDLS才会处于主导地位, 同时pDMS失去对觅药行为的调控能力.近期的报道则进一步表明, aDLS的失活会恢复动物对贬值测试的敏感性, 重新导致对可卡因的目标导向性行为[9].由此可见, 习惯化觅药的神经机制伴随NAc向DLS的功能迁移.与此同时, aDLS和pDMS在调控觅药行为存在相互竞争关系, 早期主要是pDMS参与SA的目标导向的觅药行为, 而用药后期主要是a DLS参与习惯化的觅药行为.然而, 当稳固的习惯化觅药形成后, S-R与A-O联结系统转换缺陷可能与纹状体神经通路和皮层-纹状体的调控有关.

　　3、调控行为策略改变的纹状体局部环路

　　构成DS的神经元90%为GABA能中型多棘神经元 (medium spiny neurons, MSNs) , 且根据表达DA受体类型的不同分为表达D1DR和表达D2DR两种MSNs.D1DR激活后与兴奋性G蛋白偶联, 通过激活AC (adenylyl cyclase) 从而引起一系列兴奋性事件.相反, D2DR与抑制性G蛋白偶联, 通过抑制AC发挥与D1DR相反的作用[40].在恒河猴成瘾研究中发现, 长时程SA训练后, 在DS中D2DR密度下调, 而D1DR密度则上调[41].此外, 人类和非人灵长类的影像学研究显示, 可卡因的反复暴露导致DS脑区D2DR表达水平均显着下降[42].临床研究也发现, 与健康被试相比, 可卡因成瘾者注射安非他明后, 纹状体内D2DR (而非D1DR) 的激活程度明显下降[43].由此可见, D1DR表达的上调、D2DR的下调可能是介导成瘾行为形成的关键.然而, 也有研究发现, 向DLS脑区注射D1或D2受体拮抗剂均能阻断习惯化觅药行为[3,29].上述结果间的不一致提示, 单一脑区或者递质受体水平的研究只能提供有限数据, 并且, DA释放量、DA受体表达水平与MSNs活化状态间的关系也不明确.因此, 细胞特异性和神经环路特异性的脑功能研究将能更清晰地解释习惯化觅药行为的机制.

　　与DA受体间发挥相反作用不同, D1DR的MSNs与D2DR的MSNs在DS调控觅药行为的机制更为复杂[44].D1DR的MSNs, 其神经纤维直接投射至基底神经节外侧核, 包括内侧苍白球和/或黑质网状部形成直接通路;D2DR的MSNs, 其神经纤维先投射至外侧苍白球, 再间接投射至基底神经节外侧核, 形成间接通路[45].直接通路与间接通路可在行为调控中发挥协同或拮抗作用, 间接通路可通过制衡直接通路的运动兴奋作用, 来抑制无意识运动.例如;阻断直接通路的神经投射, 而非间接通路, 能够抑制习惯化行为的形成[6].此外, 最新研究还显示, 两条通路所参与介导的行为策略也不相同:激活D1DR的MSNs利于行为任务的快速获得, 选择性强化有效侧压杆, 且对结果 (奖赏) 伴随行为几率的变化敏感, 表明此时行为是A-O模式;而激活D2DR的MSNs会弱化压杆行为的获得, 对有效侧与无效侧压杆操作缺乏选择性, 且对结果 (奖赏) 伴随行为几率的变化不敏感, 表明此时行为是S-R模式[7].提示:直接通路可能参与介导目标导向策略行为的调节;间接通路则倾向调控习惯化反应策略.

　　许多研究还发现, 除了单一通路调节习惯化行为, 直接通路与间接通路也能在同一行为中发挥协同作用[46].利用离体电生理技术检测发现, 习惯化行为的形成与直接通路和间接通路的激活均相关.在习惯化形成中, DLS脑区的两种MSNs的爆发式放电 (burst firing) 均显着增加, 说明两条通路均被激活.此外, 该研究进一步发现直接通路和间接通路被激活的启动时间存在先后顺序, 直接通路先于间接通路[6].由此可见, 直接通路和间接通路可能存在对目标导向和习惯化策略的选择性调节, 并以单一主导或协同的方式参与调控习惯化行为.更重要地, 与上述一般的或自然奖赏 (食物或蔗糖) 习惯化行为不同, 药物成瘾习惯化往往具有行为策略转换不灵活的特征, 即使面临价值严重贬值, 其行为策略也很难向A-O转换.因此, 在成瘾习惯化行为形成过程中, 负责介导目标导向策略的MSNs通路可能在FR1阶段被激活, 以完成A-O模式的觅药行为, 而随着RI阶段的训练, S-R模式行为逐渐占主导地位, 负责介导习惯化策略的MSNs通路被活化, 此时介导目标导向策略的MSNs通路的活性会被抑制, 并失去恢复主导行为的能力.

　　4、皮层-纹状体环路双向调控策略转换

　　DMS与DLS分别接受皮层不同亚区的谷氨酸能投射来调控行为.动物和人类研究均表明, DMS与PFC的交互作用主要调控目标导向性行为, 而DLS与感觉运动皮层的交互作用主要调控习惯化行为.两条通路既相对独立又相互影响[47].在食物作为奖赏物的研究中, 大鼠PFC的OFC受损会导致大鼠的目标导向性行为向习惯化行为转换受损[5], 习惯化觅药行为中目标导向与习惯导向行为的失衡可能与OFC的投射功能受损有关.大量实验表明, 可卡因戒断的SA大鼠, 长期用药导致PFC脑区突触传递效能减弱, 突触密度和树突分支数目降低[48];同时, 影像学研究显示, 药物成瘾者OFC、前扣带回等脑区的功能活动度显着降低[49].同样的, 在人类被试研究中也发现了相同的现象.可卡因滥用者的前额叶灰质和白质密度均显着减少[49], 酒精成瘾者的前额叶突触密度也表现出了明显的降低[50].并且, 可卡因长期用药个体OFC中葡萄糖代谢水平表现出了明显下降, 活动性也相应表现出显着减弱, 而该区域在用药早期极度活跃[51].因此, 长期用药会导致PFC及OFC等脑区在结构和功能上均受到损伤.研究还发现, 损毁内侧前额叶皮层 (medial prefrontal cortex, mPFC) 能促进大鼠可卡因SA行为的获得, 并且会使大鼠对获得奖赏物几率的变化不敏感[52].提示, m PFC损伤可能导致对目标导向行为的控制能力减弱, 使得大鼠表现出习惯化觅药的行为特征.

　　皮层-纹状体环路的突触可塑性改变也与习惯化觅药行为特征关系密切.据报道, 长期安非他明用药大鼠的DMS中树突棘密度减少, 而DLS中树突棘密度增加[53].提示, 长期用药导致DMS、DLS突触结构异常.最新研究还发现, 长期酒精暴露会降低OFC-DMS环路的神经兴奋性.并且, 对于酒精依赖的习惯化小鼠, 增加其OFC-DMS的环路活性还能够恢复对目标导向性系统的控制[28].此外, 激活纹状体直接通路对皮层的作用是兴奋性增强, 而激活间接通路对皮层的作用则是抑制性的[54].而且, 纹状体内不同类型神经元 (包括D1DR和D2DR) 可以通过突触强度 (LTP或LTD) 调节其对于皮层输入的反应性.例如, 一个特异的皮层神经输入, 对于D1DR的去抑制神经元是LTP, 而对于D2DR抑制性神经元则是LTD[8].最新的报道也表明, 直接通路参与调控目标导向系统, 而间接通路负责控制习惯化系统[7].由此我们推测, 长期用药可能导致控制目标导向系统的皮层-纹状体突触传递效能减弱, 同时控制习惯化系统的皮层-纹状体突触传递效能增强, 使得习惯化策略行为占主导地位, 目标导向性策略行为受到抑制, 行为策略转换能力受损, 即使面临负性后果也坚持觅药及用药.上述推测也得到了部分验证, 慢性酒精处理表现出习惯化行为的小鼠, 其OFC与DMS的直接通路间的活动性被选择性降低[28].

　　5、杏仁核-纹状体环路的功能转移调控习惯化用药

　　杏仁核作为调控情绪的关键脑区, 对DLS的间接调控同样影响习惯化觅药行为[55].临床脑影像学数据显示, 药物线索暴露会诱发成瘾者Amy脑区的异常激活[56].近期研究表明, Amy的亚区BLA和CeA分别对大鼠可卡因习惯化觅药形成过程中的A-O和S-R联结系统发挥关键作用.并且, 虽然BLA与CeA均没有直接投向DLS的投射, 但它们可能通过不同的环路机制调控DLS[1,9].用GABA受体激动剂抑制BLA活性, 能够显着降低动物早期的觅药行为;多巴胺受体拮抗剂α-flupenthixol抑制aDLS或对侧分别抑制BLA及aDLS的功能连接, 均会阻断可卡因二级强化训练中、晚期觅药行为, 同时还能阻断建立良好的习惯化觅药行为[9].此外, 有研究表明BLA-NAc的兴奋性神经投射对目标导向的可卡因觅药行为具有调控作用[33].电生理数据也显示, BLA对NAc投射的激活可以调控aDLS的MSNs的活动[57].并且, 在习惯化觅药行为形成过程中, NAc与DLS的作用并不是孤立存在的, 而是通过纹状体-黑质-纹状体 (striato-nigro-striatal, SNS) 环路形成功能连接, 此环路包括从NAc投射至中脑黑质 (substantia nigra, SN) 、SN再投射回DLS[26].因此, BLA可能通过SNS环路从而与DLS建立兴奋性投射参与调控习惯化觅药行为的获得.

　　Lingawi等[55]报道了CeA介导习惯化行为, 双侧损毁CeA前部或者损毁CeA与DLS间的连接, 能够阻断蔗糖习惯化行为的获得.最新研究显示, 与BLA对习惯化觅药行为影响不同, 双侧损毁CeA或对侧抑制CeA和aDLS的功能连接, 对可卡因习惯化训练早期的觅药行为并没有影响, 但显着降低了建立习惯化觅药行为的可能性[9].此外, 伴随习惯化行为的形成, DLS内DA水平显着增加, 提示传至DLS的DA能投射是调节DLS内DA释放水平的关键.并且, SN除了作为SNS的关键组成部分与DLS建立DA能间接投射以外, 还能与DLS建立直接的DA能投射, 且SN-DLS通路接受来自CeA的谷氨酸能投射的调控[58].因此, 可以推测CeA-SN-DLS神经通路可能参与并介导了习惯化觅药行为的建立及维持.同时, BLA和CeA通过协同作用介导了习惯化觅药行为中NAc向DLS功能的迁移.

　　6、结语

　　目标导向行为与习惯化行为策略转换缺陷是习惯化觅药用药行为形成的主要原因, 同时也是强迫性用药行为产生的基础.本文从习惯化觅药用药行为的本质出发, 讨论目标导向与习惯化系统失衡的神经环路基础, 不仅涉及PFC对负责目标导向系统的脑区DMS控制功能的减弱, 而且探讨了DLS特异神经元类型及其介导的直接通路和间接通路对行为策略的选择性调控.更进一步讨论了皮层-纹状体环路对突触可塑性改变的双向调控, 即增强习惯化系统功能的同时减弱目标导向系统功能, 使行为策略的转换能力受损.此外, 本文强调了作为情绪调控脑区杏仁核在习惯化中的亚区的功能迁移.由于神经系统对行为的调控多以神经网络的方式实现, 所以单一脑区或递质受体水平的研究只能提供有限证据, 因此脑环路水平的研究能更准确地揭示药物成瘾的脑机制.但是, 以往关于纹状体、皮层或杏仁核在习惯化觅药中作用的研究多为静态实验, 而神经网络对行为的调控是动态过程.因此, 应用动态的成像技术和新兴的光遗传等技术, 追踪特异性神经网络的变化过程, 能更真实地揭示与药物成瘾发生相关联的脑环路的功能异常.

转载请注明来源。原文地址：http://www.bixuanzl.com/20191130/1670266.html

习惯化觅药行为的神经调控机制探究

植物组织培养的污染源与防