Science Frontier

- Feng's view on current science

Nobel

Nature: 20190824

Speech synthesis from neural decoding of spoken sentences

利用脑电波合成声音

Fig.1：a通过植入电击测量人脑侧面（含与听说相关的脑区vSMC=ventral somatosensory cortex, sTG=superior temproal cortex, iFG=inferior Frontal Gyri）皮层脑电活动。b用三层biLSTM1将脑点活动转为articulatory kinematic state（33维与说话有关的口舌唇声带运动状态）。c用另外一个三层biLSTM2将kinematic转为acoustic features（32维含MFCC-mel frequency cepstral coeffcient、pitch、voicing等）。d利用声音features来合成声波。
用MOCHA-TIMIT data 来训练biLSTM网络，该数据的每一句话都有对应声音（元音、辅音）的发音的口舌鼻唇声带的kinematic状态（通过贴sensor测量的）。subject在读MOCHA的句子时，biLSTM1接收subject脑点信号（用ECoG测）输出预测kinematic状态（MOCHA给出）。对应biLSTM2，用MOCHA给的kinematic状态为输入，输出预测的声音feature（ground truth的acoustic features通过subject所产生的声音做MFC分析）。训练好后subject只需意念（不用动嘴巴）形成脑电波该网络就能将其转为声音。
MFC-mel frequency cepstral：声音加密的常规方法，因为人对不同频率段的声波强弱敏感度不同，mel将声波频谱做非线性变换s.t.变换后的每个频段的数值给人相似的强度感受。
通过脑波所合成的声音比较模糊，其谱与原声谱能力分布一致但是缺少细节Fig1ef。
Fig2测试该声音合成网络的性能。用到MelCoefficientDistortion（MCD）来判断合成于原声谱的偏离程度，该值越小代表合成效果越好。用到WordErrorRate（WER）：外来listener听合成声音来判断说的是什么sentence，该值越小代表合成声音越能听懂。还用到pearson相关系数：合成与原声不同features的相似程度。测试分单词level，听一个脑波合成单词声音，然后从25或50个候选单词中找一个；句子水平，听一个句子，然后写出来，再计算WER。该网络合成的声音不太好听懂（正确率只有50%，50单词候选）但就acoustic feature的MCD显著好于随机声音。
声音信息主要来自于vSMC（去掉后MCD指标显著恶化）。vSMC神经活动负责口舌唇鼻肌肉运动，对于articulatory kinematic有最为直接的关系。sTG主要是负责听到声波谱转phenome、以及接口到各种意义解释、repeat声音时接口到preMotor。iFG应该就是Broca区负责语法分析和语言的产生。
Fig4对kinematic做PCA分析，然后利用第一第二组价对比原声（实线，灰色代表辅音蓝色代表元音）、audible时脑波合成音（dashed）、mimed时脑波合成音（dotted）。
该网络可以解调mimed（想而不张嘴说）脑波为声音，这有助于警察断案。像霍金得ALS后控制嘴巴的lower motor neuron失活，本文网络就让霍金通过默读MOCHA材料只训练biLSTM1，然后配以别人（如赵忠祥）的biLSTM2，这样霍金这类ALS或者中风就可以用脑波产生赵忠祥的声音。

Nature: 20190817

Towards artificial general intelligence with hybrid Tianjic chip architecture

天机芯片架构与无人驾驶自行车

天机芯片(TJ)能支持CS.based ANN（artificial neural network，nonspiking 传递float value）和NS.based SNN（spike NN，传递二进制序列）。支持多核、等级平行计算、可configure各类网络各种拓扑，concurrently做多domain多算法多种tasks。
Fig2：TJ.Fcore (function core)包括axon（buffer input activation/spike train），synapse （存储上下游神经元间的权重W），dendrite（根据上游输入xi与所存储权重Wij，做mutiplication and accumulaiton (MAC)运算），soma（对ANN做非线性变换产生activation输出，对SNN做膜电位积分，达到阈值fire spike（同时膜电位reset）），router根据查找表（RLUT）接受和发出msg到指定的Fcore。
Fcore的axon可被configure成ANN型（接受float的activation输入）或SNN型（接受spike train输入）。Fcore的soma也可以被configure成ANN型（做非线性变换（线性如sigmoid或Relu可以存储在LUT表）产生activation给下游Fcore），或configure成SNN型（通过膜电位和阈值产生spike train给下游）。TJ.Chip有12*13=156个Fcore，Fcore为converter（即ANN输入SNN输出，SNN输入ANN输出），chip可被configure成均质（如全部Fcore为ANN做CNN功能）或异质（有ANN和SNN）。router可随意连接各Fcore（根据RLUT）实现点到点连接，Recurrent，多播（同样输出经由多Fcore提升fan-out量）等Fig2.e。
本文用单一TJ芯片做无人驾驶自行车，实现CNN做物体detection，CANN（continuous attractor NN）做人tracking，SNN做voice control，NSM（neural state machine）做系统状态transition控制，MLP做自行车运动控制(接受NSM command和IMU的自行车姿态参数)。
系统有5种状态：S0=voice ctrl；S1=人detection；S2=人tracking；S3=躲避障碍；S4=躲避完成。NSM来控制五种状态的transition（Figs.s4）三组神经元做系统状态、transfer、output表达。三组矩阵做状态间transition。
硬件连接同软件上的架构，软件上训练好各参数（BP来训练），搬到TJ的localized内存上来做实时提取与计算用。

Nat.NS.Rev: 20190810

A common neurobiology for pain and pleasure

痛与快乐的神经机制

Fig.s1 扎手，释放PG（prostaglandin前列腺素），一级S神经元感受到PG后在脊髓背角处释放P物质，二级S神经元接受信息后spinothalamo track跨到脊髓对侧白质束上传到thalamus，再传递疼痛信息给somatosensory S1皮层（topo感受伤害位置和疼痛度，紧邻的insula区处理内感受的疼痛等）。下行（红色）信号做疼痛调节：旁导管灰质（受控于Amy、PFC等脑皮层）将调控信号下穿至Raphe核，再下传至脊髓背角。其5HT和NA能抑制前突P物质释放，还可通过中间元产生opiod来抑制前突P物质释放以及抑制后突放电。
自然通过痛和乐来govern动物的行为。寻乐避痛使得动物活得更长久。痛与乐有shared处理皮层Fig3，都通过dopa和opioid来调节表达。其研究有助于减少人的suffering提高人的wellbeing。
hodonic feeling（如喝可乐很解渴，sexual行为的快感等）生理方面由opioid表达，心理方面表达为liking（正在享受的感受）。motivation（想去买可乐，看到美女就走不动道儿等）生理方面由phasic dopa表达，心理方面为wanting（期待的感受）。
奖励和惩罚为something that animal work to achieve or avoid. Pleasure为奖励的主观hedonic value，疼痛为hedonic suffering。pleasure亦可为stimulus能恢复静稳态的趋势，疼苦为event that使人偏离静稳态的趋势。
动机决策模型：Anything（stress or pleasure etc.）that survival importance is greater than pain, will exert antinociceptive. 比如房子着火了，尽管你皮肤被烫伤，为了活命你跑出房屋而没有感受到烫疼。Anything（stress or pain etc.）that survival importance is greater than pleasure, will inhibit pleasure. 得肺炎，对最喜欢的美食也没胃口，因为你需要注意力放在赶快消除体内炎症带来的静稳态破坏。总之痛与乐event下，要优先考虑survival。
加尔文主义：奖励的使用应该被限制，因为unregulated奖励使人上瘾。要节制pleasure再配以耻辱感，强调忍耐、克己、无私等。可能会物极必反，如神职人员的渎童、自残、anhedonia（无法正常享受快乐，如捡到钱也不乐呵）等
主观解释影响疼痛感受。如告诉病人已经打了吗啡（其实为placebo），病人感受不那么痛了。再如给病人打了吗啡但没告诉他，吗啡止痛效果明显下降。好听的音乐、美食奖励、sexual行为(周星驰看毛片取弹头)、金钱奖励、声誉（关羽刮骨疗毒）都能止痛。
Fig1.a：Phasic dopa（如VTA burst表达奖励期望、预测等）能提升opioid分泌于NAc和VP（ventral Pallidum），phasic dopa能产生pleasure或止痛。Fig2b：tonic dopa (静稳态时extraCell space的dopa水平)太高，则不能分泌足够量phasic dopa，长期就会感受不到疼痛（痛失敏）和感受不到快乐（anhedonia，类似抑郁不乐）。Fig2c：tonic dopa水平很低，则常分泌过量phasic dopa，就会出现精神分裂症阳性特征，过度pleasure-seeking。总之，phasic dopa增加opioid水平，tonic dopa减低opioid水平。
慢性痛和抑郁症，都是tonic dopa水平过高（高水平才能免于对pain的敏感，但是对pleasure也不敏感了），难于burst phasic dopa来产生快感。所以持续增加的tonic dopa水平代表疼痛因素加剧，brief dopa信号反应痛avoidance motivation。
Amy、NAc、VP释放内源opioid于痛刺激来止痛。Pallidum处理痛hotspot在处理pleasure两边；NAc前端处理pleasure后端处理痛苦；Amy不同n.pop相邻表达正/负hedonic value。所以存在两套系统interactively处理痛与乐within-regions。
痛与乐的commom currency：u-opioid反应真正hedonic pleasure或analgesic effect。dopa为motivation信号，phasic dopa能产生u-opioid。
good life= presence of pleasure + absence of pain.

Nat.Rev.NS: 20190803

The neuronal coding for number

基数处理的神经机制

基数：多少个item；序数：排名第五；nominal number：5路汽车
weber定律：神经对数量的感觉是对数关系： s=log(n)。所以你会误以为1和10000差别大于10000与100000差别。这也是为什么概率再低也有人买彩票。
人与猴的Parietal（Pr）和lPFC做基数处理，不计Sensory appearance (5个苹果无论怎么放置，还是先后出现，神经元群一致表达数量5)。
Fig1：delayed-match-numerosity实验，猴先看reference数字，再delay，再挑选一样的数字item得奖励，同时测量PFC的神经元放电。Fig1b，该神经元对2个item放电最强，无论在sample期还是delay期，对其他数量也有放电但是不同程度减弱。Fig1c为喜欢6的神经元。Fig1d为顺序出现4个item，猴也能count后找到对应的4个item图。Fig1e为声音上4个循序出现的pulse，猴也能找到对应的4个点的图而得到奖励。Fig1f，数字神经元能抽象encode数量（声音pulse数和图像点数的encode曲线几乎一致，supramodality）。Fig1g为猴的数字神经元在Pr和lPFC，Fig1h为人也share同样nonverbal数字处理能力在类似区域。Pr（或者vIP、IPS）早处理数量的表达，PFC处理稍晚且更为抽象for选择action。
Fig2：数字表达为population coding。每个数字神经元有自己prefered数字，但是一群数字神经元一起表达数字更为迅速和准确（单个神经元必须要多次trials做平均来判断数字，速度慢；pop.cd不受某个神经元loss影响；集体放电pattern来决定encode数字更准确Fig2b）。Fig2c把数字做对数化处理，tuning曲线就变线性化了服从weber定律。Fig2d数字神经元tuning曲线是高斯型的（对preferred数字放电最强，相邻的变弱，远临的几乎不放电）。Fig2e那些PFC非数字神经元的放电也能decode出所编码的数字，尽管准确率没数字神经元高。
Fig3a 相邻的主元接受到的输入相似、且相互excite、表达同样数字，所以tunning曲线相似profile。Fig3b主元相邻的中间元（4倍数量）profile相反，放电快，波形窄。Fig3c相邻主元间相互excite，能通过recurrent在stimulus消失后维持数字表达于workingmemory，主元通过中间元来抑制远处其他数字表达的主元。
Fig4a.数字表达的抗干扰性实验：猴先看sample dot数，再delay，再disatractor，再delay，再找sample相同点数图得奖励。Fig4b（多次实验，按sample数字做放电平均），该神经元喜欢数字3和4，在sample的delay期其放电倾向于3和4，distractor期使其放电被干扰，distractor delay期又能重新产生对3和4的放电表达来帮助决策。Fig4c（多次实验，按sample数字做放电平均）该神经元对distractor数字无表达。Fig4d用ANOVA（解释多少variance）来判断该数字神经元信息量来源，在sample delay期蓝色线增长表示sample数字表达增强，distractor期红色distractor数字干扰增强，distractor delay期sample 数字表达能重现出来。Pr区域的数字表达更直观presented (sample or distractor) item数量，而lPFC表达的数量与接下来的决策有关，能top-down控制Pr的表达。
Fig5a.数学规则变换实验：猴先看reference点数量，再delay，在看规则cue（红代表大于，蓝代表小于）再delay，再按照规则选择对应点数图片得奖励。Fig5b。PFC的20%神经元encode此些规则。蓝色曲线为encode smaller规则、红色为larger。在规则cue出现后规则神经元放电变强来表达相应规则，为接下来决策服务。Fig5c有些规则神经元只encode more 不encode longer，为rule specialist；有些即encode more又encode longer，为rule generalist，所以规则神经元也是有等级的。population coding可以即传达规则、数字又传达相应的类型等。Fig5d：population coding用PCA压缩取前三个维度，红色为Greater蓝色为fewer，两者轨迹开始重叠，当规则cue出现后两轨迹分开，说明通过规则神经元群放电表达我们能清楚准确的判断当前rule是大于还是小于。Fig5ef为猴与人的规则神经元所在区域（主要在lPFC和mPFC，少量在IPS）。

ALI: 20190727

CoLink: An Unsupervised Framework for User Identity Linkage

colink: 用户身份关联的非监督方法

用户身份关联（UIL），将不同网络的user信息integrate在一起。如识别公司内网的张三就是linkedin网络的ShanZhang, 然后获取关于张三更丰富的信息来精准推荐、合理人事安排等。人工做网络间（Facebook，LinkedIn，企业内网、淘宝网等）UIL数据量太太大，且各网络间attribute的表达格式不同（如北大，北京大学，peking university，PKU，颐和园路5号都代表同一含义）similarity计算困难。
colink：unsupervied framework,用co-train算法来构建源网-目标网关联矩阵的S (为sparse矩阵)，如企业网的i号员工与linkedin的第j个user是同一个人，Sij=1. colink利用user.attribute和user.relationship的信息来计算源网目标网users的关联相似度，再利用阈值来做二进制分类（linked or unlinked）判断。
cotrain算法：先用seed算法产生初级S矩阵（初始linked user pairs要尽量正确precision且尽量多的把真实的user pair加入其中）。在迭代向S添加更多的linked user pairs：属性模型和关系模型识别的新pair，去掉两者矛盾的pair，再将发现的新pair添加到S矩阵。直到两模型无法发现新模型。
Accuracy=正确的/总数。如果10000人中有一人为HIV，而你挑一个正常人作HIV，你的accuracy=9998/10000. 为此我们用precision recall和F1指标来刻画模型性能。TP：HIV患者被认定为HIV的数量；TN：健康人被认定为健康；FP：健康人被认定为HIV；FN：HIV被认定为健康。Precision=TP/(TP+FP) 你认为是HIV的病人到底多少是真正HIV。Recall=TP/(TP+FN)多少真正HIV被你挑出来了。F1=2PR/(P+R)为P和R的综合指标。
Attribute based模型用两种方式实现：a. seq-to-seq：arch=encoder+attention+decoder, 双层LSTM(各512units)做edr和ddr，源网络输入attribute sequence为X，按照Eq.1-2来产生vocabulary每个单词的条件概率，用阈值来判断目标网对应的attribute sequence Y是否等同于X。该法思想如机器翻译，能处理同义、翻译、implicitly connected等问题（效果远好于string similarity计算）。b.支持向量机SVM：如Alias模型通过正负sampling（Xi Yi为同一user的两个网络属性表达为正sampling）提供训练数据，求解SVM超平面来区分linked或者unlinked。
relationship based网络：非本文重点因此用heuristic模型实现。即判断源网络用户u和目标网络用户u’是同一人 u=u’，if 源网络u的相关人x y… 和目标网络u’的相关人x’ y’… 在以前迭代中已经被认证x=x’ y=y’… 这样的超过threshold=2对就可以
candidate filter：理论user pair一共有 221k*2480k对儿，无法穷举判断，用filter先去掉大部分肯定不匹配的pairs. 剩下仍有758k candidate pairs之多。
Seed S 的选择。（a） course tune，设置初始S矩阵的原则，1属于candidate pairs，2job title在两网都得是’会计经理’，S初始为81对儿。（b）fine tune：设置初始S矩阵的原则，1属于candidate pairs，2relation关系中有不小于2个related人也在candidate pairs中。得到初始S矩阵有19K对儿。（c）noisy set：fine-tune的S中20%做随机user处理，来看co-train迭代是否抗噪声。
fig1.a coarse tune 开始S的81对precision=100%，但是有会计经理的bias，随后迭代添加的pair会不断挑出新pair提升recall值，但是因为有错误pair而precision下降。再后会计经理bias变弱，而precision会提高。fig1.b finetune的初始S数量提升，recall值达10%；随后迭代添加新pair会有错误而precision会略降低。fig1.c 初始S有噪声错误也不会使得系统性能发散。可以converge后做revision修正掉迭代前期的错误pair。

Ali: 20190720

CoChat: Enabling Bot and Human Collaboration for Task Completion

cochat: 人机合作task completion

task completion：如订餐和订票，用户与客服(或bot，或bot辅助)经过几轮信息交流，完成task。Fig.1客服与user间交互被记录于log，该对话信息可用于bot神经网络做supervised learn (SL). bot还可以辅助客服via提供suggested action(问问题或者回答问题)，客服选择bot所推荐的action或拒绝推荐而产生新的action，都可以作为记录让bot做online学习（OL）。有时（如客服下班了）user可以和bot直接对话，bot用自身所学与user交互，带完成后user会给bot打分评价，bot根据delayed 评价/奖励来增强学习（RL）。上述三种学习都是为了提高MHRNN网络的能力来a更好的提高user满意度；b减轻客服的workload。
Fig2为MHRNN：外挂memory的等级RNN架构。LSTM1用来逐字encode user（第m轮）所说的话为feature vector um； user entity（订餐场景下的用餐人数，订餐人姓名，用餐类型等）可提取于用户对话信息，API返回值（如酒店位置，是否有空位等）可用二进制vm表达；当前action可用二进制vector wm表达。三者concate在一起经过FN1后形成第m轮的状态特征矢量xm（eq.2）. LSTM2为高级encoder能对之前的m-1轮信息进行迭代综合出zm，再配合当前用户utterance um和usr.entity-API vector vm, feed到FN2得出本轮诸候选action的选择概率。挑出top5给客服做suggestion。
遇到新action ai（即客服worker没有接受bot推荐而是自己针对对话state产生新的应答action），MHRNN会改变架构，给action set的矢量w加一维来表达ai，给FN2的softmax输出加一维表达ai，相关的权重连接随机近0初始化，而不影响以往学习。新action ai往往开始只有很少occurence，被存于外挂Memory中 Fig2.紫框。未来如果有对话状态及其接近(eq.7计算)则选择ai作为action的概率qi会很高(eq.10)。此处外挂Memory助one-shot learn机制不同于RL的transition M.buffer.
HRNN的优化利用到HRNN输出action概率分布与客服选择分布的互熵(eq.5)。在线学习时网络参数变化较大，加罚函数约束(eq.6). 外挂M使用要判断对话状态r的相似度(eq.7)含有历史 user entity-API vector vm 和context vector c。
结论：MHRNN作为对话管理器的架构，能做人机合作，提高用户满意度和减少客服workload。本文用到SL、OL、RL，能连续改进HRNN网络性能，能应对新worker的action，做one-shot learn。

Nat.Rev.NS: 20190713

Managing competing goals — a key role for the frontopolar cortex

Frontopole的多任务管理

Fig.1: Frontopole(Fr.p) 进化最新，发育最晚成熟，处理高级认知，接受高级association cortex（如dlPFC-rule、ACC-error、OFC-value、Tm.p-vis.obj、mPFC-WkM、PHC-cog.map、ST-sound）。人的Fr.p的绝对体积相对体积都很大，比猴多进化出l.Fr.p（黄区）.
Fig2.: Goal-directed行为要求能(1)exploit当前task, 知道当前goal调动执行网络（dlPFC ACC OFC等）来执行action、估计行为结果、评估当前task价值。（2）能explore alternative tasks，对不同task的价值做评估。（3）如果当前task没价值了，能redistribute认知资源来找一个有前途的alternative task做。
Fr.p受伤不影响IQ、语言、感觉、运动、执行控制，adapt to rule change、rule的WkM、行为结果价值评估。却影响novel changing situation的task
认知branching：得存main task的cog.sets (task相关的configuration或parameters）于STM，待做完alternative task后，能resume main task。人的l.Fr.p做此，猴没有此功能区，所以学完A task后，被B干扰，再回到A task得重新学。
Fig3a:猴做WCST，给出sample后，猴通过多次trial&error的方式学习rule（可以是形状匹配或者颜色匹配），在decision期出现3个item，猴根据察觉的rule来触摸屏幕选择item，正确匹配会给果汁奖励。dlPFC.n放电encode不同的rule（蓝-形状匹配，红-颜色匹配）于sample期。OFC.n在奖励前有anticipation，如果rule的conflict强（红线）anticipation弱，奖励确认后出现很强的spikeRate做基于奖励学习的信号。
Fig3b: 猴做策略task。先看策略cue（|为stay：保持上次saccad方向；-为shift，与上次saccad方向相反），猴在Acq时刻sacaad，而后根据saccad方向对错在feedback时刻给予/不给果汁。Fr.p不被策略cue、实际策略、上次saccad modulated。Fr.p.n.activation只在Rw期被modulated，且神经元preferred action得奖励时放点增强。
Fig4: 猴在WCST，rule（颜色匹配、形状匹配）会变，猴通过trial&error来找rule。伤dlPFC、ACC、OFC会影响rule.chg的察觉。而CTRL、伤Fr.p不会影响rule.chg的察觉。说明dlPFC、ACC、OFC做rule.chg的察觉，而Fr.p做任务切换。
猴训练于WCST-interruption：正常ctrl猴先WCST，察觉rule后，加脸识别task作为干扰，后回WCST完全忘记rule只有chance水平。而Fr.p lesion的猴回WCST后能力不减。说明(1)ctrl猴不能做cog.branching。(2)干扰task使得ctrl猴去explore，而忘掉WCST rule。(3)Fr.p伤的猴不能跳离当前task。(4)当前task没价值后，Fr.p能redistribute认知资源去做alternative task。
one-trial learn（猴选红碗为空，下次会选蓝碗）。能valuate所选item，也能推理未选item。随着问题不断重复，learn rate剧降后靠其他区的repeat RL学习。Fr.p做快速explore学习novel alternative task value。
Fig5: 猴的Fr.p与posterior PFC（ACC dlPFC OFC等）功能互补，平衡于（1）exploitation 通过招募posterior PFC执行认知控制来优化当前task performance，提供当前task value。(2) exploration 通过Fr.p来disengage当前task，并redistribute认知控制资源到alternative，监督alternative task value。如果当前task被认为irrelevance，会shift到alternative，此为undirected exploration。
Fig6：人的Fr.p（从猴进化出l.Fr.p）.而人的m.Fr.p相当于猴的Fr.p可做undirected exploration。人的l.Fr.p能elaborated exploration（directed exploration）能同时监督几个alternative tasks，并redistribute认知资源到最有前途的一个。dlPFC做执行控制当前task。
人仲裁于explore&exploit。有两套系统：（1）basic system（m.Fr.p，actor）monitor online策略的relevance，当前task没价值会触发undirected exploration，让新cog,set（源于以往所学LTM的context相关的策略）成为actor，后被adjust于外部contingency。若被deem为relevance则会被consolidate为LTM。（2）add-on system（l.Fr.p）同时监督几个online alternative tasks，允许directed exploration（能保留main task cog.set）。
环境复杂变化产生进化压力（尤其对social behavioural species）使得发育出Fr.p的系统来disengage并redistribute资源于各种tasks之间，导致高级认知和智能产生。

Nat.Rev.NS: 20190706

Specializations for reward-guided decision-making in the primate ventral prefrontal cortex

vPFC基于价值决策的神经机制

猴选择不同盒子得到不同果汁奖励，他察觉并学习到盒子形状和奖励的关系（物-结果-价值）。而后在生活应用/test中，能利用到这些Association知识，选择action得到最优化奖励（不一定最大化，比如吃一万个香蕉对猴子来说不是好事儿，所以吃香蕉后会devaluate香蕉价值）
Fig1. 蓝色区为OFC=14/11/13, 处理对外物desirability（香味，有营养，甜，有价值）的encoding。其输入来自Insular、amygdala、嗅球等内脏感受情绪等信息。紫色区为vlFC=12/45，encode奖励的availability（如黄金难得，空气容易得到），其输入来自ST的听觉和iT的视觉信息。
Fig2a 六臂bandit实验：三个种图片，对应不同概率出现果汁奖励（有图为每个trail的probility，其中前150trials蓝色六边形概率最大，后150trial变为红色最大概率出现，如果有奖励其量/desirablity固定不变），猴应该能感受到奖励概率变化，图像选择上做相应调整。Fig2b为devaluation实验：后先学习紫色锥体下有花生，绿色半球下有草莓，其他为空。test时，猴子先狂吃草莓到腻（devaluation阶段,对草莓value变很低），然后猴应该选择锥体吃下面的花生.
伤vlFC会影响六臂bandit实验performance，不能察觉150trial后红色方块奖励概率提升而蓝色六边形奖励概率下降。故vlFC负责availability（probability）encoding。而OFC伤会影响devaluation实验，狂吃草莓也没有吃腻的感觉。故OFC负责编码对食物的desirability
lOFC=11/13，负责多维度desirability的表达和更新（比如买房有地段、学区、价格等各因素，且根据中高考成绩这些属性会变化）。mOFC=14综合各维度value为一个维度，然后比较option。
alPFC=13，接收insula、amygdala，NAc等输入，更新食物的desirability各个维度value。狂吃草莓时就lesion掉A13, 猴不会有腻的感觉继续吃草莓。狂吃草莓后lesion掉A13, 猴已经对草莓腻了，而后会倾向花生。plPFC=11，做goal selection，狂吃草莓后lesion掉A11, 猴尽管已经对草莓腻了，但是还是会选择草莓，因为value到action出问题。
Amygdala对OFC提供value的输入（在看image的期间），lesion掉Amy会使得部分OFC.n不放电（一些OFC.n放电因为其他modality的支配），Amy的价值大小输入决定多少额外OFC.n放电。做决策和给奖励（此时才能学习）时，leison掉Amy输入也减少OFC放电神经元数量

Nat.NS.Rev: 20190629

Gut feelings: the emerging biology of gut–brain communication

内感受的胃肠-脑神经机制

脏-脑相互作用调节肠胃功能、处理feeling状态、做直觉决策。
肠神经系统（ENS）位于gut层间神经节丛，数量等同脊髓神经元，通过各种反射（如蠕动反射）控制gut功能。ENS也出现在昆虫蜗牛息肉等，对内环境stimulus做response。为自主神经系统（ANS）的第三分支。
运动神经系统（脑控制骨骼肌做有意识的运动，脊髓alpha motor neuron直接支配手臂等肌肉）。ANS通过交感、副交感神经支配内脏平滑肌自动处理内脏运动、分泌等。交感神经系统做Fight&Flight，节前神经元位于腰椎胸椎，经由节后神经（胞体聚集在神经节ganglia上）支配各种脏器。来上调心率血压等下调消化等功能，以保证血液到骨骼肌为F&F做准备。副交感做rest&digest，节前神经在III、VII、IX头神经（支配foregut）和sacral骶椎（支配 hindergut），节后神经靠近脏器，来引导血液到消化道，产生消化相关的肠胃蠕动内分泌胃酸和休息等活动。
ENS有两类细胞：肠内分泌细胞（EE）能感受胃肠道腔内机械化学免疫等状态，在细胞基侧分泌释放各种gut肽。Fig1b，腔有营养物质如长链脂酸，能被GPCR感受启动下游蛋白级联反应，Ca2+内流，从而在basolateral表面释放关于satiety pleasure的胃肠肽，被afferent terminal感知。甜和苦可由GPCtasteReceptor（T1R T2R）感受，各种病原体可由TLRs识别，经由蛋白级联放大信号，引发钙离子内流，释放相应的信息的胃肠肽（如释放Ghrelin代表饥饿，放CCK/肽YY/opioid代表satiety，放5HT代表炎症，CRF代表stress等）。肠嗜络细胞（EC）机械敏感，腔内有content产生切应力，会使得EC离子孔道TRP打开，释放5-HT。
BOX3。脏-脑等级静稳态反射：诸多肠反射（如蠕动反射、化学刺激反射、分泌反射）整个反射环在肠壁内。胃反射（如十二指肠-胃反馈控制胃清空）在肠系膜，甚至Vago-vagal反射（反射环involve dorsal vagal核）。疼痛反射involve脊髓神经元，收到情绪以及ANS反应等调控。更高级一点的是经由pontin-medulary核（Raphe，LC核）慢性抑制低端反射增益。PFC能自顶向底（根据情绪，内部感受记忆recall等）regulate交感、vagal、脊髓dorsal horn。孤束核（NTS）为vagal afferent的relay核，能在medular水平支配DMNV（dorsal motor neucleus of vagus ）的premotor.n. 而NTS+DMNV=dorsal vagal complex (DVC). A1/A2/A5为儿茶酚胺核能支配autonomic effecter于rvlMedula/vmM.
ANS可被triggered reflexively by (1)上行gut的内感信号，(2)下行的认知情绪信号。
顶向底指导情绪相关的motor、分泌、免疫的pattern变化（类情绪相关表情姿态变化）。情绪引发周边神经元平滑肌activity变化，内感受又反馈回脑，形成prolonged情绪状态，影响各种受体分布、连接plasticity, 以及情绪变化如焦虑产生。
Fig1a肠腔微生物病原体，营养，机械、化学刺激能经由EE、EC来detect到并转为相应的胃肠肽信号。该肽信号可内分泌经由血管到target脑区，抑或胃肠肽的旁分泌被extrinsic afferent和IPANs的terminal受体识别，并由vagal上传至脑干，由spinal afferent上传至脊髓，以及负责多种肠胃功能反射环。
ENS有2-6亿个神经元处理有机体与腔内环境接口（内感受的肠表面积为外感受的皮肤表面积的100倍），肠表有100trillion微生物，4万种，100倍于人的基因，此处有2/3的人体免疫细胞。
EE为gut表皮细胞仅占1%却构成最大的内分泌器官，EE供first level integration of腔内容物的化学/机械信息。EE输出支配ENS控制胃肠功能，通过内/旁分泌上行传内感信号给CNS。人体95%的5HT由大小肠EC分泌，microvilli的机械敏感离子孔道能释放5HT来出发胃肠蠕动和5HT反射。
肠上皮细胞形成单层barrier分离host与微生物群。70%的免疫细胞在胃肠粘膜，他们对正常菌群hyporesponsive，却能识别抗原并通过胞吞来提呈抗原给免疫细胞处理。一些vagal afferent terminal近于粘膜免疫细胞，有受体能识别MastCell产生的（protease、histamine、CRF），巨噬细胞产生的cytokin。
Fig2：gut将营养有关的信号由spinal、vagal、内分泌传给CNS。内分泌经由血液循环系统可达指定脑区AP或者hypothalamus，旁分泌的肽由spinal、vagal上传达到相应功能的aIns。Taste感觉方面主要encoded于aIns（多模态的integration，含内脏感受的Satiety信号于aIns，食物的味mIns、嗅觉aIns，视觉听觉于OFC，奖励价值于NAc&VTA，内感记忆于HPC，情绪于Amy，认知于PFC）该多维度食物经验决定摄食行为。胃肠道内感由Spinal-Lamina.I & Vagal-NTS，以及痛觉Spinal-LaminaV/VII/IX再integrate于Parabrachial，此再传至Hyp和Amy。Craig认为人有body静稳态的image于前后Ins that 可被modulated不用情绪与认知。
Fig3 肠胃静稳态(释放放CCK/肽YY/opioid)，aINS的Gut感受为满足舒服，皮层认知为pleasure和wellbeing。当胃肠粘膜炎症毒素(释放CRP/P物质/cytokin)，aINS的gut感受为腹痛不适作呕，皮层认知为痛/疲劳/抑郁/焦虑/厌恶。当胃肠腔缺少营养(Ghrelin等)，aINS的gut感受为饥饿，皮层认知为渴求食物。
看别人恶心或自己恶心都aIns或ACC相同区放电，说明aIns和ACC级别的反射可以触发于内感信号或者视觉听觉等recall的内感记忆。这种feeling state的recall为原来gut sensation的多模态表达，可没有gut signalling。
内感记忆源于新生儿期，不舒服相关于腹静稳perturbation，pleasure相关于进食。婴期情绪undifferentiate，对负面内感外感有stereotypical行为反应（吸奶、哭闹、呕吐、排便等）。此为positive negative feeling state基础，为婴儿对世界事物的value map。无脑儿，用蔗糖使舌头的甜受体刺激也出现stereotypical反射释放opioid，此可associate于皮层的wellbeing解释。随着成年这些感受代表value，如社交成功会pleasant feeling，社会排挤会闹心恶心，看到美女美景会feel秀色可餐。通感来做value评价。
直觉决策：在未知条件下，凭借感觉而非推理，快速评价行为反应出现喜欢和厌恶结果的概率。位于Frontal-insula，如处理复杂社会关系。直觉决策能力获于早年refine于发育过程。
静稳态perturbation，如吃到腐烂食物，EC会感受到toxin并放出5HT，IPAN的5HT3Rp活化，周边神经启动呕吐反射，vagal afferent将gut不舒服做呕信号传给大脑，将食物图像味道和内脏感受associated为内感记忆。
Stress下释放CRF（Corticotropin releasing factor）,启动类焦虑症的反应pattern：减慢胃肠蠕动，减少代谢需求，血液进入心血管骨骼肌来准备F&F。CRF抑制剂可以缓解此种反应
肠炎释放cytokin（histamine、protease等），afferent terminal释放P物质，使得以往不responsive的机械离子孔道变得敏感，且增加gut-脑信号，致疼痛过敏。功能性胃肠障碍会recurring腹痛，提高焦虑并发症。
肥胖症：吃过量卡路里食物，渴望食物的hedonic value，尽管知道过量饮食的副作用。treatment方法少，胃部手术为有效。NI发现病人对food cue的奖励电路敏感，而实际食物的内感奖励敏感下降。神经plasticity使得encoding机制变化，减弱肠胃内感信号的responsiveness。而厌食症：构建对抗eating，沉迷于减重，尽管知道得吃东西。
Fig4：(在aIns对实际内感受的表达)与(来自内感记忆或PFC调控的内感状态预测)两者mismatch，会被ACC发现，并通过唤起情绪再领用ANS和下行bubospinal调控胃肠功能，产生altered内感反馈给大脑。若仍然correct预测误差或此mismatch，会引发脑-脏轴神经plasticity以及慢性功能失调。

Nat.NS.Rev: 20190622

Active perception: sensorimotor circuits as a cortical basis for language

语言理解的感觉运动电路

特定motor区神经元放电影响人对音节辨识、语义理解、语法分析。
Sensorymotor神经元放电于自己吃苹果、看别人吃苹果、想别人吃苹果、听到别人叭叽叭叽吃苹果声音。类mirror神经元、接口神经元受到sensory和motor两方面因素调节。
Fig1人脑左半球perisylvian的区域iFrontal(负责说)-AF-sTmporal(负责听)双向连接远强于猴，为语言的神经基底。在音节重复中主在于Aud背流，句子理解中主在听腹流。
Box1. A1: Primary Aud；AB: Aud belt; PB: ParaBelt; PF: PreFrontal; PM: PreMotor; M1: Primary Motor; A1-AB-PB主要做音的谱分析出音素，(1)再由背流到PM产生音节或句子重复;或(1’)由腹流IT-PF理解句意，处理thoughts，再由PM-(M1)来表达出来或不发声的表达出来。伤A1为Wernick失语症，影响理解语义不影响speech产生。伤Broca区不能speech且语法障碍(不能order action sequence)，但是可以理解别人说话。伤AB-PB-PF-PM影响不同程度发音与听音，可能表现在语言task上的错误或者延迟。
婴儿1岁语言敏感期，根据母语环境调整脑sensory-motor电路不断babble出声音且理解别人声音。
silent articulate(默念)也能activate sTemporal听感觉区，且默念速度加快sTemporal放电增强。说明motor.activation能feedback给aud percetion加强识别理解默念语言。听音后100-250ms时motor区就放电，这和理解语言时间一样短，说明motor.n.activation是理解语言而非理解后的处理。
Fig2：音节识别区。’p’音用唇，’t’音用舌。识别两音主要位于M1区偏上的嘴唇控制区(红)和偏下的舌头控制区(绿)。此为fine grained somatotopy。无论articulate音节、silent articulate音节、听别人读音节，该区’t’时都是舌头区放电。弱TMS刺激舌区，会提高对’t’的反应速度，提高把’p’读成’t’的错误率。
Box2 (语义的category specific): 总体处理语言的在perisylvian区；颜色相关单词和意义在IT/fusiform/旁海马；形状相关单词与视觉意义在fusiform/mTemporal/dlPFC；face相关单词与语义在motor区偏下(绿)关于脸舌口唇(该区神经元即控制相关肌肉动作又理解相关词汇如lick、eat)；arm相关单词与语义在motor中部(红)关于手臂(该区神经元控制手臂运动与理解相关单词如pick、grasp，甚至’grasp the idea’时该区神经元放电于grasp)；leg相关单词与语义在motor顶部(蓝)关于腿脚区(控制腿脚运动以及相关单词如kick walk). FrontlTemporalDementia伤 frontal pole时会波及处理face和颜色的神经元，因此早老年痴呆病人常分不清颜色，但是手臂相关词汇理解没啥问题。
语音在sTemporal，语义在广泛区域。名词相关于object的在iTemporal区（如颜色形状脸动物等为语言与视觉流交汇的广大区域），动词相关在motor区（甚至tool的理解也在于它的如何被使用），味道相关的单词（如smelly）在嗅区处理，声音相关（如telephone，哪怕是手写体单词的处理）在sTemporal的听觉区。语义activation在多modality感觉区converge处。
语法处理：从句子中提取string.element组合信息（新生儿对音节顺序不同而放电不同，如好吃和吃好），为domain general。复杂语法如嵌入式：如action的’开门[开灯]关门’，语法’the man [eating apple] is zhangsan’）有相似的等级结构。可能在Premotor。躯体顺序action（如拿筷子、夹菜、放入口、咀嚼、下咽）由Premotor处理，有sequence specific神经元。
Broca和wernick区连线perisylvian处理复杂语法（语法难度增加，放电变强）。 ATL-Braoca区处理简单语法（merge规则）。伤Broca单词理解无大碍，但是agramatism，不能align凌乱的单词、也不能order action顺序。

Nat.NS.Rev: 20190615

Resolving the neural circuits of anxiety

焦虑的神经电路基础

情绪可以综合内状态（如饥饿）与外刺激(stimulus, sti如见到奶酪)来快速选择环境相关的行为（avoidance-approach）。此为进化产物，见于诸多物种。
Fig3.感觉器官先detect到外部sti（如看到老虎，听到虎叫，触摸到虎毛），再由BLA解释该感觉表达为危险还是奖励，mPFC等高级皮层再对此进行权衡（危险和欲望哪个更重要），然后做相应的行为反应（荷尔蒙分泌如糖皮质激素，血压增高，心跳加速，瑟瑟发抖等）
病理焦虑是对中性或者缺少sti做过度警觉负面valence等（正常焦虑有助aware免于危险）。成人18%焦虑症，28%lifetime prevalence。
老鼠的焦虑模型：有validity，即鼠焦虑的神经、生理、行为与人类似，抗焦虑药物（如Benzodiazephines）有效于老鼠也有效于人。鼠有avoidance-approach conflict，喜欢探索approach新环境，也喜欢躲在黑暗墙角旮旯避危险。EPM（elevated plus maze）task和OFT（open field task），焦虑老鼠花更多时间在walled arm。social interaction task焦虑老鼠花很少时间与陌生老鼠用超声交流。
焦虑相关loci（Amygdala=Amy, Hippocanpus=HPC, BNST, mPFC）。Amy接受sensory sti输入并assign positive or negative valence给中性sti，输出奖励或者威胁的预测，分别支配下游NAc或者CeA（Central Amy）。BLA-HPC-LateralSeptum-hypothamus直接产生焦虑反应,或有mPFC-BLA影响对threat的评价。
侧amy放电于unconditioned 电击引发发抖（而铃声-电击-发抖需要海马做association铃声与电击）。BLA支配CeL的两群互相抑制的IN（一群为有PKCd激酶的能抑制焦虑，一群没有的能产生焦虑，Fig2d）。BLA-CeM能potentiate于学fear.condi。光sti CeM能Anxgenic（而CeL部分神经元能兴奋CeM，部分抑制CeM）
BLA(HPC/mPFC/Ins)-BNST能启动并且维持焦虑反应。adBNST能Anxiolyse，ovBNST能Anxiogenic。vBNST-VTA可并行发glu或者GABA来产生或者抑制焦虑行为。
BLA-HPC为获取context fear M的必要条件，光抑制于学习期导致reexposure CS时不freeze。
（Fig2b）HPC-LS-hypothalamus产生焦虑行为. LS.IN(含CRFR2a的)-|aHyp-|PVH&PAG:去抑制即增强神经内分泌且增强焦虑表型
HPC target 于BLA的fear神经元（再投到mPFC），该n放电作为extinction后fear renewal的必要条件。
很少绝对威胁sti，需要evaluation层对解释层（主要mPFC）做反馈modulation。不是遇到威胁就一定躲开（比如饿的受不了了，有危险也得上）。鼠mPFC分为PL（prelimbic）与IL（infralimbic），其主要input来于Thalamus、BLA、HPC，主要output为BLA与striatum。Aud.Fear.condi中BLA-PL，而后PL对CS.cue反应增强（因phasic抑制Pavabumin+的INs，该中间元为cue induced freeze必要条件）。而BLA-IL增加使得fear association extinction（sti IL能减少freeze to CS）。mPFC能前馈抑制Amy，克服其对威胁的解释 in favor of appetitive行为。（如饥饿或其他欲望强烈时，明知危险还是要上）。mPFC能shift balance between奖励与焦虑解释，并直接投射到NAc与Amy。
fear extinction: 因为unpaired presentation存在太多而使得对所学CS反应下降（如铁笼子有过电击，后来去木头塑料铝合金玻璃笼子都没事，慢慢对铁笼子也无所畏惧了）。Habituation：反复出现某中性sti，开始预兆危险，多次exposure后不再焦虑反应（如警铃刚开始响的时候吓一跳，时间长了就无所谓了）
在EPT实验的危险区，HPC.theta使得mPFC同步（HPC让mPFC构建关于环境的aversive feature表达，即entrain）。Fear.condi后HPC.CA1与Amy有theta同步于见到CS。HPC发起的theta传递anxiogenic信号给Amy和mPFC。mPFC发起的theta（主要IL lead的fear extinction）传递safty给HPC和Amy于CS presence （mPFC使得Amy与HPC同步于自己）。
两个人对同样的sti可以有完全不同的解释，如loud noise, 人A认为是爆竹声而看天，人B认为是枪声而躲藏。此evaluation与人的经验有关。Actor-critic operate于evaluation system（critic为当前环境状态和action维持一个Q.value map，actor根据当前状态产生action来最大化未来奖励加权求和）。这应该由Dopa相关的striatum负责，BG为limbic-motor接口其放电助init response。
焦虑疗法应考虑整个电路，CBT（cognitive Behavioural Therapy）目前最为有效，取代对sti的maladaptive解释，能影响整个电路。TMS和超声聚焦某节点可以影响下游电路放电改善焦虑症状（如增强IL-BLA传递的safety信号，减弱BLA-CeM的fear association）。

Nat.Rev.NS: 20190608

Computational neuroanatomy of speech production

Speech产生的等级状态反馈控制

等级状态反馈控制模型（HSFC）综合心理语言学(高级，处理音素音节词句)和motor control(低级，反馈控制舌唇声带肌肉来发声)
听(处理声音的A1区)与躯体感觉(处理舌头喉咙等感觉的S1区)定义等级motor speech的target（即说出的声音应该长什么样，对应舌头嘴唇的感觉应该什么样），声道发出的声音应该和期望接近。内部反馈控制环(有前馈预测和误差修正)
感觉反馈有延迟，如你发出伸手的命令，过一小会儿才能伸出去。你期待的感觉，需要等一会才能得到现实感受的验证。为了提高行为效率，脑会根据经验建模世界，来预测未经历的结果。
Fig1.SFC: motor controller 发出控制命令给motor effector（胳膊肌肉），胳膊伸出去，被感觉细胞detect到胳膊状态变化(外反馈)。控制命令被copy给内部前向预测模型，能在尚未出现外反馈结果之前就预测出期望的胳膊状态（内反馈）。预测与实际测量的感觉状态做差，为与期望的误差信号反馈给controller做下一轮调整。
外反馈：a能建立motor command与sensory consequence之间的联系(学内模型)。b在出现系统性偏差时（如肌肉疲劳需要更大的上游刺激）能update内模型。c出现临时perturbation（如地面有颠簸）能及时检出并修正。
心理语言学：speech planning，能转thoughts into speech act. Fig2：Speech产生于概念想法表达，变成具体词语表达（lemma水平, code了对应词的抽象特性），经过phonological representation，由articulator系统发出期待的声音.
Fig3：SFC的speech实现：用到2-stage model，语义lemma选出word表达给motor和sensory phonological systems。红箭头指示Aud.phono.sys提供期望能听到什么样声音，经过Aud-Motor变换，转为对应motor.phono表达，由motor control（M1 的alpha motor neuron）知道声带肌肉振动发出相应的声音，来尽量满足Aud.phono.sys提出的期望。绿箭头指示内部前向预测模型，control command的copy经次内模型能快速预测出sensory consequence，可在真实感觉结果出来前来调整动作
传导性失语症：能fluency说话(motor.phono.sys正常)，能正常感受理解speech(aud.phono.sys正常)，但是经常发音错误（aud-to-motor translation @spt出现问题）。
Fig4 HSFC架构：起于想表达的概念，选择对应的word，词表达同时传给高级（音节级别，BA44-Spt-STG/S）,音节在分解为低级别音素（M1-小脑-S1），M1控制声带舌头等肌肉发声。声音信号外反馈传到STG/S的Auditory区，嘴唇声带的肌肉感觉外反馈传到躯体感觉S1区。高级区处理音节(元音辅音构成的音包)cycle，低级区处理音素（声带开为元音闭为辅音，end point的嘴唇舌头声带的gesture能代表所发音素，无论是否发音拖长，保持识别不变性）
aud.speech.form自动能定义motor target，存在reflexive Sensory-to-motor. 别人speech也能activate听者motor speech system。但是正常人能选择抑制真实发声（Echolalia病人不能选择抑制总重复别人声音）
腹侧PreM为motor vocabulary，其motor neuron能发出不同音素（英语中所有音标）。聋哑人手语的gesture库的控制运动神经元也在这里。PreM支配M1控制具体发声肌肉群。
AOS（speech失用症）类传导失语症，但是PreM坏了，不能流畅发音。构音障碍症，某些M1神经元或者小脑连接坏了某些音发布出来或错误。
overt说话，error有lexical bias（不会出现假词）和音素相似bias（倾向相似发音的错误单词）。想象说话（动嘴），both lexical bias和音素相似bias。想象说话（不动嘴）只有lexical bias。因为嘴巴感觉影响音素处理。动嘴巴会激活MotorCortex和S1的反应。
A1与S1有交互，S1提供躯体感觉信息来助听皮层处理音节时reset temporal phase。
Sensory 与motor相互作用来保证motor表达能hit aud.target. motor表达能reinforce aud.target. efference command copy 经前向预测信号抑制aud.phono.sys, 若外部反馈信号正好与预测抑制则没有error反馈。
motor response 对sensory response有抑制作用。听自己说时aud放电不如听同样录音反映强烈。a此motor induced 前向抑制能在早期做error correction incase 错误motor program。b此可以抑制本时刻aud.target来帮助下时刻词语产生。c通过预测与实际测量的差来检测deviation。d解释motor induced sensory抑制作用。e解释motor影响speech perception
Fig5:一个lemma节点表达cat，excite motor与auditory不同表达节点(cat为target word，tuck和cut为non-target)。同样概念的aud对motor有兴奋作用，motor对aud有抑制作用，motor与aud各自内部节点相互抑制。fig5b: lemma前5个时间点分别发出强信号给motor和aud的cat节点，结果motor.cat节点随后放电表达cat（浅蓝），aud.cat节点被motor抑制(红)。fig5cde lemma给强信号于aud.cat节点，不久后motor.cat节点能正确强放电。fig5f lemma给强信号于motor.cat节点，最后motor.cat节点放电不那么robust。aud.cat节点放电定义motor.target为cat最为重要。

Nat.Rev.NS: 20190601

The cortical organization of speech processing

Speech处理的脑皮层组织

1.Fig1：speech处理的双流模型：声音在dSTG(双侧绿区)做声音的谱分析，某时段的谱在(双侧黄区)中后STS被转为音素(元音和辅音)。而后分为a腹流(红区，双侧但是偏左，将语音信号映射出mental语义表达)pMTG为音-义接口，可以音信号可以激活对应的语义神经元(广泛分布于iTemporal(灰区)，如听到’张三’后其脸在FFA神经元会放电)，词义在向前传到ATL做语义merge(如，大+苹果)，而后由白质束FOP介导到Braoca区做语法处理（如，理解’吃大苹果’）。b背流(深蓝区，左半球，将语音表达映射为motor神经元放电控制声带舌头说出想说的话)语音信号在感觉运动接口(即听说接口，位于Sylvian-fissure Parietal Temporal boundary, Spt)将想表达的音转到对应的motor区(Premotor和Broca区)让对应的motor neurons放电而舌头声带协同产生speech。

2. 伤左半球不太影响speech recognition(由声音查lexicon)，因为右侧有备胎。伤左半球一般不能识别音节(元音加辅音，一般为声音波形的packet)，因为背流处理识别音节只单左侧。伤左半球一般造成conduction失语症(数数时1234#@#678，想说5但是说不出来)。有病人能识别音节(背流正常腹流伤)但是不理解意义(比如外国人说话每个单词都清楚放一起不知道讲什么)，有病人能识语义(腹流正常背流受伤)但是不识别音节(如妈妈说吃苹果，你就按命令去吃，但是问你妈妈说苹果了吗，你不知道)。

3. 语言学：声波-频谱-因素-音节-音词形(er代表人)-词义-词组-句意-文章意义（实际并不是完全并行，分不清音节也可以理解词义）

4. 视觉背流(where流)在parietal与躯体感觉区接触，该处神经元不仅对眼前的苹果放电，闭上眼睛去reach 苹果也放电（即神经元同时受到视觉motor effecter影响）。optic ataxia共济失调，能知道眼前物体是方的，但是够不到。visual agosia，能够到物体但是不知道物体张什么样。

5.被动听声音，双侧STS、STG放电。speech的fMRI减掉背景音的fMRI得speech音素处理的区域(Fig3)。假单词也使得音素黄区放电，甚至lexical接口区放电，但是不能激活iT的具体形象意义。

6. Fig4：reproduce speech。前向通路：双侧STS处理声音，spt将声音表达map到motor articulatory区。feedback monitoring还可以纠正发音错误（conduction失语症就是Sensory不能提供guidance给speech sound sequencimg）。应该有working memory功能保持默读声音或音素时序表达。

7 Spt为声道相关的sensomotor integration。音乐家听完曲子后，用mental哼哼方式重复spt放电明显，用mental play keyboard方式重复spt放电明显弱。Spt为PlanumTemporal的一部分，接受多模态输入(如speech、tone、music、spatial sound、visual speech、sign image等)，神经元根据输出端的motor effecter组织在一起。

Science: 20190525

Independent Codes for Spatial and Episodic Memory in Hippocampal Neuronal Ensembles

海马神经元群对空间位置和片段记忆的编码表示

Moser夫妇因grid cell的发现而获得2014年诺贝尔医学奖。本文作者为妻子May-Britt Moser。
本文研究海马CA3(330个)CA1(487个)神经元同时放电于两种情况：1 cue变化（盒子黑白色、方圆型）地点不变（如在厕所做实验）。2地点变化（厕所或厨房）但cue不变（黑色方盒子）
Fig1. （地点不变如在厕所）盒子变换形状或者颜色，每个CA3神经元的放电rate map的pattern不变，但相同rate map pattern下整体强度受控或者编码盒子颜色和形状
Fig2. （cue不变，如老鼠在黑色透明方盒里面跑）实验地点分别在A厕所B厨房，发现CA3或者CA1的具体神经元rate map pattern完全不同（有报道说有正交关系）
Fig3. 分四种情况：a（control组）同样是白盒子同样在厕所，分别早晚各做一次实验，发现各神经元的两次实验的rate map pattern相关度都很高，pattern质心差别甚微，放电率差别甚微，方盒各点Population Vector相关度（所有神经元rate map摞层3D，看两次实验的每个位点的矢量相关系数）巨高。b（盒子颜色为黑白的两次实验），与A相似但是盒子颜色调节map整体强度，使得相关度下降。c（盒子形状为方圆两种），与B类似但是形状调节map整体强度能力更强，相关度下降更猛烈。d（实验场所为厕所和厨房），map pattern完全不同甚至正交，所有相关接近于零。顶图为CA3，底图为CA1。CA3放电rate受到颜色形状调节更为明显。
cue就是episodic event、实验地点就是spatial调节。海马神经元群能同时encode空间位置（如Fig1C，众神经元Cell1-9放电能tile老鼠盒子中的位置）和事件特征（盒子颜色形状，prospective目的以及retrospective经历，由多neuron各自map整体放电强度来encode）

Nat.Rev.NS: 20190518

Over the river, through the woods: cognitive maps in the hippocampus and orbitofrontal cortex

海马与OFC的认知地图功能

Tolman认知地图：学习stimulus-response关系来构建关于’世界’认知的地图（地图样的因果associations）来做plan和推理等实现goal。该认知地图不限于spatial map，亦可是因果关系如(stimulus开水，action喝，outcome痛)喝开水会痛。

2. 认知地图得a识别分解世界为离散状态，b学并建立各状态间联系，cEncode状态到价值的好坏，d基于此做plan与结果预测。整体用多结构分布式model-based goaldirected完成于海马和OFC

3. 海马：为mapping（spatial或抽象因果关系），bind对外部的sensory features与内部情绪motivation价值形成关系database。encode外部世界做认知推理

4. OFC：基于奖励/价值的行为选择。形成并维持task state（尤其非直接observable的task，如经过trials后意识到每次左转有奖励）。意识到task变化。task state 的认知地图

5. Fig1 a-c为海马placecell（PC）对位置的coding，多PC顺次放电代表所经历的trajectory。公共段的world state相同，左、右转有各自海马n放电表达不同状态。有non-spatial factor可以影响PC放电。 Fig1d-f OFC在decision making task中的放电表达。OFC.n放电于（cue，action，outcome）来encode当前task state。对特定味道某OFC.n放电与否依赖于其所存在的整个sequence。

6. 海马PC反应于环境整体拓扑（无奖励相关Reinforcement），也受到non-spatial factor调节（如从左边经过A地某cell放电，从右边经过某地则不放电）。能prospectively explore world model。能直接experience能inference。

7。 OFC能学response-outcome关系，识别当前outcome-value变化。能parse world为离散state，并assign value给每个state。能track task的variables（如买房子时有人要考虑孩子上学的因素），能prospective不全task info来前瞻结果before experiencing。伤mOFC不影响explicit task行为（左箭头就左拐），影响unobservable task行为（多次尝试后知道左转有奖励）。OFC能将大量variables（如买房子考虑地段价位朝向楼层学区等）融为一个worth value。该价值源于state表达用于指导行为。

8. BOX: 海马OFC有直接相互作用，海马经由subiculum传CA1信息给OFC，OFC需要经由旁海马（perihinal， posterihinal，entorhinal）传信息。OFC与海马还经由thalamus reunion核来协调信息流方向。海马OFC信号支配VTA，VTA为多巴元key于associative学习，用奖励期望误差来调整突触以期做正确行为选择来获得更多未来奖励。海马OFC信号支配vStriatum，其ramp cell encode reinforcement的时间。（伤海马影响奖励时间预测，伤OFC影响奖励幅度预测）

9. Fig2a-b鼠用’试错’的方式学策略（如左转有奖励）。会在choicepoint处做VTE(vicarious trial and error),海马PC做look ahead模拟不同path，OFC对相应模拟path做评估’有无奖励’。海马PC放电做prospective和retrospective模拟，PC放电受到context调节（从何方向来，到何方向去）。OFC全程放电敏于path是否有奖励，task switch中OFC能integrate奖励与response信息来更新rule task表达。

10. 稳定时海马OFC coherent oscillation于theta波段（5-12Hz）。rule switch时coherence破坏，随着试错而慢慢提升coherence。

11. 糖果放在卧室(contextA)的抽屉里而不是厨房(context)的抽屉里。海马劲量差异化表达卧室和厨房的抽屉位置，而次要表达抽屉与糖的关联。OFC尽量差异表达有无糖的差异，而次要表达抽屉的位置。

12. Fig2c precondition期中性stimulus A铃声出现后B铃声再出现，海马建立两者association。condition期B出现后面包出现，海马建立两者之间联系，OFC建立对面包和奖励expectancy以及B铃声与奖励expectancy联系。test期A铃声同过推理也能产生奖励expectancy。

13. 海马key于associative scaffolding （各种联系）建立，OFC 基于scaffolding于来做奖励预测来drive response。

14. 海马善于link info于时序sequence，反应所学的connection，使得海马能encode retrieve并且explore mental model of state space. 海马做抽象associative learning。OFC更根于生物重要性，自身需求，如学捕食，devaluation（发霉吃坏过肚子）的食物。

15. OFC发信息给海马，使得海马敏于奖励、movtivation、goal，使海马做goal-dependent navigation。海马发space和关系信息给OFC，使得OFC能bind outcome期望与相应的path/position/味道序列等，这样就能找到合适path等behave来得到最大value outcome。

DeepMind: 20190511

Neuroscience-Inspired Artificial Intelligence

神经学与AI相互启发

PDP(并行分布处理) 人脑高度并行统计处理符号，启发人们从串行处理变成并行，学习中网络参数改变以期最小化error或最大化奖励。单词句子做分布式表达成向量的形式。
CNN：效仿视皮层单神经元放电（Garbor Filter提取边界）引入CNN，包括非线性transduction、divisive normalization、max-pooling等技术。根据人视觉Hierarchical分层处理，提出深度网络，map image为高层抽象features，形成不变性识别（大小平移明暗等）。通过神经元放电的possion分布，提出dropout。通过regularization来generalize beyond training data。
Reinforcement learning：map环境状态到action选择，以期最大化未来奖励期望值
2nd order conditioning：CS1（铃声）后出现US（食物）；CS2（闪光）后CS1（铃声）。以后闪光后狗狗就预知有食物，会流口水
Attention：人不是并行处理所有视觉信息，而是每时刻attend到一个object，忽略不相关信息（利用atten机制）。Fig1A就是用图像x与上一时刻atten.location l_t-1产生attended feature给LSTM产生本时刻atten.location l_t. 该机制可以用来attend到不同内存的content。
DeepGenerationNetwork（DGN）：如DRAW网络，通过attention机制逐步写出一个字符，画出一幅画（见DRAW的讲解视频）。
EpisodicMemory（Ep.M）:海马存储刚两个月内的片段记忆（快速存expc，表达少overlapping，不容易generalize，instance based）.该EpM在睡觉时不断replay而被consolidate到新皮层。早上老师1+1=2的场景记于海马，十年后你因为新皮层知识而知道’1+1=2’，但已经忘记学该知识的场景（海马以及没有该EpM）。（详见之前关于Tonegawa的记忆consolidation讲解）
EpM两个作用：a通过replay来改变Q网络权重提升Q-网络的内功。b做EpCtrl（外功，通过技巧做action的应对选择），对于每个action存储的环境states（Fig1B中黑点），看当前state（红点）最近的K个最近邻state的奖励平均值,取最大奖励的那个action。快的EpCtrl+慢的Q学习做互补性学习
WorkingMemory（WkM，见之前EarlMiller关于WkM的文章讲解）：存储和操控information与activeMemory（PFC）。有controler+存储单元（声音loop，VSS，EpM）。LSTM能gated该information直到被query。DNC（differential neural computer，Fig1C）有controler控制对不同内存内容atten读写，能做最短路径搜索，汉诺塔问题。
continual learning：人能学多task于不同时间，学新不忘旧。神经突触双光子成像发现对taskA的spine 可以保持数月来处理taskA（光基因去掉spines会忘记taskA），spine enlargement可以降低学taskB时的plasticity。AI用此做EWC（elastic weights consolidation）,对taskA的权重W^A按重要性降低plasticity，从而网络可以学很多新task而不忘旧的。
物理直觉：感受空间、数量、客观性。compositional mental model能助flexible应用于新场景。如你把第一次见的张三分解成头、身四肢，还知道他们之间的关系。你就可以重建张三蹲下的图像。
有效学习：看几个instance学新概念，用知识做flexible推理。
字符挑战：例如人学汉字’綦’，看一遍然后无论什么字体或手写都能认识。机器用structured probability model 和DGN现在能看一个instance然后产生类似sample，做one-shot概念学习。
转移学习（TL）：人学开桑塔纳后，也会开奥迪宝马奔驰。认为compositional representation能做zero-shot 推理新场景（具体神经学机制尚不清楚，insight将有助于lifelong学习）。机器图像（imagenet）语言（BERT）机器人（VR训练现实应用）已在TL很成熟
NeuralCoding：GridCell（见之前矢量导航视频），以egocentric六边网格放电tile local 接收场，表达的头方向、边界距离等信息给下游place cell来编码所在地点、做矢量导航。人脑概念知识的组织也六边形编码（但不在Entorhinal区）
Simulation-based planning（SBP）: 蒙特卡洛树搜索用于围棋更新value函数和policy。DGN能捕获环境实时动态，通过几个视角images能合成新视角image（见DQN），但在SBP上还有挑战
海马通过instantiate一个环境模型来支持planning，下游OFC对其作出value评价。人能构想出fictitious plan，还能jumpy多个时间点、考虑多个solution等机制将有助于AI
Virtual brain analysis（VBA）：AI学习复杂task获卓越性能，但是往往不清楚每个unit和整体组织的性能。可以引入神经学单neuron放电记录、fMRI脑信号分析、lesion test等于AI
心理学家神经学家的很多概念很模糊，AI可以量化其描述。如用LSTM来研究为什么PFC能maintain信息。
人脑多巴元（做RL）主要输出到PFC（认为是迭代网络），基于此人们提出meta-RL：用RL来改变RNN网络连接权重，实现快速学习。
BP尚无神经学基础：a前馈和反馈不具备对称性；b神经元突触连接plasticity服从Hebb机制没有global error信息。BP机制研究将有助于AI新学习的发展。

Deepmind: 2019-05-04

Analysing mathematical reasoning abilities of neural models

神经网络的数学推理能力

数学推理是人智慧的核心（能够利用所学定理公式来做推理）：1得能parse问题为entity（数、运算法则、变量），2得能正确顺序compose运算，3用正确算法做函数composition，4存储中间量，5用所学知识规则
本文产生7类数学问题数据永远训练和test：1算术(如’算5+2等于几’)，2代数(如’(2,3)+(3,2)’), 3微积分(如’2x的导数是什么？’)，4对比(如’2和3哪个大’)，5测度（’2m和1000纳米哪个长？’)，6数字(如’789的质因数有什么？’)，7概率(如’2位数大于50的概率是多少’)
数据可由题库产生但是数量有限，可由合成产生（本文提供产生上述7种数学题目的code）。test数据分内插（train时类似的题目），外插（train时未见过的题目，如训练3位数四舍五入，test7位数四舍五入看generalization能力）
答案按照char-2-char 答案正确给一分，否则为零。评价时平均所有类型题目，和内外插值分数。问题<160个字符，答案<30字符。（字符95个，大小写字母，数字和标点符号）
对比 simple LSTM, attentional LSTM, RMC(relational memory core)和transformer网络（架构见图3，内容细节见上几期）。主要Encoder将问题转为Embedding，Decoder以自回归的方式逐位输出答案。
简单数学所有model性能好，难题如带括号的四则运算性能下降50%。主要因为中间计算量没有存储机制。transformer性能要好于其他，作者认为可能因为其multi head可以并行存储多个数字参数entities。训练6位加法，test7位时会效果不佳。尤其重复数字出现时性能不佳，作者认为是相同数字会产生align不准确问题
做16岁儿童数学题，神经网络的错误类型和孩童的不一样，generalization能力也不一样。

Ali: 2019-04-27

MI-KBQA: Multi instance knowledge base question answering

基于知识的机器问答

输入为问题Q、KnowledgeBag（KB）的Embedding M_q、M_kb，输出为问题答案。
问题Q=[x₁…x_L]由双向LSTM编码 h_t=[h_t^ff, h_t^fb]，M_q={h_t}.
KB为<主,谓,宾>形式，如<曹操,小名,阿蛮>，fact f=[e_s,e_p,e_o], M_kb={f_1,f_2,…,f_N}
Decoder由Q产生A且attend到M_q、M_kb。Eq3根据当前状态s_t,上时刻输出单词y_t-1，问题表达M_q、和KB表达M_kb来产生预测单词y_t的概率。该概率分为三个部分：基于问题和KB的prediction,基于问题的单词copy，基于KB的单词提取。都是由两层MLP加softmax构成。
Loss定义为Decoder的预测y_t的neg.log.likelihood(NLL)
现存问题：问题答案对儿由网络搜索找出，可一问题对应多种答案instance。网络回答千奇百怪可能不相关可能不正确。用这样的数据训练网络性能不佳。为此作者提出
1. 答案.selection(Eq.7-9): 每个问题bag用所找出的最适合的答案做training
2. 答案按内容重要性加权（Eq.10-12）:用cos相似性做答案instance加权，KB加权用最有用entity出现频率加权，避免uninfomative答案用于训练。
3. Curriculum训练，先用少歧义的单instanceBag训练，在渐增多instanceBag
数据用到communityQA（CQA），以及productQA（PQA）源于阿里电商对话产生的QA对儿，再ground到KB的<主,谓,宾>形式。
本文比CoreQA的Accuracy，BLEU，ROUGE指标都优秀

Google: 2019-04-20

BERT: pre-training of deep bidirectional transformers for language understanding

深度双向表达变换器网络

BERT(Bidirectional Encoder Representation from Transformer): 为语言表达模型，大数据非监督pre-train BERT网络后，外加softmax分类器fine-tune于各类NL.task
PreTrain 网络 for下游task的两类策略：（a）feature based：用该网络activation作为下游task的input features。（b）fine-tune：该网络输出外挂上classifier做整体fine-tune
双向preTrain：传统为单向左向右（LTR），如上文AVSR，t时刻的输出token字符只知道0…t-1的语音唇读信息。双向preTrain需要改变loss.fn表达，本文引入Masked Language Model (MLM) 和next sentence prediction (NSP)来解决此双向训练问题
MLM：将句子中15%的单词[mask]掉，然后预测该单词。10%time会将[mask]换成随机假单词，10%time会将[mask]换成正确单词
NSP：A句与B句处于某文，50%概率让连续出现（positive）的AB作为输入，50%概率让A后跟其他处的句子B作为（negative）输入。网络输出二进制classifier预测是否AB连续
Fig2：Embedding（E）有Token语义E、segment.E、position.E相加构成，作为BERT输入。CLS为特殊classifier，二进制分类task中有用到，问答等task中不用。SEP区分上下两句话的separator。split word pieces with ##。
Fig1：(a) BERT，E作为输入，有L层深度的双向Transformer（Tm），输出Ti针对第i号token。（b）OpenAI.GPT(general preTrain Tm), 类似BERT但为左到右训练型。（c）ELMo，双向LSTM非Tm，LTR与RTL的输出concat后作为Ti
BERTbase(L=12层，H=784units，A=12 Atten.head, 100M参数可对比OpenAI.GPT，16TPU)。BERTlarge(L=24层，H=1024units，A=16 Atten.head, 310M参数，性能最好，64TPU）。Batch=256seq， token=128个，Adam.lr=1e-4，dropout=0.1，训练4天
GLUE（general language understanding evaluation）:
- MNLI(multi natural language inference): 给句子对儿，问B句是否是A句的蕴含、矛盾、中性
- QQP(Quora Question Pair): 二进制分类A、B两句是否语义相等
- QNLI(Question NLI): B句是否含有A句问题的争取答案
- SST-2(Stanford sentiment TreeBank): 二进制分类，有人工annotated情感
- CoLa(corpus of linguistic acceptability): 单句是否语言学接受得了
- STS-B(sentiment textual similarity corpus): 句子对儿1-5语义相似度打分
- MRPC(MS research paraphrase corpus): 句子对儿是否语义等价
- RTE(Recgonition textual entailment): 类MNLI但是数据少
- SQuAD(Stanford question answering dataset) 输入(问题，段落)，输出为对应答案的起始终止tokens.
- NER(named entity recognition): 对一句话的每个单词分类(人、组织、位置、杂类、未命名)
- SWAG(Situation with adversarial generation), B句为4个选项，挑选与A句最连贯的
Fig3(a) AB句输入，输出为二进制分类的tasks。(b) 单句输入，输出为二进制分类。(c) SQuAD形task，双句(问题，段落)输入，输出为对应答案的起始终止tokens（用两个softmax分别输出）。(d) NER形task，单句输入，针对每个token做softmax分entity
table1-6介绍BERT如何在各项NLP task的各项性能指标战胜其他网络
指标F1=2/(1/精度+1/敏度)，精度保证挑出来的都是对的，敏度保证对的都被挑出来。
table7：BERT的hidden layer activation也可concat在一起作为feature喂给下游task。

AI: 2019-04-13

Deep audio-visual speech recognition (AVSR)

深度唇读语音识别

通过声音（A）和唇动作（V）来识别输出语音的文本字符（可用于多talker对话识别、手机下指令、配音等）。架构基于Encoder-Decoder架构。Encoder编码audio、video的features；Decoder用此来产生文本字符在该AV输入下的概率P(y|x)。
用connectionist temporal classification (CTC) 和seq2seq两种结构做Decoder。CTC每个时间的输出相互独立，无反馈迭代无自回归（Auto Regression，AR），处理速度快，但需要language model (LM)来model各个字符间关系。CTC类逐音翻译，假设monotonic order（输入输出同序）不能做机器翻译（MT）。seq2seq有AR的反馈，t时刻的输出依赖0…t-1时刻的输出。
Fig1：整体架构。视觉音频分别处理得到feature VA，Decoder根据feature解析出字符（26字母、10数字、空格、sos）的后验概率，BeamSearch（宽度W）输出最高概率的transcription（s，字符串），LM通过公式(2)融入字符关系的信息。
图像处理：对于t时刻图像，先经3D卷积处理5帧2D图像（25fps，224*224，嘴巴112*112），再多层ResNet提取W/32*H/32*512维feature（共T帧，Table5）。该features再喂到6个[多头attention+前馈FF网络]做feature的多头（h=6）attention加权. 最后输出V。
语音处理：先用Short Time Fourier Transformation （STFT）做出声音谱图（321维，40ms时窗，10ms跳长即100fps，4声帧对应1图像帧，16kHz采样）。该谱也再喂到6个[多头attention+FF网络]输出A。
seq2seq Transformer：Encoder输出的V、A features各自通过多头Atten处理，transformer的t-1时刻输出反馈回来作为t时刻输入的Query feature(Q)。产生的context feature Vc Ac被concat在一起输入到FF网络（stack=6）。该处输出经线性变换（乘W加b）后做softmax给出各个字符的输出后验概率。
CTC Transformer：Encoder输出的feature V、A直接concatenate输给[多头attention+前馈FF网络]，而后经由线性变换和softmax产生字符的后验概率
Fig12：Attention。BlockA为输入序列B为输出序列。输入feature h_u(value V)需要做attention加权后变为输出C_i。该加权依赖上一时刻i-1的输出Si-1做phi变换（Query，Q）后和本时刻i的输入h_u做Psi变换（Key，K）做点积得e_iu，各个时刻的e再做softmax得权重alpha_iu。最后再把每个feature做attention加权的输出C_i
Fig13：transformer。为Encoder-Decoder结构。输入的embedding先做position encoding (每一位通过添加一个与所在句子位置的余弦量p_i)，再经由多头Atten加权后，加x做ResNet操作（有助深层网络训练）后做layer normalisation（减掉放电均值再除放电方差，可以加速网络优化）。输出进入FullConnection的前馈FF网络（Relu(xW+b)W+b），而后在ResNet和LayerNorm最后产生Encoder的输出。Decoder类似结构，只不过上一次的输出也通过多头Atten引入网络。经线性层和softmax后输出最终各个字符的后验概率
语言模型LM（字符level）：4个单向LSTM（n=1024）每次预测一个字符，配合Beam Search为给定输入x下产生输出字符y打分（公式2）。分子第一项为log(p(y|x))（其相反数为给定x下输出y的信息量），第二项为语言模型的log概率（alpha为LM的权重），分母为归一化系数。优化调整网络参数使得该score越来越大
LRS2-BBC公共数据：千小时spoken语音以及Face track（基于连续帧色histogram对比）源于BBC。Audio与subtitle对齐（Penn Phonetic Lab Alignment）。Audio与video stream同步[15]. 句子按transcript中标点分割为单句和短语。外部LM训练用text corpus（26M words）。
Pretrain 视觉处理前端，通过flip、random shift 位置和时间帧来增加train set多样性。Curriculum学习，先学短单词，再增加预测短语句子长度（提高收敛速度，不会overfitting）。先训练与clean audio在加babble noise（20段随机音频叠加的同幅度噪声，出现概率0.25）。Adam优化器，初始lr=10e-4，plateau时减半直到10e-6。dropout=0.1.
Word Error Rate（WER）=（Insertion+substitution+deletion）/totalWords
Table2：模型比较。单独唇读模式，TM-seq2seq为新benchmark（比以往WAS降低22%WER）。单V下 WER高65%，单A下能好很多WER=15.3%，AV共同WER=13.7%，加LM后WER=8.2%。有noise情况下单A的WER=65%，加唇读VA WER=33%。CTC推理快在LM辅助下非常实用。Seq2seq训练时间长，但是抗时间上 VA out of sync (单epoch calibration即可).

Machine Learning: 2019-04-06

Face2Face: Real-time Face Capture and Reenactment of RGB Videos

面部表情捕获与重演

实时webcam采集SourceActor（S）单镜video，离线下载targetActor（T）的youtube单镜video。实时将 S脸表情嘴动作转移到T脸上。可用于翻译、配音、游戏等场景增强。
用non-rigid model bundling来重建3D T.shape.identity. 实时捕获S与T的表情，在低维参数空间将表情转移给T，最后在合于T背景与光线。
用多线性PCA（Eq12）拟合T RGBvideo数据来求解feature points的低位参数α=Identity，β=反光性，delta=表情参数（Eid，Eexp，Ealb为id、表情、反光的基）。Eq1、2分别为3D几何、光学建模参数和feature点的关系。
变换参数求取基于能量函数Eq3的最小化。Eq4：Ecol代表T变换前CI后Cs的vertex RGB接近；Eq5：Phi变换将T.3D.mask的prior vertex做表情嘴动作变换，Pi变换将3D模型透视投影成变换后的图片vertex，Elan控制变换投影后的点应该接近S的地标或feature点fj。Eq6：T的id与光学参数应该满足统计分布。
Eq78: 通过S可以求得其中性脸与表情脸之间的变换矩阵A（中性脸变换后得和实际表情脸接近），该矩阵作用在T的中性脸厚就得到T的表情脸。
嘴动作retrieval：先把T的video帧用Kmean按照Eq9的D值做聚类（k=10类），并找到与S当前帧St的D值最接近类的代表帧Tk。通过描述子K来warp Tk的嘴动作。K={R=旋转矩阵，delta=表情参数，F=地标点，L=局部二进制模式}。
Eq9：t时刻实时S与最佳匹配类T的嘴动作描述子距离D。Eq10（Dp）：实时St与T表情变化参数应接近，旋转矩阵应接近。Eq11（Dm）：St与T的地标对儿Fi Fj（如上下唇距离左右嘴角距离）应接近。Eq12（Da）：（Dl）St与T的局部二进制模式应接近以及（Dc）当前嘴变换应接近上一帧嘴描述子（防止变换过快）以及目标T的描述子（跟上S的嘴动作）。
S用Webcam 实时采集30Hz 640x480单镜RGB video（小女孩video）。T从youtube下载1080x720 video（施瓦辛格video）。Reeactment为1080x720 RGB video（施瓦辛格拥有小女孩的表情与嘴动作）改reenactment真实（不能察觉施瓦辛格表情被改动）。

DeepMind: 2019-03-30

DeepMind Lab

DeepMind Lab提供（类反恐精英）的第一视角的3D虚拟环境来给AI学习。
Fig12 提供Agent以2D视觉图像、奖励、物体距离和自身速度等感觉信息，且Agent可3自由度（上下左右前后）平动和（上下左右）2自由度转动。以step locked 更新
基于开源QuakerIII代码（爱好者维护），附q3map2/bspc来产生场景工具，openArena控制bot脚本，OpenGL渲染。为增强学习做相应的Tailor。
Seekavoid_arena_01：有苹果+1，西瓜+5，柠檬-1的奖励机制。Navg_maze_static: 每个episode layout不变目标位置不变，Agent初始位置变化。类老鼠的水迷宫MWM实验。 Navg_maze_rnd_goal: goal位置变，利用所学所记的layout知识尽量多收集goal。Procedually_generated_Navg: 探索学习认识新环境。laser_tag：得识别判断bot行为，开枪打bot有奖励，被bot打中有惩罚。需要识别pit来跳过，需要计划和精细控制动作.
Fig5可提供txt.map给deepmind Lab（*为墙I为门等），然后渲染成对应的3D VR场景fig6.

Nat.Rew.NS: 20190323

The role of engram cells in the systems

consolidation of memory

Tonegawa：1987诺贝尔医学生理奖，发现抗体多样性的基因原理。
记忆固化(M-consolidation): 经验片段先短时（两周-两月）存于海马，而后转移到mPFC（脑硬盘）做长期存储。
印迹细胞：experience时需要放电，而后发生持久性物理化学变化，recall时能reactivate。
新形成的记忆（相比儿时remote记忆）更容易被干扰遗忘。故记忆需要时间做固化于皮层。
HM病人切medial Temporal（mTE: 海马及周边），有前向遗忘，且忘手术前两月事情，Remote memory retrieval无影响。
Index.Theory:海马为皮层各区放电的index，内容存于皮层。但长期记忆提取可以不用海马(仍有争议Table1, 可能context rich和自传features提取仍需要海马)
mPFC放电（25天前M提取）大于（5天前M提取），且前者Fos表达高
Contxt Fear Condi（CFC）:去铁笼子contxt.A有电极做电击，木头笼子context.B安全。训练后，老鼠看到笼子contxt.A（尚无电击）就发抖。
Trace Eyeblink Condi：听声（条件刺激CS）而后马上吹老鼠眼睛(非条件刺激US）。训练后，老鼠听到声音就闭眼。
Fig2. activity dependent labelling: 转基因老鼠（有Fos=-tTA基因, immdiate early express基因Fos为tTA的promotor，tTA能bind并活化TRE，Dox能阻止此binding），被注AAV病毒来转染TRE=-ChR2&EYFP（或者TRE=-ArchT&EYFP，TRE为后面离子孔道荧光蛋白的promotor）。神经元放电-Fos快表达-tTA表达-（removal of Dox下）-TRE活化-ChR2&EYFP荧光孔道蛋白表达。即神经元放电被内在Fos label且荧光蛋白labeled（ChR2&EYFP为蓝光激活的兴奋性孔道，ArchT&EYFP为绿光激活的抑制性孔道）。
Fig2b。day1鼠学习在CFC铁笼A下被电击而freeze，此时ChR2&EYFP标记了海马放电神经元（Engram Cell）。而后再到铁笼A会Freeze（被label的神经元放电），但到contextB笼子不害怕（被label的神经元不放电）。但是在安全的B笼子，用蓝光激活被label的神经元，老鼠也会产生freeze。如果label为抑制性ArchT&EYFP，老鼠在A笼子下本应该freeze，但是绿光抑制这些神经元，从而在A笼也不freeze了
mPFC activation和plasticity 对于remote.M形成与提取很关键。 CFC学习后mPFC渐增connectivity强度
EarlyTagging（Fos）：mTE先快速形成ep.M by快synp.pls.而后M.site转到mPFC。day1学习后mPFC已经产生silent Engram Cell但是需要后期渐渐成熟为active.
Fig.3。silent Engram Cell（可在海马 mPFC 杏仁核等地）不能被natural recall Cell激活但是能被蓝光激活产生freeze，其树突spine密度低。active Engram Cell的spine密度高，能被natural recall Cell激活。day1CFC学习，海马马上产生active Engram Cell(spine密度高), 而后的M固化过程逐渐silent化，相反mPFC.Engram Cell 开始为silent state随着固化逐渐成熟为active态(spine密度变高能被natural recall Cell 激活)
Fig4. CS与US相距很短（500ms）能被mPFC相关联在一起。若interval太长则认为无相关（如先去contextB再去contextA后马上电击，老鼠会associate contextA-电击），且学后该Engram Cell在interval间会持续放电。
day1学CFC的BLA-mPFC以及海马-MECva-mPFC通路信息都是充分且必要于mPFC的silent Engram Cell形成。该条件下Fos才能表达与mPFC的Engram Cell。11%mPFC神经元为shock Cell（Ca离子内流增强）89%为nonShock Cell. Day2 recentM提取时ShockCell无反应，Day15的remoteM提取ShockCell有Ca内流。NonShockCell永远没有Ca内流
SWR（sharp wave ripple）使得CA1.place Cell replay 于consolidation期（尤其夜间睡觉）。此海马-mPFC的information输入关键于mPFC Engram Cell的成熟
reminder cue(day29天看)能增加day30的Remote M提取，因为reminder cue使得接近silent的海马 EngramCell重新active。
杏仁核提供感受信息（恐惧等）是mPFC成熟的另一关键。杏仁核.Engram Cell保持active。
Fig5。day1 CFC训练因为MEC-mPFC以及杏仁核-mPFC(红色感受信息)迅速形成mPFC的silent Engram Cell。此些EngramC接下来两周逐渐成熟，consolidation期间需要海马Engram Cell的输入。而后海马EngramC变得silent也不在提供context信息。remoteM提取时AssCtx的context Cue直接通过mPFC Engram Cell激活杏仁核EngramCell。recent M提取时context Cue需要海马经由MEC来激活杏仁核Engram Cell产生恐惧的感觉。海马对recent M的作用等价于mPFC对remote M的作用
学后mPFC慢慢忘却context information却能记住知识性语义信息(如你知道那个人叫Trump但是不记得什么时候什么场景下认识他).

Ann.Rew.NS: 20190316

AN INTEGRATIVE THEORY OF PREFRONTAL CORTEX FUNCTION

PFC功能综述

PFC关键于认知控制（选择注意力，行为抑制，工作记忆，goal/rule directed行为）协调n.activation表达goal与方法来实现goal。
PFC不做简单自动reflexive行为（皮层底到顶mapping，快inflexible），PFC做顶到底goal directed mapping。(1)能维持goal表达的a. (2)bias其他皮层放电(cue-rsp mapping，情绪，M.retrieval等)。（3）guide a.flow wrt goal
dlPFC接受视觉空间位置 object 听觉躯体感觉多模态ass的信息，并支配motorCortex做rsp。OFC、mPFC接受偏腹侧过来的情绪obj价值食欲等信息（不接受背侧空间位置信息）。PFC神经元大多做多模态ass而非ecd单个S.ftr. PFC各子区相互交流信息做integration。Fig1
Fig2 人在路上C1靠右行R1还是左行R2，在美国C2正常R1，由最粗的（habitual）C到R路径自动实现。在英国C3，就得通过PFC.n来guide a.flow到R2。随着不断practice C-R2的路径变粗变自动化、PFC干预变少
Fig3 cue（人图或黑块儿）-rsp（猴左或右saccad）。 PFC.n 只针对人图-右saccad的ass放电，（黑块儿-右sccad以及人图-左saccad都rsp很弱），大多n对ass反应，不针对S.ftr反应。不同n反应ass不同强度不同。Fig3B同一个S.cue，PFC.n放电与当前rule（tsk类型，assv、spa、matching tsk）有关
伤PFC不能学新abitrary ass但是不影响以往cue-ass-rsp。伤PFC，先搅拌在加水来做咖啡。WCST 实验开始的rule能识别，而后rule变化而无察觉。伤PFC后或错误update goal by distractor如精神分裂，或update不足如帕金森
PFC所维持的goal放电能抗distractor干扰。rcg matching tsk需要PFC与Hip与ATL等inta。PFC维持的信息内容多样（spa，ftr，rsp，Rw，action，ass）等。而vis维持a只有几百毫秒且与goal无关容易被distracted
Dopa低自发放电，（unexpectedRw，PredErr）下能burst放电，随着不断Rw相关rsp进行，dopa信号提前到cue（如巴普洛夫实验）。OFC ecd当前Rw，NAcc ecd Rw.Pred, Dopa为Rw.Err. Dopa为即门控PFC又Ln.pls。dopa信号改变set goal。
PFC为一组rule神经元，不是mapping，而是影响cue-rsp mapping。mapping如车轨道系统，PFC利用goal attend retrieval cue等信息来switch track与realtime。而海马铺设track于LTM（ftr间ass于LTM）。
Vis等先发育，其对obj.ftr表达被后发育的PFC利用处理，且两者变化要协调。
Fig5 ACC处理conflict detection（红色的Green，总是自然读出Green，ACC发现实际需要naming color）。dlPFC 在开始时ecd rule。
Cellular bistable 来维持a，或者RNN来维持a
早上计划下班时买早点，这事儿不能一直放在WkM。而是和hip（LTM，ass map上画迹）合作，下班路过MS就能ass想起来

Neuron: 20190309

Cellular Basis of Working Memory

PFC做WkM的细胞基础

WkM能维持十几秒钟M（可随着delay期长短、记忆信息量等变化。太长的维持可能就进入LTM了）。WkM能从LTM中提取信息，维持并操控信息。时空连续地利用以往经验和计划action。key于算术、下棋、幻想、计划等.
Fig1. spa.delay.rsp.tsk （猴子盯着fix.pt [静息期], 方块在某loca出现0.5秒[cue期], 屏幕清空[delay期]2-6秒，猴子saccad到刚才位置[rsp期], 同时测量猴PFC（principal sulcus的）n电活动。(1)该神经元只针对270度方位信息维持放电增强，对相反的90度方位放电减弱。(2)该神经元每次都是对270度loca放电来维持WkM，其他神经元对其他loca放电。(3)该神经元为270度的M.field. (4)该神经元放电增强在rsp后马上消失。
Fig2. PFC的spa.WkM.n 有多样的a.pattern。(1)可以在cue、delay、rsp以及comb期放电增强。(2) 均time lock于event。(3) spa.loca.调节增强(也有减弱)的幅度。(4)协调产生有时序的行为
fig3. retrograde tracing发现LIII的Pn接受周边Pn的输入（类似V1的columnar结构）。我觉得这种内部相互连接产生时间上WkM信息的维持，类RNN
Fig4 相邻FastSpk神经元与RegularSpk神经元放电pattern互补，反应相互抑制。B3也能看到FS与相邻RS喜欢的loca方位正好相反
Fig5 同loca喜好的Pn相互兴奋，对loca相反喜好的通过IN来相互抑制（Pn270兴IN抑Pn90），这样的架构可以形成上述M.field
Fig6. Pn的树突spine接受S.inp(本文叫UA unidentified axon)同时接受dopa.inp, 形成synp triad. EM下dopa synp为对称synp 而glu(S.inp)的snyp为非对称synp
Dopa门控S.inp to PFC.n：Dopa源于subctx核，携带value信息支配action（Reinforcement learning）。PFC有大量D1.Rp分布。triad synp形态上为dopa调控S.inp对PFC树突的影响
Fig7 前两排CTL组，delay期该n对posi2有显著但较弱的放电增强。对posi7(相反loca)有轻微抑制。三四排给该n注射SCH（DopaR拮抗剂，等价于减少dopa），delay期该n对posi2有dramatically放电增强，说明该浓度dopa能抑制该synp的S.inp。
Fig8. 注射25nA拮抗剂（减少dopa）能dramatically增强该n对posi2，太多拮抗剂（75nA，Dopa所剩太太少）反而能减少n在delay期放电。Dopa量对该突触有门控调节作用
Fig9. 减少dopa后有10个PFC.n放电增加，2个放电减少。

Nature: 20190302

Cross-modal and cross-temporal association in neurons of frontal cortex

dlPFC.n做声音-颜色association

1.Fig1. 给猴先放2秒高或低音调，delay10秒，出现红绿两个按钮，猴按(高红，低绿)钮，答对给果汁奖励。因此实验分为tong期delta1，delay期delta2，color期delta3，choice期delta4。delta为高低音调时n放电的差别。

2. 325个探测n中有94个differential.n（放电能区分高低音调，E.g.低调n：对低音调放电明显强于对高音调放电）。其中72个位兴奋性，即来高低音调后放电强于静息期放电；22个位抑制性，即来高地音调后放电变弱于静息期放电。

3. Fig2. 低调n为例。a对低高音调都提高放电频率，且对低音调提高强度更多。b-d为三个低调n：(1)他们都在tone期对低音实验放电更强，delay、color、choice期也有类似强度差别。(2)delay期整体activation变弱，但任然有放电维持WkM。(3) color、choice期n.reactivate来帮助选择颜色按钮。(4) color期的红绿按钮放电差别一致与tone期对高低音调放电差别both in sign和幅度. （浅绿是该n对低音调放电；浅红是该n对高音调放电；深绿是该n对绿按钮放电；深红是该n对红按钮放电；）

4. Fig3。左侧是5个高调n在tone期与choice期的放电强度，倾向于高音调和红按钮放电强。右侧是5个高调n在tone期与choice期的放电强度，倾向于低音调和绿按钮放电强。

5. Fig4. a猴子根据音调找到正确按钮的trials，4个不同期两两对比delta，发现有正相关（重要n点分布在一三象限中），这与表一同。94个differential n中~65个n在不同时期区分高低调红绿钮是一致的。b猴子根据音调找到错误按钮的trials，说明猴子做task的时候没走脑子，散点图也没有跨时期相关性。c图红色为高调n，在对角项左上方，喜欢对红按钮放电强度大。

6. Fig0.视觉分腹流（红色）背流（蓝色），听觉分腹流（黄）背流（绿色）。他们高级处理区在associative区（temporal, occipital,parietal交叉区也即fig0文字区），他们的association可以通过声音想到图像，通过文字找到读音等。但是跨时间的ass就需要PFC参与了，上述4种颜色连到PFC的箭头提供info交互，而association需要如本文所研究的dlPFC.n

Ann.Rev.NS: 20190223

General Cortical and Special Prefrontal Connections: Principles from Structure to Function

PFC连接与原则

Fig1: 皮层按laminar细胞结构分type：limbic（agranular、dysgranular）和eulaminate（I、II）。limbic为三层环状结构（缺少L4）位于cc与basal brain外（medial view）。limbic环外为eulaminate（6层结构）cytoarchitecture逐渐变化分Brodmann区。PFC：lateral view（eulaminate为主）；medial view （limbic的ACC前cingulate，和前端mPFC）；orbital view（limbic的pOFC，与OFC）
Fig2：（红）Ag.中-to-EuII.表；（蓝）EuII.表中-to-Ag.中；（绿）EuI.中-to-Dy.全、Dy.中-to-EuI.全。tmp与PFC双向连，原则1：远程强链接lamn结构相似；2：lamn决定连接方向
Fig3：后视皮层（粉n密度大）连FEF（粉n密度大）；前视皮层（绿n密度小）连dlPFC（绿n密度小）。听皮层后端（紫lamn结构复杂）连dlPFC（紫lamn结构复杂）；前端（黄lamn结构简单）连OFC（黄lamn结构简单）；前端（浅蓝lamn结构简单）连mPFC（浅蓝lamn结构简单）
Fig4：（蓝）S.ass.ctx（TE）-Amy-pOFC传递sti.signf信息。（红）ET（4层结构）-Amy
Fig5: ctx.all-BG/Cer-Tha.MD-PFC/PreM. BG传递Utility.val小脑传Error.ctrl.info
Amy:接受S.ass.info，转为情绪，传给OFC做决策（如F&F反应），监视控制hypotha的血压心率。用sti.signif来指导ass obj于ep.M. 伤后无恐惧感。Amy.a上升（可通过药物）助记忆，产生social.phobia焦虑等。男孩发育晚、时间久、总体大。

Nature: 20190216

Channel opening and gating mechanism in AMPA-subtype glutamate receptors

AMPAR受体门控机制

LTD：1NMDAR或VDCC或其他常态Ca2+内流；2PP1、Cacineurin活化；3去磷酸化dynamin；4脱掉clathrin；5AMPAR内吞而使得synp导电性下降；6GRIP蛋白挂于AMPAR.C尾；8降解与lysosome
Fig1: GluA2四同聚体AMPAR fuse 辅助亚基GSG1L，在ZK作用下结构等同于resting(关闭无ligand作用的apo)态。离子孔道由TMD的M3螺旋交叉构成upper门，reentrant M2的Q/R site构成lower filter（后转录中gln变为Arg带正电荷于孔道中，可以filter钙离子，只允许钠离子内流钾离子外流于，浓度差驱动）。GluA2-GSG1L_zk为闭合态
Fig2: AMPAR-STZ受体在glu作用后孔道打开，后迅速脱敏。但CTZ作用可以阻止脱敏保持孔道开放状态，用于cryoEM 3D重建开孔结构。STZ（stargazin为AMPAR辅助亚基，助稳定，能连于PSD95）。
Fig3：AMPAR-STZ_glu-ctz 3D结构
Fig4: 开态的孔道结构。孔道upper门（T625位点）在glu作用后由9A变为16A，M3 bundle cross展开。孔道lower filter（Q587位点）在glu作用后9.6A变为10.2A，主要filter钙离子。
Fig5. 闭合态在glu作用后LBD的clamshell上合26度，导致LBD下端D2(S635)由19A张为32A。LBD(S635)带动TMD张开孔道，钠离子流入. 而后迅速由开态变为脱敏：LBD clamshell 保持关闭，但LBD上端D1 rupture带动下端D2闭合，dimer的两个S635由32A变回16A。S635链接的TMD也使得孔道关闭。而后由脱敏态recover会resting态，clamshell开放，glu离开

Science: 20190209

Structure and organization of heteromeric AMPA-type glutamate receptors

AMPAR受体结构

AMPAR为glutamate离子孔道受体。多位异四聚体(如本文GluA2/3 2/4)亦可同聚体（GluA2/2 易于纯化研究较多）。AMPAR由NTD（N端domain，在synp cleft间与蛋白作用，助AMPAR聚集），LBD（ligand作用域），TMD（跨膜离子孔道段），ICD（胞内段，本文没讲，负责与scaffolding等蛋白作用，调控AMPAR trafficking。有四个ser/Thr的-OH位点能被磷酸化，调控孔道脱敏速度、电导性、胞吞胞吐等）
glu作用后，AMPAR离子孔道打开（多位点作用，孔道打开更大），而后1ms内迅速脱敏（对glu不再反应）。有GluA2亚基的AMPAR不能通透Ca离子因为其后转录RNAediting时Q(glu无电荷)-to-R(arg侧链CN3正点)，使得孔道正电排斥Ca2+进入。但Na+ K+仍然通透
LTP：强直刺激（海马，100Hz1秒）后，再sti会产生增强EPSP。需要1前突先放glu，2后突再去极化。LTD：后突先去极化前突再放电，如此反因果强直刺激后，前突sti会产生弱化的后突EPSP。
流程：1glu打开AMPAR，2Na+离子流入C，3C去极化，4NMDAR的Mg+被排出胞外，5Ca2+内流，6Ca2+活化CaMKII激酶，7CaMKII再PA化AMPAR的胞内vesicle使胞吐AMPAR到synp膜或者通过SAP97与myosin bindAMPAR.C端来移动到PSD，8stargazin连AMPAR到PSD95来稳定
1.regulatory：GluA1在NMDAR活化时才能traffick到synp膜（因为其C端长尾）。2constitutive：GluA2/3实时能胞吞胞吐AMPAR于synp膜
Fig0：四异聚体GluA2/3NTD为O型，纵向有压缩相比于GluA2/2同聚体（NTD为N型）
Fig1.GluA2/2同聚体总体为Y型。GluA2/3 2/4NTD分上下两叶，各有contact位点连dimer为四聚体。四异聚体NTD为O型，GluA2/2四同聚体NTD为N型
Fig2 A3.R265C A2.R264.C的cys突变能引入二硫键稳定O型构象，A2的V209C突变能引入N型构象。western blot证明了自然条件下更倾向于O构象。且电生理曲线现实cys突变能稳定构象又不影响AMPAR功能，故用来做cryEM，标记为xlink
Fig3.CryoEM照相RELION分类后3D重建（NTD，LBD和四同聚体TMD）
fig4. Glu2/3 resting态(M1，LBD无rupture)和脱敏态（M2，有一个LBD脱敏D另一个resting R）
Fig5. 四同聚体AC与BD亚基功能不同，GluA2占近孔AC位GluA3占BD位。GluA2/3有纵向压缩，更接近NMDAR构象而非AMPAR四同聚体。GluA2/3的NTD坐在分开的LBD内，新形成的contact有作用域NTD-LBD-TMD 信号变构转导
Fig6. GluA2/3的LBD分开大于四同聚体。GluA2/2在glu作用后LBD会分开变大。LBD的G alpha螺旋形成gating ring，影响离子孔道开关。GluA2/3可以切换Y与O构象。

Nature: 20190202

GABAA receptor signalling mechanisms revealed by structural pharmacology

药理作用下GABA_A受体信号机制

镇定剂benzodiazepines（BZD，本文用到alprazolam (ALP)和diazepam(DZP)）、麻醉剂（propofol和etomidate）、GABA_A受体拮抗剂（picrotoxin (PTX) and bicuculline (BCC)）均作用于GABA_A受体调节氯离子流动。本文通过不同药剂的作用构象讲述GABA_A受体作用机制
Fig1: 拮抗剂PTX堵在孔道中间，即阻碍氯离子流动，更变构了孔道结构（收缩为闭合态）。PTX能与6’段Threonine形成氢键，其异戊二烯也可卡在9’段Leucine侧链下面。因此比picrotin（乙醇取代异戊二烯）更有效保持在孔道内
Fig2: GABA作用在β3/α1接口ECD（胞外段）（结构见上一篇），该作用使得β3的loopC收缩，带动整体ECD逆时针旋转。GABA作用变构β3/α1接口分子连接（新氢键盐桥形成）使得β3和α1亚基连接更加紧密。由于在PTX bound条件下，GABA作用未能打开孔道孔径
Fig3: BCC能够关闭孔道，其作用位点同GABA分子，因此为竞争拮抗剂。BCC也作用在β3/α1接口的’芳香盒’，但是不会变构ECD段（如loopC未收缩）因此稳定住孔道的关闭状态
Fig4: 镇定剂ALP与DZP作用位点在α1/γ2接口，通过苯-二氮杂卓作用稳定α1和γ2亚基连接。从而使得GABA作用后五个亚基能更为有效地协同旋转打开孔道
Fig5: ALP-GABA 作用使得ECD更大幅度的逆时针旋转，ECD带动TMD旋转，TMD9’段Leu侧链转离中心从而打开孔道。该带动能力依赖于不同亚基ECD-TMD连接的rigidity（β较为flexible故ECD带转M2-3能力差，αγ的连接段刚性强带转能力也强）

Nature: 20190126

Cryo-EM structure of the human α1β3γ2 GABAA receptor in a lipid bilayer

GABA_A受体结构

GABA_A受体为异五聚体配体门控氯离子通道。其异常导致精分、抑郁、失眠、癫痫。各类药物靶向位点GABA_A受体蛋白
CryoEM重建结构，α1β3γ2L.bound.MB38 重构于脂质双层nanodisc（3.2A精度）
β3γ2的N-link聚糖朝外，α1的N-link聚糖在孔道前厅保证α1数量不大于2个，正确组装α1β3 + α1β3γ2成五聚体
ICD（胞内段）α1亚基正电pocket吸引PIP2，保守侧链稳定此bounding，PIP2负责GABA_A受体trafficking內吞调节数量
GABA dock于β3+/α1-接口处的’芳香盒’，Arg61的胍基负责稳定GABA羧基，Try205通过cation-π相互作用稳定GABA的氨基。GABA作用后，胞外段（ECD）旋转而使得氯离子孔道打开
五个亚基的TMD（跨膜的）M2围成孔道，本文结构为脱敏态下，最窄段-2’位点1.5A（Cl离子半径1.8A）故GABA_A受体为关闭状态
麻醉剂etomidate和propofol的binding位点在β3+/α1-接口处的TMD段，propofol/巴比妥类位点在α1+/γ2-接口的TMD段, 稳定亚基连接

Brain: 20190119

Randomized trial of iReadMore word reading training and brain stimulation in central alexia

iReadMore与tDCS做中风后失读症康复

中风后1/3病人出现失读症（看见单词知道意思但是读不出来）
iReadMore通过图片跟读等形式帮助病人康复 accy提高+8.7%, CI(6.0%, 11.4%), Cohen’s d=1.38, 且能维持accy3个月以后，但是不能generalize到未训练的单词
tDCS（作用在左脑iFg）提高+2.6%, CI(-0.1%, 5.3%), d=0.41, 能generalize到未训练的单词
Cohen’s d又叫effect size，d=(XF-X0)/SE. 原来测度均值X0，在F作用后变为XF. 则d代表F的作用使得测度变化d个标准差SE
CI置信区间(一般用95%)。测量的均值m在正负两个标准差之间的概率是95%。CI=mean+-2std.dev
ANOVA:方差分析(F-test). 多个作用(或者多个组别)，F=组间方差/组内方差。若组间方差大组内方差小代表组间有差别。可分析多种作用interaction，如tDCS对trained单词是否有显著作用于accy
分为六个时间点：baseline T1 T2（训练前），T3为test-retest，T4-T3为block1，T5-T4为block2，T6-T5三月维持性。G1组（blk1=tDCS blk2=sham），G2组（blk1=sham blk2=tDCS）
baseline要无显著差别，blk1后测试所学过的单词accy提高，未学过的单词accy不变，iReadMore的item specific属性。Blk2对其所学单词测试accy提高，blk1所学单词测试有遗忘。T5-T6长期维持diminish但比baseline accy高。反应时间RT曲线与accuracy几乎相反。

Science: 20190112

Distributed and Overlapping Representations of Faces and Objects in Ventral Temporal Cortex

腹颞叶对脸和物的分布式重叠式表达

视腹流对不同类别obj有特定放电pattern。如看脸时FFA区放电增强，看房子时PPA区增强
本文用fMRI测量，BOLD信号反应神经元activation，空间解析度差3.5mm，但研究尺度大
vT区域反应pattern表达为distributed（很多区域都有特异性放电）、overlapping（某个神经元放电与多种object instance）
subj看within-cate(如白猫vs灰猫)产生fMRI的rsp.pttn相似度高，看between-cate（如脸vs房子）rsp.pttn的相似度为负（pattern模式相反）
cate.A: 种类A，area.A:对A这类object信号最强的区域，area.~A: 刨除area.A的其余obj.sel区域
cate.A 能引起area.A的specific rsp.pattern; cate.A 能引起area.~A的specific rsp.pattern, 尽管这些~A区域反应相对弱，但是其pattern仍然能高精度反应obj.id
area.猫尽管很小（voxel很少），其rsp.pttn依然能准确判断出所有cate（除了瓶子不显著）
area.~A的rsp.pttn也不是ecd low.lvl.ftr（如亮度色彩）而是form.topograph。因为手绘图A和照片图A在area.~A的rsp.pttn也是十分接近
pop.cding:无论大小rsp均携带cate-info，小rsp也是integrated part
color.vison中。red-green.n rsp大代表红色调，yellow-blue.n rsp尽管小却能决定perceived为桔色或是紫色
尽管distributed repr，伤害一区域会使人无法分清人脸，prosopagnosia（面容失认症）

Nature: 20190105

Genome-wide association studies of brain imaging phenotypes in UK Biobank

基于UKBioBank的基因组与神经影像相关研究

UKBioBank：2020年500k人基因数据、100k人的MRI数据（还有临床诊断等数据）。本文利用2017年的8428病人（同时有基因测序和MRI数据）做SNP（单核酸多态）与IDP（神经影像表型）相关研究。
MRI：做统一protocol扫描结构、扩散加权、fMRI。用统一pipeline 得3144个IDPs（含不同脑区灰质厚度、体积、表面积、T1、T2、susceptibility、各区白质束FA、MD 等等等）
SNP：经前处理后有12million个
IDP的遗传性：区域灰质体积，TBSS相关指标，rsMRI节点，ICA处理的6个独立边成分遗传性较强
GWAS（基因组范围相关分析）of IDP：每个IDP指标组成8428维矢量，每个SNP也可组成8428维矢量，然后分别做相关。考虑到数量庞大，显著性水平用Bonferroni修正。这样可以发现与该IDP相关的SNPs，成为association。一共有268对儿。再按IDP相似性分38个SNP-IDP clusters（table1）
Fig2.以putamen的T2*为IDP，发现4个SNP（TF HFE SLC39A12 COASY）与之相关。然后在把one TF copy病人的T2*平均图与zero TF copy的病人T2*平均图做差，发现有无TF蛋白显著影响dorsal putamen、dorsal caudate等局部区域。其他三个基因影响区域不同。
Fig3. 以右下纵向fascicle 的ICVF为IDP，GWAS分析能得到VCAN与之相关。VCAN本身产生EMC的生长因子信号，对白质束修复和可塑性关系重要。而有无VCAN的FA图像差别显著发生于白质束的广大区域。VCAN的pheWAS分析发现只有dMRI诸多指标与之相关
Fig4.以脑桥神经交叉为IDP，GWAS分析得到ROBO3与SEMA3D与之相关。该基因可guide axon和fasciculation。其变异导致horizontal gaze pasly. 主要因为躯体感觉神经在pons交叉出问题。而FA(单ROBO3 copy)-FA(零ROBO3copy)图像差别正好只出现在pons交叉很小的区域

Nature: 20181229

A neural basis for visual search in inferior temporal cortex

物体的视觉搜索的IT区神经机制

物体的视觉搜索：在一堆东西中找一个想要的。需要该物体ftr表达的保存、从众多物体中选择的方法
实验：a挑出所要研究的方块神经元（该subpop神经元放电与方块出现与否显著相关），所有曲线都是方块神经元上测量出来的。b根据cue分两中scenario，cue=方块为good，cue=三角为poor。c实验步骤，猴先盯着中心点，而后cue图像出来300ms（猴需要记住该图片为选择目标），delay期1500-3000ms屏幕清空，而后choice array即方块三角同时出现于随机位置，猴迅速做出选择saccad到目标图片以获得果汁奖励
IT.n电生理信号：a.Baseline信号为8-9spk/s；b.cue图出现方块时方块神经元们放电提高（实线），cue图为三角时方块神经元放电被抑制（虚线）； c. delay期神经元放电恢复到baseline水平，但是对cue图ftr放电的神经元有略高的放电水平维持；d. ChoiceArray出现初期，所有Array(同时有三角和方块)ftr使得对应IT.n放电都增强；e.ChoiceArray中期（红箭头）开始根据cue图使得IT.n放电出现分野，（cue图为方块，那么方块神经元放电增强，而其他神经元被抑制），（中期发生在choice图onset后200ms，saccade onset前90ms）；f.ChoiceArray后期，当神经元放电区分足够明显后，动眼来选择目标图像
选择机制：a可能Attention system fb信号在红箭头出介入使神经元放电分野；b可能delay其cue图所产生的稍高信号维持启动红箭头的信号分野。

Science: 20181222

Neuronal specification in space and time

脑发育时间空间分子细胞特性

不同时间空间的分子细胞多样顺次出现组成脑神经通路。果蝇、老鼠、人神经发育保守，有很多同源分子。
神经祖细胞：能有限次分裂，分化出restricted repertoire of 神经元或glia cell，特性受时间空间调制
哺乳类祖细胞aRG有长process，初期对称分裂复制自己；而后可直接n.gen产生自己（self-renewal）并生成一个n；间接n.gen: aRG能通过中间祖细胞（bIP和oRG）来生产n。aRG => aRG+n 或 aRG=aRG+oRG oRG=oRG+n
果蝇有三种祖细胞NB：type0：NB=NB+n; Type1: NB=NB+GMC, GMC=2n or 2glia; type2:随时间有不同TF调控， NB=NB+GMC
哺乳类在subventricle分裂出n，而后爬到cortex，(earlyborn的爬到深层L5/6，lateborn爬到表层L2/3/4)。果蝇也类似，但是(earlyborn的爬到表层，lateborn爬到深层)
果蝇optic lobe有类似columnar结构，800column（每个col有80类n）各为处理单元，relay vis.info
果蝇顺序表达时间TF：Hb- Kruppel- Pdm- Caster- Grainy head, 决定不同时间窗口产生不同progeny。
空间也有调控，Hb 指定 NB7-1为U1-2.mtr.n, 而Hb指定NB3-1为Rp1-4.mtr.n
脊椎类有同源时间TF：Ikaros(类Hb)指定earlyborn fate，Casz1(类Caster)指定lateborn fate，7-up决定早-晚过度，knockout后earlyborn拉长lateborn缩短
TF ff机制决定下一阶段TF生成，neg.fb抑制上一阶段TF
空间调控：FGF、retionic acid浓度梯度定义前后轴位置，Shh、BMP、Wnt 定义腹背位置。神经管分8个域来进行空间调控
scRNA-seq：测量不同时间某cell的活性RNA分布，来分类n，研究lineage

Neuron: 20181215

How does the brain solve visual object recognition?

物体的脑识别机制

1.Core Object Recognition: 哺乳类通过’视腹流’对物体快速准确的识别过程。该视腹流为前馈、等级、reflexive、cascade 神经计算并通过population coding表达于IT neurons

2.神经学：定位功能区、测量神经动态、研究神经算法解释神经元功能；计算机视觉：工程算法模拟、实现人水平识别；

3.三个层次：单个IT.n.rsp；pop.coding意涵；识别行为

4.Retina-LGN-V1-V2-V4-pIT-cIT-aIT，串行处理，每级延迟10ms。Retina LGN为点sensor，V1已经manifold tangled，逐层untangle obj.id manifold 而易于分离出image parameter

5.invariance于view condition of 大小，retinal位置，形态，光线，背景

6.两obj的manifold如白纸被对齐后团在一起，腹流逐层分块来untangle展开白纸，得到selectivity与invariance。高层神经元的pop.rsp.vec能被简单weighted summation decoder解调，从中提取出想要的信息

7.实验上伤单IT.n后perception diverse，可完全blind部分视场，可完全不影响。IT.n放电由combined img.ftr调控，不专门encode obj.id（pop.n.rsp 可以），单个IT.n更tolerant于各参数变化.

8.IT解调窗口（150-200ms），fireRate coding（泊松过程） id、位置、大小、orientation等

9.视腹流的流水线工人类比，士兵组织管理类比。每层利用下层输入的信息做非线性变化产生输出结果以更好满足高层的要求，高层对你工作反馈评价来指导你改变w来更好加工数据和安排下游工作。每个员工只RT知道上层指示和下层汇报，不关心其他层goal。信息不断汇集到高层（可见森林），高层指示层层下达指导并分级部署工作。同层内并行无协调（ff快速处理online op）处理不同任务，层间串行增加处理深度复杂度。上对下提要求，下对上报告进度。G决定整体架构。

10.Hubel Wiesel提出AND.op(组合识别)OR.op(容忍variation)的NLN(normlised 线非线模型)，很好解释V1行为。作者提出subpop在局部subspace做untangle。

11.时间连续性助obj在状态空间表达manifold上连续，助识别的invariance与tolerance机制产生

12.用大量实验神经学测量的数据知道算法选择，配合各层的homogeneity，只需算法迭代，看是否能解释所测猴神经元的电生理。

Science: 20181208

Functional compartmentalization and viewpoint generalization within the macaque face processing system

脸识别的神经机制

脸识别的区分PL,AF(未提及)，ML/F(脸orientation调控), AL(orien调控又有镜像对称特征), AM(人id识别)。ML/F（初级区）->AL（中级区）->AM（高级区）, 脸orient调控减弱而人id识别增强，旋转缩放平移不变性增强
猴脑插电极于三个区，测量神经元放电于观看图片。FOB(脸1组+物7组图片，共128张)与FV（25人，orien=左全、左半、正、右全、右半、上、下、背脸，共200图）
FSI（脸识别指数）=(R脸-R物)/(R脸+R物)，ML/F有97%脸调控神经元（7%抑制型，90%兴奋型）；AL有86%脸调控神经元（24%抑制型，62%兴奋型）；AM有89%脸调控神经元（10%抑制型，79%兴奋型）
ML/F神经元对特定orien脸放电，不区分人id；AL分两类（a.喜左右脸，受正脸抑制；b喜正上下脸，受左右脸抑制）；AL有些n对脸不反应因为该脸orien不对。AL元放电镜像对称，左脸右脸放电相似。
MDS图：ML/F按脸orien分簇且相邻簇的orien相近；AL簇聚集为左右全脸簇、左右半脸簇、上下正脸簇、背脸簇；AM不按orien聚簇而按人id聚簇
人id selectivity 元比例： ML/F 19%，AL45%，AM76%
相似矩阵：每块25x25个不同人，8x8orien块。ML/F对角块cc强，只与脸orien有关，即张三左脸与李四左脸pop.n放电矢量相似；AL出现镜像对称，如左全脸与右全脸相关强；AM丧失orien相关性（整体一致发黑）而出现旁对角strips代表按id相关的出现。AM层神经元以sparse放电来code id
神经元放电sparseness=[sum(Ri)/N]²/[sum(Ri)²/N]。更应该叫denseness，值接近1则该神经元对什么都放电，接近0则只对某些stimulus放电专一性好
ML/F->AL->AM为串行结构，因为latency与peak time时间有先后顺序
低到高处理步骤。a.ML/F神经元反应于特定id的特定脸orien；b.AL镜像对称，pool于3簇且相互抑制；c.三簇在pool出view-invariant的id，并sparse表达
空间位置（retina eccentricity）和size不变性：图片摆得太偏则对face放电有影响，对obj无影响（就是baseline放电），图片size大则各层神经元放电强
view-invariant id cc index=(同id各角度cc的平均值)/(不同id个角度cc平均值)；该值大代表识别id的专一性强，该值接近于1则代表没有专一识别性。

Nature: 20181201

Coherent encoding of subjective spatial position in visual cortex and hippocampus

V1与CA1神经元放电编码自身主观空间位置

V1.n.a 受到自身空间position的调节。双光子钙成像，发现上下半段同样视觉场景但神经元放电不同
奇数trial找各神经元放电的最大反应位置, 偶数trial算调节比a_max+-40cm/a_max，该比值接近于1则反应同样场景有同样放电反应。其积累分布的中值为0.61，显示单峰性强受到位置调控
V1神经元放电不能由视觉画面（甚至ROF外画面）解释。 px-2-px identical画面下，调节比中值任只有0.62
V1神经元放电不能由速度、瞳孔大小/位置、奖励解释。多种速度、稳定瞳孔、无奖励调节比中值~0.60
训练老鼠在奖励区来舔水，正确率80%，依视觉对比度、跑步的VR增益
海马CA1神经元放电也受到类似位置调节作用。训练Bayes解码器，可通过V1或CA1 神经元放电准确预测老鼠位置
分别用V1或CA1神经元放电做预测，两者误差相关
V1、CA1放电信息预测老鼠位置是主观位置，可能不准确，老鼠根据这个主观位置做lick决策
老鼠根据V1/CA1放电信息判断自己位置，若高估则早lick；低估则晚lick
V1神经元放电特征不只是Gabor filter，还受到位置的调控，这很可能因为Hipp直接或间接反馈信号影响

Nat.Rev.Neuroscience: 20181124

The free-energy principle: a unified brain theory?

自由能原理

将各种脑模型转化为变分自由能框架下的优化问题，优化量为Value（suprise，预测误差，cost，未来奖励积分等）
自组织系统（人、脑、细胞、等）得降低自由能来客服自然disorder的倾向。熵即surprise即-log(p(s))，脑用有限神经元对外世界状态建模，对最常见世界状态用少量神经元编码，不常见的世界状态编码量大也无妨，这样的策略总体熵很低。
熵/surprise，因人而异，你觉得新奇的东西对他人可能习以为常。Agent通过改变自己（如脑连接结构）和做action于世界来最小化长期平均suprise来维持系统稳定
Fig1.a. 外部世界隐状态x及其微分方程来描述动态; 接口细胞（retina、听毛细胞、皮肤感受细胞）放电来s测量外部世界；脑皮层处理s，深层神经元放电表达s的外在原因Θ，对外世界原因Θ的深沉次结构知识得改变突触连接来encode，通过最小化自由能F可以实现脑内状态u的改变；脑信号可通过motor对外界做action而改变世界状态，进而获长期价值。
人通过神经形成神谕的识别网络q(Θ|u), 又维持gen.网p(s,Θ)负责重建sample，再与原s比较来判断识别和重建网络性能，以及更新权重提升两网性能. 参见DLGM视频，Gen网由于synp来重新拼合states形成prediction
脑为推理机，类autoencoder的’分析by合成’，通过重建来看自己识别的对不对。p(s,Θ)=p(s|Θ)likehood * p(Θ)先验，感觉为构建过程p(Θ|s)根据s来猜测外部原因。粪球无val？屎壳郎能从中得到食物，因此code该气味为香。感觉只是对外物的主观价值评价。
fig.3感觉分类，2维参数(v1 v2)能产生各种声音，鸟能通过听复杂声音而推导出控制参数，从而进行声音分类，比如是哪只鸟发出的声。
吸引子：控制参数/状态空间，吸引子附近即便有小扰动也不会偏离吸引子而去
自由能形态：F=surprise+D[q||p(Θ|s)], bound于surprise之上; F=Gibbs-q.熵；F=D[q||p]复杂度=(p的限制q)-ln(p(s|Θ))准确度(知道原因Θ后看接口神经放电s是否与预测一致)
脑的等级predictive coding 模型：前馈传预测误差by err.n，反馈传预测by stt.n，fb.pred有助减少低层pred.err，F优化后pred.err降低而pred变准确
Hebbian.plusticity:几坨神经元互联权重变化由前后突放电决定，多用多连的原则。统计Regularity（如重力及速度g）记录于synp.w，随着人长大，synp.plsc成熟，对世界认识变成熟。
correlation.th: 同一物体不同属性引出不同神经元同步放电，致synp.pls
时变的(如obj.v)表于n放电，时不变的(obj本身、规律常量等causal regularity)记录于突触权重或者说gen.mdl.para上。synp mix stt来重建预测
biased competition: 底到顶会因为亮度对比度等而关注某些物体或者某些神经元有放电优势；顶到底根据desire关注特定对象，而使得某些神经元优势放电
协同学：快变的模式（如动态神经assembly放电模式）完全受控于慢变的参数模式（如脑区间connectivity）
Helmholtzian：产生模型通过优化参数来学习data的隐藏结构做识别
精度会对pred.err影响做加权，高精影响大，乙酰胆碱可能参与调节时间常数来同步Atten
有效编码/infomax/redundancyReduce: 优化s与其内表达u的互信息，内表达可encode s的充分统计量（如Gauss的均值和方差）能简短编码长度。
神经达尔文与Val.Ln: 先天产生脑分区结构等，内遗传携带val.prior信息（如生下来就知道哭着要奶吃），后天学习细化脑连接，通过各区域间信号相互作用来实现。
RL：val.dep.Ln, 最大化LT.val, 找policy来选择action = π(state), 见DDPG视频，n.val助加粗synp.w that 能帮跳到更加valuable的未来状态。F最小化保证能在valuable state呆长时间。选择讲这篇文章的action也许就是因为大脑val.sys觉得它有长久价值积累吧
遗传的prior通过innate.val产生参数空间吸引子来传价值观给子代。自然通过表型而选择优秀个体以及相关基因以及对应的val.prior。
优化控制论和博弈论：通过运动微分方程来推导出控制法则。起于一个cost函数，构建Val.fn 未来奖励/惩罚等的加权积累，然后guide action选择。

Science: 20181117

A tailless aerial robotic flapper reveals that flies use torque coupling in rapid banked turns

无尾飞行器原理

无尾飞行器组成：左右各一对’对扇翅’，autopilot, 远程遥控接收器，翅根伺服马达，二面角伺服马达，左右振翅马达，振翅齿轮机构，6个红外追踪marker，电源，SD卡
autopilot：多核处理器CMU，惯性导航系统IMU，控制软件Paparazzi，脉冲带宽控制信号PWM，rpm接受端TIM，远程控制信号接收端PPM，SD卡借口SPI
IMU类sensory系统，蝇等用此做propotional integration（PI）反馈控制姿态稳定，加导数的二阶控制更加精准
姿态控制作用：a. 推力thrust: 双翅振动产生反作用力； b. Yaw矩（绕上下轴），翅根错位使得thrust水平分量产生的力矩；c. Pitch矩（绕左右轴的俯仰），翅膀产生二面角从而与质心错位形成的力矩；d. Roll矩（绕前后轴转），左右翅thrust不同产生的力矩
红外Camera可通过六个marker测量飞行轨迹、速度、加速度、二面角、各种角角速度等；IMU可通过gyro和加速度计测量并计算出类似参量，而后两者通过时间cross-correlation对齐
Banked Turn模拟：a. 反馈控制模式下，飞行器先倾身产生前向速度；b发现危险启动无Sensory反馈的open loop（条件反射式）的躲避变向；c.反馈控制模式下，恢复到offset姿态
Pitch/Roll比（用q/p值表征，0.54Roll主导；1.67Pitch主导）决定turn rate的大小，值大则转弯快
蝇不能前后扇翅膀做原地陀螺式yaw旋转，但稳定面对方向需要yaw矩，此矩被动产生于平动和roll、pitch矩的耦合
Yaw矩公式(1)，有三部分组成。a.yaw旋转的反作用力矩；b.前向平动与Roll矩的耦合；c.侧向平动与Pitch矩的耦合。Yaw角加速度由Yaw矩除以上下轴转动惯量(5), 测量值与模型预测值一致

Science: 20181110

Efficient cortical coding of 3D posture in freely behaving rats

身体姿态的PPC/M2神经元编码

PPC负责察觉自己身体各部件的空间位置，即身体姿态。老鼠M2（类人Premotor）负责计划控制运动
电极植入鼠PPC与M2皮层测量神经元放电；在尾、背、颈、头装markers，用六个摄像头识别鼠姿态参数（头pitch azimuth roll，脖elevation，背pitch azimuth，自身参照系参数），以及速度、位置等外参照系参数
PPC、M2神经元放电主要显著coding上述六个姿态参数，不同神经元specific放电于不同姿态
GLM通过combination六姿态时序和外参照系时序（类fMRI的design matrix）来解释individual神经元时序，并按能解释成分的显著性来分类这些神经元，其顺序为头姿态、背部姿态、脖子高度、综合姿态、速度相关神经元。即该PPC、M2神经元放电受到姿态调节但不受运动状态如速度影响。
PPC与M2姿态神经元有拓扑分布fig.3a, 且编码头姿态神经元多于背
PPC神经元与M2神经元放电时序有相关pairs，且PPC显著早M2放电50ms
Isomap用于将6维度姿态参数（或高维神经元放电参数）转为2D posture map来可视化。Isomap测与n.ensemble放电，能用于预测老鼠当前姿态
对于常规姿态（即低头觅食），PPC放电神经元数量少，对奇异的姿态却需要很多PPC神经元来coding。尽管常规姿态的放电神经元少，但预测出的姿态却更加准确。此coding方式准确且节能

2018 Nobel Chemistry Prize：2018-11-03

part2- Phage Antibody Display

抗体的噬菌体展示

George P. Smith & Sir Gregory P. Winter

2018 诺贝尔化学奖 2：George Smith & Sir Gregory Winter，抗体的噬菌体展示

未来医学是基于基因的个性化靶向治疗，单克隆抗体决定治疗效果，噬菌体展示技术PDT无疑是单抗生成的最重要工具
噬菌体：有DNA和壳蛋白，能转染其DNA于宿主菌，并在其中复制、组装生成子代噬菌体。
噬菌体展示：将目标抗体基因插入噬菌体基因，其对应蛋白会随噬菌体minor coating蛋白pIII的生成而展示在噬菌体表面，抗原可从众多噬菌体中钓出匹配的抗体，其基因信息可从其噬菌体内得到。PDT将抗体phenotype映射到对应的Genotype
IgG：免疫球蛋白抗体，为Y状蛋白，抓手部的重连轻链的可变基因重排决定抗体靶向多样特性，排列数量庞大决定抗体种类繁多而几乎能识别各类抗原(病毒、细菌、寄生虫、癌细胞等)。
AIRE(autoimmune regulator)：T细胞的表面受体TCR为IgG超家族，成熟前在胸腺中测试于各种自体蛋白，若有反应则被程序死亡apoptosis，从而避免免疫自伤害autoimmune
scFv: 最常见的单抗形式，由重链可变段V_H、轻链可变段V_L经寡肽连接而成。该抗体尺寸小可溶性强、毒性小。该抗体可conjugate 药物、放射性同位素、cytonkine等做靶向治疗用
抗体指标：对抗原（如某癌细胞蛋白）的亲和力、specificity、expression、基因稳定性等要强，毒性、免疫原性要弱
载体DNA组成：promotor、信号肽(如何剪切拼合DNA)、Ab的展示序列、His-Tag(多His环能螯合金属离子做纯化)、AC(琥珀密码子在non-supressor E.coli可断肽键形成游离抗体)、质粒复制点、菌中复制点、抗抗生素基因
自然免疫过程：(a)B-Cell发育重组V_H（VDJ）、V_L（VJ）形成抗体多样性；(b) B受体被Ag激活而克隆繁殖Ag-specific B-Cells；(c) 启动免疫反应后，做somatic mutation来使得Ab亲和力增加
PDT过程：(a) 用PAL库重组配对V_H、V_L；(b) Ag做克隆选择(biopanning), 再到E.coli中放大;（c）抗体做位点突变进化来改善亲和力
PAL库可源于有免疫反应的病人、健康人、或人工合成。Ab.lib的多样性决定抗体最强亲和力大小。
PCR: 高温双链DNA解离，降温引物连接DNA，升温拉长做DNA复制。指级拷贝数量增长
Cancer病人骨髓取B-cell，提取反应抗体相关mRNA，产生对应的互补cDNA，PCR克隆V_H、V_L段，VH-VL gene各种重组形成scFv pool，转入噬菌体载体DNA，在E.coli中产生可溶性抗体

2018 Nobel Chemistry Prize1：2018-10-27

part1- New Enzyme by Evolution

酶的进化设计

Frances H. Arnold

2018 诺贝尔化学奖：part1-酶的进化设计, Frances Arnold

生物蛋白分子通过自然进化以产生新功能、应对环境变化挑战、产生复杂生物分子反应生命现象
化工工业需要强试剂、腐蚀性酸、重金属等来生产材料；酶催化反应更绿色环保，但人类只能设计最简单的有功能的酶结构。自然利用进化机制设计出不可胜计的酶与反应。
Arnold利用自然进化机制指导酶设计：a.随机突变基因，b.突变基因在菌中生产突变酶，c.筛选有特定反应活性的突变基因，d.基于此基因做新一轮突变与选择。
利用定向进化，三轮突变选择后的subtilisin能使有机溶剂中催化Casein分解效率提高256倍
定向进化已有多种工业应用，如生物能源可转单糖为异丁烷供汽车飞机燃料、塑料生物降解等
细胞色素P450蛋白是自然塑造的多功能酶平台，该超家族蛋白有铁-血红素为cofactor，常为单氧化酶，在药物代谢、荷尔蒙合成分解等起重要作用
铁-血红素：铁离子协调porphyrin环后ligate到P450 cys残基上。在高氧气低氢离子的肺部能ligate 氧分子，而在高CO2的tissue释放氧分子
蛋白-铁-血红素催化羟化：a.待羟化有机分子R-H靠近铁-血红素挤掉其水分子，b. 还原剂NADPH供电子还原Fe³⁺，此时能ligate CO分子其光谱吸收峰为450nm，c.氧分子ligate铁血红素有一未成键电子，d.其强氧化性抢来另外一个电子而带负电，e.两个氢离子与一个氧原子结合成水，氧与Fe⁴⁺成双键连接，f. 类似于碳宾，氧原子insert到R-H间，铁血红素回到原来状态
自然P450用铁血红素结构可催化羟化、环氧化、磺化、硝化、脱烷、缩/扩环等反应
新试剂EDA在还原剂NADPH下可与铁血红素生产金属碳宾类似物（类P450 compound I），能催化苯乙烯做环丙烷化，起初效率低，Ser-来取代Cys-残基来ligate铁能显著提升效率，尽管丧失原P450单加氧酶能力，吸收谱线也变为411nm。该酶已经成为非自然的新酶家族P411(尽管99.8%序列同P450)，能催化非自然的新型反应如环丙烷化。
Arnold还注意到P450bm3能产生低效率分子内C-H胺化反应，基于叠氮的TsN3能与铁血红素生成金属氮宾类似物，实现氮宾转移反应。而后通过进化机制对活性位点突变筛选，进而turnover率可提升百倍，选择性达99%以上，完成非自然的新化学反应如杂氮环化等。
智者见于未萌，一流的科学家有敏锐的直觉，能感受到科学之神的引领，能抓住契机闪现的瞬间

2018 Nobel Physics Prize：2018-10-20

part2- High-Intense and Ultra-Short Pulse

超强超短脉冲

Gérard Mourou & Donna Strickland

2018 诺贝尔物理奖 part2：超强超短激光

Strickland和Mourou因CPA啁啾脉冲放大而获奖
CPA:短激光脉冲经光纤而被拉长（正常色散介质中光速与频率有关，低频红波段先出来高频段后出来），激光增益介质按先后顺序对不同波段光强度放大，放大后的光在double grating中做压缩（用长光路来抵消先到的低频红光，从而多频段光波重新合成窄光束输出）。CPA分段放大可避免多波段同时放大饱和和仪器限制。
CPA带来的强激光物理开启诸多领域研究，如激光粒子加速器，光切割，核聚变激光点火等
1965激光锁模技术使得光脉冲duration不断缩短，有了今天的飞秒10^-15阿秒10^-18科学。
mode locking：激光谐振腔决定激光谱梳状模式，调整各纵模相位和合成超短脉冲输出。
激光全息：照相阶段：分一束相干激光照object，其散射光落在记录胶片上，另一束相干激光直接在胶片上与上述散射光形成相干图样，胶片迅速shutter记下相干相位。显像阶段：激光照胶片，衍射光反向形成物体虚像。由于胶片记录全信息，观察者在不同角度可以看到不同图像，甚至被遮挡部分。
Streak Camera：短脉冲时域波形，在介质中激发同形态光电子，时变电场再把电子束相继投射在显示器上，这样就可以从空间上观察计算时域波形。
阿秒脉冲原理：外加few-cycle强cosine型光场，强光电场助回撞recollision电子隧穿离子化，时变光电场先使回撞电子外移而后转向加速撞向母离子，回撞电子波函数与原轨道波函数相互干涉，电子跃迁回原子轨道，转部分能量来发射光子。高通滤波只保留高频XUV成分，可形成阿秒duration脉冲。
分析所测得的阿秒光脉冲可重现回撞电子与母离子collision的过程，可通过电子全息的方法成像该电子的分子轨道。
调节外加光场波形可以控制回撞电子什么时候产生、回撞路径、能量等，可以操控产生单或多阿秒光脉冲、可以time-resolve原子分子固体中的单多电子动态。
超强外加光场还可激发出inner shell的电子，而后空穴被各种电子-电子相互作用补上。可观察常规的阿秒光脉冲、Auger decay、以及电子shake-up现象等。

2018 Nobel Physics Prize：2018-10-13

part1- Optical Manipulation

光操控

Arthur Ashkin

单束强聚焦激光的作用力：光辐射压；光电场极化介电粒子并产生gradient force. fig.0/1
光波前engineering实现不同样式的动态光阱势分布landscape，来囚禁移动介观粒子
全息光镊HOT：TEM00模式激光经波前相位图（计算机控制液晶或MEMS mirror array）衍射后在物镜聚焦平面形成动态光阱模式。fig.2
全息光镊可水平纵向3D移动微纳米粒子及阵列。fig.3
Generalised phase contrast (Image-Fourier-Image)比全息法更直接有效形成指定光阱pattern
光控微加工：由光镊安排好的微纳米粒子分布在光化学作用下可固定成有功能的3D结构。fig.4
光actuator: 光驱微纳米泵与阀在微流系统中作用关键。fig.5
光驱旋转：helical mode形成环形光阱，用光轨道角动量旋转微纳米粒子fig.6。helical配合平面波可形成任意样式的动态光阱fig7
Bessel mode光阱：产生于径向相调控，传播无衍射，能自动重建波前，抗干扰，能高精长距推微纳米粒子fig8
光操控目标：单仪器能灵活、无伤、高精、多点、同时、移转、组装、驱动微纳米系统
光操控用途：
- 生物: cell sorting、大分子纯化、cell内手术(如切断DNA等)、胚胎细胞检测、肌动蛋白力测量
- 化学：组织异质性等级结构有特定功能的3D纳米材料，微光路、sensor array等微纳米加工
- 物理：原子囚禁实现玻色爱因斯坦凝聚(97年诺奖)、微观统计力学、微流体研究

2018 Nobel Medicine Prize：2018-10-06

Anti-tumor immunotherapy by checkpoint blockage methods

抗癌免疫疗法-停止点阻断

James P. Allison and Tasuku Honjo

癌细胞有特化蛋白（以保持不停繁殖等特性），能在蛋白合成分解过程中被免疫系统识别并启动免疫反应来清除载有该抗原的细胞。
免疫系统checkpoint（停止点）通路以及相关蛋白的作用为防止autoimmune（免疫自伤害），如防过敏、类风湿等误伤自己组织与细胞
癌细胞利用checkpoint工作机理来抑制免疫系统活性而得以躲避免疫杀伤
阻断checkpoint通路可以激活延长免疫系统抗癌活力（非传统靶向癌细胞），利用自身免疫能力杀灭癌细胞
CTLA4通路机理：癌细胞抗原被识别初期，T细胞表面受体CD28发co-stimulatory信号激活免疫系统，该信号也转胞内囊泡中CTLA4受体于细胞表面来防止过度的免疫自伤害。CTLA4和CD28有共同配体CD80/86，但表现为抑制与兴奋T细胞的相反作用。T活化后，由于新转出表面的受体CTLA4比CD28亲和力更强而使免疫活性不断下降。
Allison用CTLA4单抗ipilimumab阻断CTLA4通路而重新激活免疫系统。临床该药使得晚期melanoma在肺与脑转移的肿瘤消失。2010年该药通过FDA认证，疗程短，仅4针，30000美金每针，病人存活期增加3.6个月
PD1通路：癌细胞抗原被识别后，T在淋巴组织活化成熟而后到肿瘤区，与此同时T细胞产生checkpoint受体PD1于T表面。过强的炎症信号如IFN_gamma能促使免疫细胞或肿瘤细胞产生配体PDL1、2来阻断免疫反应以便防止免疫自伤害或者做免疫对抗。有些通过癌原通路如PI3K-Akt主动产生免疫阻断配体
Honjo阐明PD1通路机理，促成未来anti-PD1药物研发。该类药免疫毒性小、且广泛适用多类肿瘤免疫治疗。
combinatory疗法是当下研究热点。举例来说，checkpoint阻断疗法只针对有免疫原性的肿瘤才有作用，而vaccine疗法能增强免疫却常苦于癌细胞的checkpoint的抑制作用。两种药同时使用可激发自体抗癌免疫作用又避免checkpoint免疫抑制，临床疗效相当显著。

Nat.Rev.Neurosci.: 2018-09-29

Prefrontal–hippocampal interactions in episodic memory

记忆处理中的脑前叶和海马相互作用

海马：组织所经历的片段记忆于情景context下。
mPFC：指导提取context proper的specific记忆，抑制其他竞争性记忆
Tha.Re：介导Hipp与mPFC做theta同步，指导信息流传递方向
Hipp类似一个记事本，按照场景记录很多事件细节。
PFC实时查看记事本的某个片段来计划未来或者决策当下
MH病人伤海马，无长期记忆但可以按花色分类扑克牌
KM病人伤PFC，过往记忆完好，但是不能完成按颜色分类task。PFC没法传递规则信息给海马
伤海马，老鼠想不起来吃过柠檬。伤PFC，能想起来吃柠檬，但你问它，它却不能好好回答你
红path：vHipp-->PFC, 于object exploration阶段看到context发信息给PFC
绿path：mPFC->PRC/lEC->Hipp，顶向底发送命令来提取specific event M
蓝path：Tha.Re 介导Hipp与mPFC做theta同步，指导信息流传递方向
只要保持一侧(左或右侧)的mPFC和Hipp同时完好，就不伤害做记忆task
传context.cue给PFC时，两区放电theta同步锁相且Hipp超前30ms(长于monosynp.通信)
T.maze.delay期间传决策/规则信息给Hipp时，theta同步且PFC放电超前30ms
Specific片段不用给PFC，而是让视听皮层重放

Nat.Neurosci.: 2018-09-22

Integration of objects and space in perception and memory

感觉记忆中的物体与空间整合

dorsal流 [motion]：

视杆细胞-LGNm-V1-V2-MT-MST-Parietal-(PPH-mEC-Hipp)/dlPFC

V1.背侧.n：高时间分辨率、敏于运动边、有grating方向选择性、只local motion；
V2.n: motion处理、directional map；
MT: 2D.dir/spd、多点综合motion、区分多moving.objs、不敏颜色；
MST：3D.motion、光流计算、自我他物motion。MSTl(obj.v.traj、动眼)、MSTd（旋转缩张光流计算得头方向运动方向);
Parietal：cog.map from 光流计算，自我他物motion。
mEC: Grid Cell, Head Direction Cell, Boundary Cell etc. (计算速度等内导航)
Hipp.n: Place Cell etc.

ventral流: [颜色、form]：

视椎细胞-LGNp-V1-V2-V4-IT-(PRC-lEC-Hipp)/OFC

V1.腹侧.n: 高空间频率、敏颜色、对比度。orien.sel(grating、edge)。有object based fb。
V2.n: 敏边走向、轮廓。assign edge to object representation。
V4.n(fig.1): 编码曲率、尖角朝向、相对质心位置
IT.n(fig.2): 两面片凹凸性、位置关系、法向、两面片乘积。需3Dcue(双目识别、阴影)判断形状、放电有光照不变性、部分移动旋转缩放不变性。(fig.3)骨架结构识别。(fig.4)脸区.n为多ftr composite，但无explicit含义。
lEC: (fig5) TEd.n加密大尺度环境obj/bkg。STS.n加密小尺度obj. (fig6) lEC.n 可为object-related、loca-related、可放电与remembered物体位置。(计算相对位置，外导航)
Hipp.n: 加密内容可变、能记住以往obj.loca、可为landmark.vec.n。

Nat.Rev.Neurosci.: 2018-09-15

Decision making in sensorimotor control

感觉运动控制中的决策

今天这篇文章讲’感觉运动控制中的决策’，附带三篇Nat.R.NS关于sensorimotor文章的keypoints。

对感觉运动系统的研究是一个相当复杂的问题，因为它涉及做信息采集的视觉听觉躯体感觉系统、处理方位速度关系的Parietal皮层、负责价值判断运动规划决策导航的Frontal-limbic皮层、具体实时误差处理感觉上传的小脑系统、以及各关节协调运动反射信号传递的Spinal和周神经、肌肉等系统的协同工作。感觉运动控制目前吸引大量顶级科研机构关注研究，从人工智能知识表达、RL、policy等学习到机器人优化反馈控制look-forward预测，到中风帕金森病人康复疗法都受益于神经学在该领域的研究成果。

本文具体讲述1.单target实验中，神经做运动corrective反应分motor system 和 visual system。2. competing target实验中，Fronto-parietal系统在目标选择前同时表达多个objects，init自动选取平局路径以减少修正cost、以及该平均是基于motor map而非vis.map。3. 实时快速切换目标时，应急plan与决策时间点。4.Drift diffusion模型如何解释change mind的decision与confidence变化。5.sequencing action的look ahead机制、以及如何优化控制sensory采样来提高收集信息的能力。

1. Gallivan, J. P., Chapman, C. S., Wolpert, D. M. & Flanagan, J. R. Decision- making in sensorimotor control. Nat. Rev. Neurosci. (2018).

2. Engel, A. K., Fries, P. & Singer, W. Dynamic predictions: Oscillations and synchrony in top–down processing. Nat. Rev. Neurosci. 2, 704–716 (2001).

3. Scott, S. H. Optimal feedback control and the neural basis of volitional motor control. Nat. Rev. Neurosci. 5, 532–546 (2004).

4. Wolpert, D. M., Diedrichsen, J. & Flanagan, J. R. Principles of sensorimotor learning. Nat. Rev. Neurosci. 12, (2011).

Deepmind: 2018-09-07

Temporal difference - variational autoencoder (td-VAE)

时域差分变分自编码器

Deepmind 通过GQN来处理静态场景的工作发表在Science上，基于此的动态状态处理模型td-VAE则朝向人类智慧又迈进一步。以往人们利用Hidden Markov Model来迭代式预测未来状态，Gregor则用神经网络一次性time-skip式做预测，这不但大幅度减少计算量，从神经角度上看该策略也更接近人类思维。

作者利用RNN(蓝球)来观测收集环境信息产生状态矢量S_t以供预测未来与action选择。t2时刻Agent观察到x₂并用(1)来更新自己的状态s₂。该状态s₂经过MLP(multilevel perceptron)神经网络产生隐变量z₂的分布均值与方差，即得分布p₂^B(z₂|s₂)，再由(2)可采样出具体隐变量矢量z₂。有了t2-t1间更多的信息，我们可以对z₁有更好的描述，即后验分布q₁^I(z₁|z₂,s₂,s₁)，它可实现于MLP网络。q₁^I可以指导z₁的先验p₁^B来改变参数来更准确地描述z₁的分布(通过降低cost函数KLD项)。p₁^B或q₁^I可采样出具体z₁^，经过绿球预测网络得到低准确度的z₂分布p₂^P(z₂|z_1,dt)，该分布在优化中不断趋近于更准确的p₂^B，通过改变p₂^P网络参数而最小化cost的L1项得以实现。隐变量z的具体内容是否准确，需要通过重建网络p₂^D的优化来实现，即最小化cost的Lx项，这样z矢量经p₂^D网络所重建的图像最接近于观察x2。网络以上述方式训练好后，可以预测dt时刻后的隐变量zt，并可以通过p^D网络来一步重构出未来的观测。

td-VAE是deepmind近年来成果的集大成者，原理、结论都及其震撼。

MVGC: 2018-08-31

The MVGC multivariate Granger causality toolbox: A new approach to Granger-causal inference

多变量葛兰根因果推理

通过分析人脑MRI信号，可以求得人脑组织结构、白质束连接状态、功能区放电相关性等。Granger Causality可以通过对脑BOLD信号U_t分析，得到不同脑区activation的有向影响关系F_Y→X|Z。G-Causality可被解读为 “the degree to which the past of Y helps predict X, over and above the degree to which X is already predicted by its own past and the past of Z”。该法建模于VAR矢量自回归模型(1)。在无原因Y的reduced model（16），当前的X_t信号只能由X.past来解释，而有Y的full model（15）则能解释掉更多（由Y.past引起的）X_t的信号，此Y对X的G-Causality就量化反映在两项残差差别(18)上。Y→X的关系还可以同时受到Z的影响，VAR（20-22）可以condition out掉Z的作用避免spurious G-Causality的出现。从互功率谱密度CPSD的角度也可以求解G-Causality，通过BOLD时序可以计算出自协矩阵Yita_k(5), 用傅里叶求出其互功率谱密度S(7)，再分解出转移矩阵H以及残差协方差sigma(9)，而后G-Causallity谱f_Y→X可求取于(27)，平均掉所有频率lambda亦可得到时域G-Causality FY→X(30)。VAR时域参数（A_k,Sigma）, Yita_k，以及CPSD均可以等价描述信息流G因果关系。MVGC综合利用这些关系、提供了一个很有效的G-Causality计算平台。

DeepMind：2018-08-24

Towards Conceptual Compression

概念压缩

convDRAW，Gregor和Wierstra将DRAW网络去掉Attention并加上卷积层提取feature和重建的版本。原理：原图x与剩余图epsilon经卷积网络提取特征后送给第一隐藏层的encoder E1，E1在h^d_t-1的指导下更新(2)所关注内容的lat.ftr Z₁的近似后验分布q(z₁|h^e_t)，而后具体采样出z1~q(Z₁|h^e_t) (3)并送给同层Decoder D1做重建(5)。重建根据所采样的ftr code Z₁来还原渲染出原图，在本文D1所蕴含的lat.ftr.vec Z₁的prior p(Z₁|h^d) 应该由variational的q(Z₁|h^e) 来不断逼近(7)。T此迭代后，重建卷积模块R的神经元放电r_T用于参数化输出图片各像素分布(9)，而后采样出convDRAW所生成的图片x~p^x。多层次convDRAW原理与之相同(12-22)。本网络的目标函数用到Hinton的bits-back coding，待看。从意义上看，h是图片特征而Z是按该特征概率分布分布所使用的编码。我们希望用最短的代码Z压缩图片或者说用Z最有效的前位bits来提取传递图片最关键特征 (11)。从形式上看，Encoder各层次对lat.ftr Z_i的后验q(Z_i|h^e_t)应与Decoder所用先验p(Z_i|h^d_t)相接近，即最小化KL(q_i|p_i) (11)。实验结果告诉我们初始迭代，convDRAW会关注图片的宏观结构信息(高层次特征神经元放电多)；迭代中后期则是逐步添加图片细节信息(低层次神经元放电多)。且convDRAW是基于feature的VAE，可以做压缩编码用且实验效果好于JPEG压缩。这点是PixelRNN等靠相邻像素依赖关系恢复细节模型说做不到的。

tDCS: 2018-08-17

tDCS facilitating MI-BCI in post-stroke rehabilitation

tDCS辅助MI-BCI做中风病人康复

中风后病人需要不断锻炼来招募神经元做受累功能网络重建，中重度病人往往很难支配受累肢体。Mental imagery(MI)-Brain computer interface(BCI) 技术可以在病人脑想象各种受累动作时用脑电图(EEG)提取mu-ERD/S信号来驱动机器手臂助受累手运动。transcranial direct current stimulation（tDCS）在受累M1加阳极电刺激来提升该区域神经元放电excitibility进而增加activation水平和受累脑区神经网络功能重建。

本文针对19个病人(分sham和real组)做tDCS+MI-BCI康复训练，发现1）post-stroke病人任然可以在MI-BCI帮助下提升motor performance(康复训练后FMA score显著提升)。2）相比于sham组，tDCS intervention显著增加病人MI信号检出准确性。3）tDCS组显著增加受累脑区mu-ERD信号强度。4）tDCS组显著提升受累脑区excitibility(相比于shame组，tDCS的RMT值显著降低)。4）DTI测量发现受累区cortical spinal tract 和双侧collosal corpus 白质束的FA值只在tDCS组有显著提升。5）pCASL MRI发现脑血流CBF与临床FMA有正相关关系，等诸多乐观结论。

总之，阳极tDCS能增加脑皮层神经元放电能力，这有助于脑网络调整恢复由中风引起的功能丧失。尽管tDCS如何改进病人康复能力仍有待高人在机理上做出解释而指导更为有效的康复安排。

ERD/S: 2018-08-10

Event-related EEG/MEG synchronization and desynchronization: basic principles

人脑事件相关去同步与同步

人脑研究最大的困难是不能打开脑壳来测，故磁共振成像技术是无伤测量脑功能与结构的主要手段。MRI最大的困难是动态研究时间解析度太低(~3秒)，故脑电波EEG、磁波MEG在此方面作为补偿(他们本身空间解析度又太差)。本文讲脑电波磁波重要技术 ERD/S“事件相关去同步/同步”。

先介绍了脑波的5个频带范围(还有mu波)与对应脑功能特点。首先神经元放电低频同步是表征休息的idle状态，而当神经元开始处理各自任务时，其放电就表现为与众不同（即退出同步）并可测量到ERD。因为低频(alpha和mu以下)震荡慢，神经元同步容易且范围广，所以pre-task测量的低频ERD信号强。高频带(如高beta和gamma)能更快处理更复杂问题，这往往需要更多的attention参与。在空间上ERD/S只出现于task相关脑区；在时间上会先后出现alp.ERD, gamma.ERS, beta.ERS等阶段模式, ERD代表神经元开始工作，而我觉得中高频ERS更可能表达high attention下的局部一坨neurons在短时休息。本文还具体讲述了如何测量计算ERD/S，不同task的脑图时空特征等。

ERD/S是物理可观测的，我们可以通过该信号来实现意念控制。Subject想象身体动作，M/EEG从不同脑区测量各肢体对应的多频带ERD/S信号，并以此来控制机器手臂实现手抓取操、用脚走路等动作。

DeepMind: 2018-08-03

DRAW A Recurrent Neural Network For Image Generation

DRAW 深度迭代关注网络

DRAW网络是KarolGregor和DaanWierstra提出的另一个经典AI架构。DRAW引入attention机制，可以像人一样不断glimps世界的片段，并在画板上逐步积累绘制出他的对世界理解。

原理：t-1时刻，Decoder网输出h^dec_t-1，并据此产生t时刻read模块的关注区以及产生相应的关注数据[x,x_t^hat] (21-27)。该关注数据进入RNN^enc，计算出关注区latent.ftr矢量z_t的统计分布Q (5,1,2)，并据(6)此采样出latent.ftr.vec z_t而传给Decoder网。Decoder网利用此z_tcode来更新RNN^dec输出h^dec_t (7)，此输出一方面指导write模块在canvas上修改绘画完善作品(8)，另一方面更新关注信号来指导read模块做新的观察(21)。如此反复T个t.steps，积累出各像素值的概率分布sigmoid(c_T)，从而采样出输出图片x^hat(16)。DRAW的优化利用minimiz descrption length(MDL)。在z_t~Q(Z_t|h_t^enc)分布下，Decoder网需要调整参数来产生最像x的图片x^hat given z_t(9)；Encoder网也得调整参数来使它所提取的Z_t的后验Q更接近真实分布P (10)。DRAW的关注区由12x12的阵列高斯滤波器来实现，5个核心参数 [中心位置g_X、g_Y，步长delta，精度sigma，强度系数gamma] 均由h^dec_t经W线性变换(21)给出。最终DRAW能像人一样逐步写出数字、画出图片。

Science/DeepMind: 2018-07-28

Neural scene representation and rendering

GQN-场景表达与渲染

GQN(Generative Query Network)是deepmind近年来多项成果的一个综合展示。GQN.agent用自己的眼睛(camera)对环境做几次观察，过观图像经repr网络可以构建出对整体场景的表达矢量r，Gen网络再根据r和query矢量v^q来渲染并产生对应的观察。GQN的预测图像与真实观察几乎没有区别，而且该网络还能自动智能地产生遮挡、透视、阴影等渲染效果。不同于VAE直接对每次观察提取抽象特征，GQN对场景的表达有viewpoint不变性，即尽管不同角度下Agent的观察不同，但它知道这是同一间屋子。GQN的场景表达中有obj的空间位置、大小、颜色，地板纹理、光线方向等信息，这些信息的表达矢量还满足’场景代数’，举例来说r_红色三角—r_蓝色三角+r_蓝色圆球=r_红色圆球。GQN的场景表达矢量r会随着观察中关键信息的捕获而陡然降低对外界的Bayes Suprise，这些场景表达信息构成了Agent对环境的理解。这种带有viewpoint 不变性的场景理解还可以供给机器手做policy学习，效果远好于直接从图片像素学习。

GQN是一个Variational Auto Encoder（VAE）架构，实现上用到convLSTM组件。训练的目标是对各层隐变量z_l的先验pi分布(Gen网络提供)与后验q分布(repr网络提供)近视相等（即KL divergence/ELBO 低）。训练的feedforward过程中按照架构有向连接图，逐层更新隐变量z采样，计算ELBO；backpropogation时，根据ELBO对phi(repr网参数)、对theta(gen网参数)的梯度来调整网络参数提高性能。应用时，Gen网络接收到conv网络提供诸多观察的场景表达矢量r以及query角度v^q矢量，而后根据自身所习得的先验分布逐层迭代产生所query的隐变量z_l，直到LSTM最高层输出u_L矢量。该矢量经yeta.g变换出输出图片像素各点的高斯分布均值(方差由退火法给出)，最终按此分布GQN采样出对应query viewpoint的imagination图像。

GQN是deepmind通向人工智慧宏伟蓝图的一个环节，看此文前你最好按顺序先看一遍DLGM-DARN-DRAW-convDRAW这一系列成果，这些都是静态场景处理。GQN之后deepmind将开始处理动态场景。K.Gregor新文章temporal differernce VAE已经展示对远程未来的一步推理能力，不久的将来要争取率先配合上奖惩、语言、情绪、文化等高级认知因素，使得AI真正的活起来。

DeepMind: 2018-07-21

Deep AutoRegressive Networks

DARN深度自回归网络

DeepMind的DaanWierstra是个牛人，以前读的一些经典AI文章都是他写的。他做的东西很重要、很有趣、很有深度，索性花点时间系统性地介绍一下他近年来的研究。

DARN（Deep auto regressive network）也是Variational AutoEncoder（VAE）架构，有Encoder、Decoder两部分。从Encoder visible层输入二进制图片x，乘权重W加偏置b后做sigmoid变换，得出第一隐藏层各神经元放电概率p(h¹|x)^，然后01采样h¹~p(h¹|x)得具体神经元activation矢量h^1。第二隐藏层有AR（自回归）属性，j号神经元放电概率p(h_j²|h²_1:j-1,h¹)不但依赖前层h¹，还依赖于同层前端neurons’ activation h²_1:j-1, 然后01采样h_j²~p(h_j²|h²_1:j-1,h¹)，如此计算各神经元条件概率、据此采样01放电，直到最高抽象层的最后神经元。Encoder最高处activation h^L作为图片x的抽象特征/压缩编码，被发送给Decoder网络来重建图片。Decoder网自顶向下重建，处理原理同Encoder，逐层逐神经元反复计算各条件概率、据此采样01放电直到Decoder visible层（有AR属性）。前馈处理使我们得到图片预测，提升网络性能需要反馈调参数。这里用到Hinton的bits-back coding原理。用编码的description length作为DARN网路的cost函数，其期望值对网络各参数的梯度由无偏estimator的MonteCarlo approximation来计算。最终，由大数据Training的Encoder能识别图片中object background等的重要特征并表达为h；Decoder网络则习得大量知识于参数当中，或者说Decoder网有p(X|H)的能力，你他condition到feature矢量h^L=‘白色肥猫’上，他就能画出白肥猫的图片，你令h^L=‘红烧肉’他又能产生好吃的红烧肉图片。这就是DARN网络的原理与用途。

DeepMind: 2018-07-14

Stochastic Backpropagation and Approximate Inference in Deep Generative Models

DLGM 深度隐变量高斯模型

变分AutoEncoder是AI领域很火的一个话题，本文就是该领域早期的一篇基石性的文章。传统stochastic AutoEncoder 利用深度Encoder（recogonition网络）来提取抽图像象特征，Decoder（generative 网络）来重建图像。网络训练结束，参数确定下来，path任何处的信息流都是由输入图片唯一确定的，因此叫deterministic。但该网络有个与生俱来的缺点，他会机械地对输入端图片的瑕疵也进行Encoding、Decoding，以致于输出图像Variance大训练难于收敛。本文让Recog.网提取图片特征的均值方差，再按该统计分布采样出feature矢量给Gen网，来重建出图像估计。由于阅图无数的DLGM网络已经习得对外部大千世界的prior，因此对小概率的图片瑕疵（如涂抹、破损、残缺）就能在feature采样阶段本能地做处理掉，从而提高训练的稳定性和速度。但该架构难点在如何backpropogate error过feature采样模块回recog网来更新网络参数。Deterministic模型可以直接求各个模块的梯度；stochastic模型有特征采样模块，得求cost期望值对latent feature均值方差的梯度。latent feature矢量是recog网与gen网交互的核心、是图片压缩的结晶。他可能有图片object大小方位颜色纹理等信息，他也可能有一些人类不能理解的更有效的神奇特征。对大量不能理解特征很难期望，但聪明的先贤提出了oracle神谕分布q(.)的概念。无论神奇feature是什么样如何分布，我这个very flexible的q(.)总能照猫画虎地与你长相差不多。而且睿智先贤还告诉我们用free energy原理可以优化求解出这样的q(.)。因为这个q(.)是一个多变形态’函数’的函数，所以关于q(.)的free energy就是一个泛函，而他的求解就是一个泛函变分的问题、本文这样的架构就是Variational AutoEncoder（VAE）。深度神经网络可以提供这样形式的神谕分布q(.)，Free Energy可以作为我们的cost function，本文又提出统计gauss backpropogation (GBP) 来解决跨采样模块参数优化问题（将不能求的期望的梯度，变为能求的梯度的期望），这样就有了我们今天看到的DLGM网络。

本文数学公式让你目眩神迷，但如果你知道物理多自旋相互作用的平均场近似，那这些公式将变得那么自然和谐、行云流水。看AI架构有时让你茫然若失，但当你理解了人脑神经对外在世界的处理机制，这些架构又何尝不是顺理成章、命也使然呢。

DeepMind: 2018-07-07

Continuous control with deep reinforcement learning

DDPG 深度确定性策略网络

DeepMind真是Reinforcement learning的圣堂。他们的DQN（deep Q network）解决了机器输入端直接raw sensory input的问题，DPG（deterministic policy gradient）解决输出端高维连续控制信号输出的问题，融合上述两网精华则铸就了机器人控制的神器DDPG（deep DPG）。DeepMind的很多文章都是高端之作堪称经典，读起来让人爱不释手。

DDPG基于Critic-Actor架构。Critic网络（Q网）：就当前状态s_t以及所选action a_t，评估长期回报期望值，即q.value。Actor网络（u网）：根据当前状态s_t来选择控制信号a_t以期得到最大q.value。本质来讲DDPG想求解一个与环境/task相关的Q(s,a)函数，但这个终极理想是可欲不可求的。可以用类比来解释一下DDPG的策略：尽管找不到跑得最快的那个人来做参考，但是我可以争取超过前面自己的影子，经无数次努力后，会惊奇地发现你和影子都达到很高水准。Q’、u’就是DDPG的影子网络。网络优化时取Replay Memory的若干transitions（s_t,a_t,r_t,s_t+1）作为输入。前馈时，手头的Q网络用（s_t,a_t）帮你算一个q_t，影子Q’网络算的更准一点y_t=r_t+Q’_t+1因为他用（r_t,s_t+1,a_t+1=u’(s_t+1)）,这样你就看到差距Error=(y_t-q_t)²，然后再backpropogate这个error来更新Q网络的参数。有了这些transitions，你还可以弄到actor的u网络来计算所输出的action控制信号对u网络参数的导数，以及弄到critic的Q网络来计算q.value对action的导数，两者相乘就会告诉你u参数该如何调控才能提高机器人的长期回报q.value。当Q与u网参数都更新后，作者又用soft update来更新影子网络Q’、u’的参数。如此不舍昼夜勤功不辍地更新Q、Q’、u、u’四网参数，直到你一展身手，发现自己竟练就神功、天下无敌，尽管仍不知终极武学是何境界。

本文是一片修炼内功的心法，读该文，通经活络神清气爽！

Nature Human Behaviour: 2018-06-30

Language, mind and brain

语言、思维与大脑

语言是人区别于动物最显著特征。更确切地说由于人类拥有独特脑Broca pars opercularis（BA44区）以及通过白质束Arcuate Fascicles（AF）相连接的 pSTG（posterior Superior Temporal Gyrus）的相互作用，使得我们拥有独特的等级结构化语法处理能力，进而拥有复杂的思维与深邃的智慧。AI尚不能’活’起来也许就是因为还没有人类这套思考的工具。

本期我们就讲讲声音语言如何由耳蜗听毛细胞按频率采集，经耳蜗核、上橄榄核、下丘核、中膝体而上传达初级听皮层A1。而后这些声信号如何在STC（superior temporal cortex）被切分为音素整合为音节、在ATL（anterior temporal lobe）中找到词义、在FOP（frontal operculum）中拼合为词组、在BA44形成复杂句意认知。脑视觉听觉系统分为dorsal流与ventral流，分别处理Where和what信息。作者认为语言处理系统、腹背各有两流。Ventral.1：pSTG-iFOF(inferior fontal-occipital fascicles)-BA45主要负责解密声音转为词义。Ventral.2：ATL-UF(uncinate fascicles)-FOP负责多词义拼合。Dorsal.1：BA44-AF-pSTG负责复杂语法处理形成句意。Dorsal.2：pSTG-SLF(superior longitudinal fascicles)-PreMotorCortex负责声音/语义到motor/决策的信息传递。ATL是multimodality hub，ventral part处理视觉流高端特征，superior part处语言流抽象特征，此处多模式融合可提供字典属性，通过抽象语义可以检索对应到图像、味道等，反之亦然。个体发育中，孩子十岁前Dorsal.1通路尚未myelination完全（猴子类似）故而只能理解/表达简单语法。十岁后BA44发育成熟，出现成人样EEG反应信号特征、脑功能呈现非对称性（左半球BA44负责复杂语法构建，右侧负责韵律相关处理），进而拥有复杂思维能力的基础，即等级结构化语法处理体系。

语言不是说话、更不是伪装欺骗争斗的工具。语言是内在的、最好是真实的，她能帮你理清思维、正确认识自己与世界，助你建构智慧且健康的灵魂。

DeepMind: 2018-06-23

Deep Recurrent Q-Learning for Partially Observable MDPs

DRQN 深度迭代Q网络

DRQN(deep recurrent Q network)是一篇非常不错的AI文章，它用到卷积网络、长短记忆LSTM、和Q学习等重要的AI模块。本文原创之处在于将deepmind提出的DQN（deep Q network）网络的第一全连接层换成带有记忆的LSTM，这样就不需要输入端保存连续4帧图片来提供完整信息以实现MDP（Markov Decision Process）。本文具体讲了DQN做reinforcement learning的原理，比如如何更新Q网参数，如何用replay memory、separate target Q网、RMSProp消除Q网参数更新时产生震荡的问题，如何搭建DRQN架构及训练中用到的bootstrapped sequential/random updates等策略。10帧DQN训练后第一卷积层神经元最强activation特征反映了对Pong球拍的识别，第二卷积层神经元放电特征反应了对球运动的识别，第三卷积层神经元对球与拍相互作用的识别，以及单帧DRQN LSTM层神经元放电反应了对high level球与球拍作用事件的识别，这些结论深刻启发了我如何来理解卷积网络、recurrent网络、Q网的作用以及他们在人视皮层、海马、Frontal Cortex的对应工作原理。

AI: 2018-06-16

Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

看图说话

本文是一篇深度好文，告诉你机器是如何认识这个世界并总结成语言，这本质就是思维和意识存在的形式。人又何尝不就是这样。

整个网络的功能：1.给入图片，2.按Attention指导分析图片，3.逐字输出对图片的总结。如何实现：作者将224x224的图片喂给VGG网络，产生出（14,14,512）的图片特征，这个特征量a(与LSTM之前的输出态h_t-1)通过attention网络产生对不同位点的关注度𝜶_i以及更新综合关注特征量z_t，再与之前输出的单词y_t-1、LSTM输出态h_t-1一同concatenate成[Ey_t-1,z_t,h_t-1]矢量喂给LSTM来更新出本时刻输出态h_t，翻译的Multiperceptron网络再根据[Ey_t-1,z_t,h_t,a]来做出m维度单词意义embeding矢量，经由L₀转为预测本时刻t输出单词概率y_t矢量，从字典中挑出输出句子的第t^th个单词，如此循环C次，顺序产生C个单词构成的句子来描述她对图片的理解。文章对attention的处理分为两种方法：1.stochastic hard attention：利用Attention网络给出14x14个关注位点关注度，再以此为参数来形成关注点multinoulli分布，再多次MC采样来做统计前馈计算z_t,以及反馈更新网络参数矩阵。因其为MC采样Attention，故关注位点可视化为高斯小白球形式。2. deterministic soft attention：利用Attention网络给出的关注度加权求和出context vector z_t的期望值，翻译网络的单词概率输出在softmax一阶泰勒近似下的logit值可由[Ey_t-1,z_t,h_t]的期望值做线性表出，这种光滑可微的函数形式连接可以直接用back propogate的方式让网络学习优化参数。因其attention为众关注位点加权求和，故attention可视化为片状区域，更接近人的直观。

本文虽不是Nature Science文章，但就其理论水平、结论震撼程度、以及在机器认知上的启示都是无与伦比的。深度好文不可不细读！

Nat.Rev.Neurosci.: 2018-06-09

Control of synaptic plasticity in deep cortical net

脑皮层突触可塑性

有些文章读起来让人感觉如饮甘泉、如获至宝，本文就是这么一篇文章。比大部分Nature主刊营养价值高，适合以后反复重听该视频。

作者将脑皮层synapse plasticity过程分为两个部分：1. 由高级皮层所反馈(fb)回的信号作为该突触是否将做plsticity的tag。如V1将视觉信号前馈(ff)式传到高级皮层PFC，PFC在众多候选方案中选出action来执行，同时通过fb信号标记该路径上的突触，以便未来同样条件下能选出或拒绝同样方案。fb信号经由High Order Thalamus核投射回V1的L1层，其兴奋性神经递质Glu能打开NMDA.R受体，Ca²⁺可从受体孔道流入树突，激活CAMKII，准备突触plasticity相关蛋白。2. neural modulators释放所携带RPE (Reward prediction error)信息来决定被Tagged的突触将做potentiation (有利于以同样action获取奖励) 或depression (拒绝此action以避免惩罚)。这个过程正是AI policy gradient 的核心机制。本文又具体讲述Dopa、Ach、5-HT、NA四种分子在奖励、attention、food/reproduction、arousal相关的作用。讲述了猴子Grating训练V1神经元如何调整tuning曲线来提高旋转识别能力，如何利用LIP神经元来区分运动方向，FEF如何fb引导V1做目标曲线tracing，揪老鼠胡子实验中fb信号如何影响其S1突触产生LTP，奖励conditioning实验中fb Ca²⁺如何携带奖励信息等。讲述了皮层内部、皮层间、皮层丘脑神经元间连接结构特点。讲述了synapse plasticity的gating、steering过程，以及相应的分子相互作用通路。

所谓’朝闻道夕死可矣’，我想说的正是这篇文章

Nat.Rev.Neurosci.: 2018-06-02

The basal ganglia and the cerebellum: nodes in an integrated network

小脑BasalGanglia交互，及其在脑网络中作用

Boston最近在Nature Review Neuroscience上发表了一篇文章，讲Basal Ganglia (BG)、小脑之间的连接关系以及在整体脑网络中的作用。他们的研究结论对神经科学以及人工智能的发展都很有启发作用。

人类因为进化出复杂的大脑皮层而会使用工具、掌握语言、拥有智慧。大脑利用Hebbian Associative Learning (cells that fire together, wire together) 建立神经元间联系，助下游网络抽象feature提取，语法语义整合，情感逻辑计算等。他的特点是用得多长得大，长得大能力强。如出租车司机的负责地点记忆的海马灰质会随着驾龄而增厚；爱因斯坦大脑的处理数学计算空间思考的Angular Area显著大且复杂于常人，这也导致周边处理语言的区域生长空间狭小而致不善于交流。所以不善言辞也未必是坏事。BG是基于奖励的reinforcement学习中心，中脑VTA与SNc通过多巴胺信号指导BG做action选择，比如见到美女就走不动道儿；遇到美食就不再想保持身材，因为繁殖和食物始终是动物最难以抗拒的奖励。小脑基于error (sensory信号与小脑网络预测的差) 做监督学习，协调人的精细运动。酒喝多了，小脑生理异常，你就很难控制腿部肌肉站稳、控制臂手肌肉去抓取东西。

大脑与BG、大脑与小脑之间的联系已经有很多研究成果，本文通过Rabies Virus反向传输特性发现1）BG的STN核经由Pons核将奖励相关信息发给小脑皮层；2）小脑Dentate核经由丘脑CL核将action detail信息传给BG的Striatum而后影响GPe的间接通路。这就是为什么帕金森病人尽管难于启动运动甚至启动情感(多巴元degeneration，BG奖励相关功能失常)，但却一直表现出小脑相关的手部震颤特征。

Nature Review Neuroscience是我最喜欢的journal，很多文章读后让人高潮迭起欲罢不能。本文就是这么一篇非常经典的Nature.R.NS

Nature Nanotechnology: 2018-05-25

Calcium-dependent molecular fMRI using a magnetic nanosensor

钙离子功能磁共振成像with MaCaReNa

钙离子在神经生物学中是最重要的信使信号，它传递控制肌肉收缩、细胞分裂、神经突触改变等。对于神经元来说，钙离子就像是辣椒白菜至于韩国人是不可或缺的。利用荧光蛋白，人们可以通过光学显微镜观察到钙离子动态在动物生理行为功能上的作用。但这也仅限于就透明的斑马鱼或者培养皿中神经元做观察研究。本文作者将纳米材料技术与细胞生物技术结合，首次实现对钙离子动态做3D功能性磁共振成像。

文章具体讲了如何从大肠杆菌中培养并提纯钙离子敏感的synptotagmin蛋白的C2AB片段，如何将铁氧纳米颗粒包裹上脂膜、插入phosphatidylserine(PS) 、以及最终制备出MaCaReNa (Magnetic Ca²⁺-responsive Nanoparticles)溶液的每个细节。MaCaReNa在钙离子环境中能聚集其磁性纳米颗粒而改变tissue的横向磁化率，进而钙离子浓度可以反应于磁共振T2w信号强度上。其逻辑是，上游神经元所产生的动作电位释放轴突神经递质Glutamate，下游神经元树突NMDA受体打开钙离子通道，细胞外钙离子内流到树突内，导致细胞外空间钙离子浓度下降，处于胞外的MaCaReNa因而解聚，横向弛豫率下降，MRI所测T2w信号变亮。也就是测量到T2w信号变化，反映神经层面钙离子动态，以及其驱动该动态的神经放电活动。

脑结构功能测量指向更高的时间空间解析度以及更多样信息，科学家在经典方法折腾数十载已近穷途末路。借鉴前沿纳米技术，无疑能给幽暗的医疗影像领域打开一扇窗。

Nature/DeepMind: 2018-05-19

Vector-based navigation using grid-like representations in artificial agents

AI网格型矢量导航

Google DeepMind 组本期在Nature发表了一篇文章’Vector-based navigation using grid-like representations in artificial agents ’。作者在训练LSTM recurrent网络来做路径积分时，其线性层units出现类人脑EntorhinalCortex(EC)区GridCell、HeadDirectionCell、BoderCell的空间放电特征。在动物中，GridCell以六边网格放电的方式供空间信息编码给海马区PlaceCell，以定位自己在空间所处的位置。本文Grid网络线性层units activation(或称grid code，g矢量)提供同样的空间位置编码信息给下游policy网络做矢量导航。Policy网络在奖励机制驱动下做ReinforcementLearning，再配以grid code所蕴含的to goal欧几里德距离和allocentric方向, 能计算出非常准确有效实时的ActionCommand来指导Agent直接抵达goal position。在SunburstMaze实验中，该GridCell.Agent展示了动物特有的’走捷径’能力和’tranverse unvisited path’能力；而在goal-driven和goal-door的觅食竞赛中，该AI老鼠则轻松战胜其他AI.Agents甚至人类专家。

本文内容非常精彩，很多方法结论引人深思。机器在supervisedLearning下能自然产生动物导航相关神经元放电特征，这对神经科学研究理解GridCell，BorderCell等机制与作用有着重要的启示。文章对Recurrent LSTM网络、视模块卷积网络、决策处理的policy网络的implementation、训练以及相互配合使用也足以打动大多AI科学家。本文还具体讲了如何计算gridness、gridscale、resultant vector length、border score以及如何用这些指标来识别神经元类型；如何做firing-rate map及其自相关谱；如何计算reliability、decode accuracy；如何通过reshffule filed、bootstrap、effectsize来做显著性计算等。这些对于神经科学、数学、AI科学家深入理解导航相关诸多理论都是大有裨益的。

Science/FMRIB: 2018-05-12

Organizing conceptual knowledge in humans with a gridlike code

概念知识的六边网格组织

GridCell与PlaceCell最近异常火爆，其发现者Moser夫妇和O’Keefe因此荣获2014年度诺贝尔医学生理学奖。其热度又蔓延到人工智能领域, DeepMind在用recurrent网络做路径积分时观察到Entorhinal Cortex(EC)中GridCell、HeadDirectionCell等类型的放电特征。再用这种Grid网络及vision模块计算结果来支持agent做reinforcement learning，其导航能力超过人类专家水平(下期讲)。今天要讲的这篇文章也与GridCell相关，是我们中心Timothy Behrens组在Science上发表的。

每天放学后你骑上自行车，脑中EC区的GridCells便以六边对称网格放电的形式指导你穿越一个个地标建筑最后回到家中。GridCell被认定是生物内在导航的基础，但科学家最近发现人脑medial frontal，medial parietal, lateral temporal corties也有类似于GridCell放电类型的神经元存在。因为这些区域都相关于概念知识的操作，如记忆、想象、场景重建、价值评估等，所以人们自然会猜测在这些nonspatial区域GridCell可能以它的方式（六边对称网格）处理概念知识相关问题。为了证明该猜想，Tim组巧妙地设计了stimulus(鸟形态)-outcome(圣诞礼物) (S-O)association实验。本文详细讲述了实验设计安排，脑MRI数据采集，前期处理，统计分析，结果解释的每个细节，囊括了专业脑功能分析的方方面面。该实验利用的是相对coarse(对比神经元放电信号)的fMRI数据，但却能精确定位到GridLike出现的每个脑区，也测得了每个实验者的内在网格角度。在此基础上发现，当每个trial的鸟形态变化角与网格角六边对称aligned好时，实验者的S-O association表现显著好于misaligned的情况。作者还发现在vmPFC和EC区只有六边对称的regressor能从BOLD时序中提取出显著信号，而四、五、七、八边对称都不可以。而且六边网格的角度还存在跨实验sessions不变的特性(如测试间隔大于一周，或者跨脑区网格角不变)等。下面是綦峰对本文的具体讲解。

Hinton: 2018-05-05

Distilling the knowledge in a neural network

蒸馏学习

若今世还有人值得崇拜，那一定是Jeoffery Hinton。Hinton开启了人工智能（神经网络）的时代，对他的工作我只能说’高山仰止心向往之’。现虽不能至，仍不妨通过他的作品来感受巨人智慧之光的照耀。

今天我们讲一篇Hinton的文章，’Distillating the Knowledge in a Neural Network’. 本文充分体现了Hinton对神经网络运转机制的深刻理解与敏锐的洞察力。目前神经网络的应用基本只局限于实验室和大公司。比如尽管我们对DeepMind的alphaGo倾爱有佳，但由于网络结构复杂计算量巨大，还很难把它搬到你我手机电脑上来娱乐大众。本文distillation学习就着力解决如何将cumbersome model耗巨量资源所学的知识有效转移到小的distilled models，并最终部署到手机等小型用户终端。在研究中Hinton敏锐洞察到模型所学知识的存在形式，他先让distilled model在正常温度下(softmax中T=1)学cumbersome model的常规主流知识，再让distilled model调高温度进而快速学习cumbersome model低概率错误预测所蕴含的宝贵经验。作者将该方法验证于常规MNIST project，Google Android voice search project，和经6个月多核并行训练的JFT图片识别project，均得到非常理想的效果。文中，Hinton通过幼虫成虫的类比告诉我们自然生物的Train和Test phase有着不同的架构和目标函数；他用BMW的错误识别为垃圾车或胡萝卜的例子告诉我们网络知识存在哪里、如何提取；他所提出的specialist model又效法了人脑Fusiform专业处理人脸识别的机制。林林总总给你无限智慧的启迪。读大师的作品如沐春风，期待您能听綦峰讲解，更期待有心的您能亲自拜读大师的每一个文字。

MIT: 2018-04-28

MIT Autonomous Vehicle Technology Study

麻省理工学院自动驾驶技术研究

自动驾驶汽车技术(AVT)是未来科技产业重点之一，它构建于人工智能、高速通信等高科技成果基础之上，将塑造未来科技与生活。本期将介绍麻省理工自动驾驶技术组在该领域是如何展开工作的。

硬件上，MIT-AVT 用车载CANbus消息唤醒CANelot的328p microcontroller来自动开启或关停自动驾驶数据采集系统。Banana Pi是该系统的大脑，通过GPIO可以收发HVD230.CAN的行驶车况等信息、STMicro的IMU惯性系统信息、MTK3339的GPS方位车角度信息等，还可以通过USB接入四个Logitech C920的视频音频数据，并将所有数据引入外接硬盘予以保存。

软件上，MIT-AVT通过低端软件来做硬件控制和数据采集。CANelot的C程序控制对Banana board的供电。RIDER(RT Intelligent Environment Recording)系统工作于tweaked Linux上，可以配置自动驾驶系统的方方面面。RIDER先startup各子模块，将连接好的Camera、IMU、GPS、CAN数据按指定格式存于硬盘，也可通过GSM将系统状态信息传给远端的工程师进行诊断，它还负责数据同步、知识提取、可视化数据等相关工作处理。

算法上，MIT-AVT利神经网络做以下功能：1. 人脸识别，分析驾驶员双目gaze、长时间glance状况和面部情绪等；2. 躯体skeleton分析，这有助于AI学习驾驶员是如何在不同状况下处理驾驶操作；3.车前视野感知，通过camera图片判断前方哪里有人、交通灯、建筑物等。

更多内容请看綦峰就’MIT Autonomous Vehicle Technology Study: Large-Scale Deep Learning Based Analysis of Driver Behavior and Interaction with Automation’ 的讲解

Nature Electronics: 2018-04-25

Gigahertz integrated circuits based on carbon nanotube films

碳纳米管薄膜GHz集成电路

最近中兴被美禁购芯片，引发国内一片哗然。众砖家纷纷表示此乃中美5G(第五代无线通信)较力的结果。为了主导5G，中美欧韩等国都玩了命的折腾。那什么是5G，为什么芯片禁购可以直接休克中兴这家企业呢？

1G的时候，手持大哥大的你就可以横行街头，那时2.4Kbps就可以笑傲江湖。3G的时候，买个CDMA手机的你可以略带鄙夷地对宿舍哥们说’老子这个可以宽带上网’，其实速度也就2Mbps。未来5年将进入5G时代，那时的你也许聊天都得用3D VR/全息眼镜，往来都得乘坐自动驾驶汽车。介时通讯速度将达到GHz，她是如此之快，以致于你不需再背个电脑更不知什么叫硬盘，只需一只手机和身边那朵’神奇的云’，就可以存取处理任何信息。

5G最大特点是’更快’，这快的基础就构建于有着同样快速的’芯’。本期就讲一篇我们北京大学电子学系彭练矛院士在GHz芯片领域的突破性工作。该工作发表为2018年Nature Electronics创刊第一期第一篇的Research文章。该文深入地讲述了彭老师组如何巧妙地设计微纳米半导体结构，将碳纳米管薄膜FET 5-stage RingOscillator由282MHz提升到5.54GHz的工作频率。该文也细致地介绍了Top Gate CNT 集成电路制作工艺的每个环节和未来发展的方向。通过学习我们将清楚地认识到芯片产业对于’高端’产业链各环节的依赖；从化学试剂配方，到纳米电路设计，加工工艺升级，以及配套精密检测的仪器研发等，无一不需要高端人才的聪明才智与国家企业的大力支持。更多精彩内容请您关注綦峰就’碳纳米管薄膜GHz集成电路’的讲解。

Nat.Rev.Neurosci.: 2018-04-20

communication dynamics in complex brain networks

复杂脑网络动态交互

今天讲网络，一个科学技术工作者耳熟能详的话题。从微信社交网络，5G无线互联网络，道路交通网络，脑神经网络，到生物分子相互作用网络，无时无处不充斥着网络科学的身影。各种交互网络内部往往非常复杂，但都普遍归于用图论相关的数学模型来抽象研究。我们用节点表达网络元素(如某个人，手机，地点，神经元，蛋白分子等)，用边表达元素间相互作用(如朋友关系，通讯联系，投递商品，电化学信号传导，分子间相互作用等)。每个节点有自己的权益诉求(如趋利避害，节省时间，创造效用，最大化生命长度等)，也具备各自的能力特点（如发布消息，打电话，选择飞机而非货车的快递方式，发送兴奋/抑制动作电位，变构来影响下游蛋白活性等）。节点与周边邻居相互交流构成社区/子网/模块，模块在通过合作竞争形成更大的网络（如你和你周边同学构成了北京大学，北大再与其他高校乃至中小学构成国家教育体系，教育再与金融、体育、军队等一同构成国家，中国在与其他国家一同生活与这个地球。脑神经元也是如此，某pryamidal neuron 与周边各类神经元构成对手部肌肉的控制区，该区再与控制脚腿舌脸等神经元一同构成motor区，motor区再与认知、决策、情绪、社交等区域一同构成脑前叶，前叶再与枕、顶、颞叶构成脑皮层，脑皮层在与小脑、脑干、subcortical灰质，白质，构成大脑，而后再与脊髓周边神经一同构神经系统）。自然界就是这样，常常不由自主地用hierarchical modular结构来搭建网络。在不断优胜劣汰的进化演化中，产生了我们现在的社会、大脑等复杂网络体系。有了这些睿智灵活的网络，人们将活得更加开心长久。想知道人脑网络是怎样工作和被研究的吗，请听綦峰就’复杂脑网络交互动态’的精彩讲解。

Science：2018-04-16

Demonstration of Entanglement of Electrostatically Coupled Singlet-Triplet Qubits

静电耦合单三态纠缠qbuit

之前我们讲了物理学家如何在Si上做单电子自旋qubit的ESR操作，今天我们介绍Harvard大学Yacoby组在Science上发表的一篇文章-’静电耦合单三态qubit纠缠’。双电子自旋量子点系统构建在GaAs半导体基底，通过外加磁场营造S/T0双能级体系，脉冲静电场可开关两qubit间耦合，磁场梯度控制量子态绕x轴进动，Hanh序列降低散相影响提升相干时间。最终实现了双qubit的CPHASE操控（受控相位门）并制备了可观测的双电子自旋BellState。有了这些基础工作，理论上讲人们就有了所有量子计算机所需的乐高积木。加之该体系与传统半导体加工工艺的兼容性，可以期许未来数年量子计算机将进入寻常百姓家，做那些经典计算机不可能完成的计算任务。

准备这个视频时，会不禁想起自学半导体物理和微光机电系统的情景。那时还是个斯伦贝谢的程序员，也不知道学这些东西有什么用，但还是每天想尽办法挤出时间迫不及待兴奋不已地去看很多诸如此类的视频。年少时对科学纯真的追求，现在由衷致以敬意。如果没有当时那点莫名其妙，今天哪会有缘享受科学世界这份美轮美奂。接下来綦峰将与你一同赏析美丽科学的一个侧面，量子纠缠。

Nature: 2018-04-08

A single-atom electron spin qubit in silicon

硅基单原子电子自旋qubit

当今世界上什么科学技术领域会引领时代发展？数学计算机科学家会说是神经网络，深度学习相关的人工智能；医学家和生物学家会说是和基因蛋白相关的分子生物技术；化学家会说是微光机电相关的纳米材料技术；物理学家则会说是量子通信计算相关的量子信息学。本期Nature发表了一篇名为’可编程双qubit量子处理器’的文章。就此，我想系统性介绍一下量子计算机领域的前沿进展。

说量子计算为科学前沿一点不为过。当今科学界面临的一个大难题就是摩尔定律渐趋失效。以往每18个月提升一倍的电脑计算能力将不再发生。现在的处理器加工工艺已经将每层半导体做到20个原子，当我们再想通过有效利用原子做计算时，所能进展的空间已经所剩无几。而且几年后当我们把半导体层做到几个原子时，你可知芯片已经进入了量子世界。今天我们已经处在后半导体时代，对于未来，专家一致看好‘量子计算机将成为新时代的主角’。也正是这个原因，各大科技巨头，无论是否有硬件功底，争相投资于量子计算机的研究。目前，Google和IBM专注于superconducting qubit技术研发；Microsoft致力于搞topological qubit，而硬件巨头Intel则基于传统半导体工艺，主推量子点qubit技术。

接下来我们将做三个视频分别讲解单原子qubit，双qubit逻辑门，以及可编程双qubit处理器的工作原理，计算原理以及Si基底量子点电路的加工工艺。传统数字电路告诉我们，当你可以实现AND和NOT两个操作时，那么任意复杂运算(从加减乘除，到傅里叶变换，到AI程序)将都可以在此基础上实现。量子计算理论也告诉我们，当one qubit gate 和 two qubit CNOT(controlled NOT) 实现后，量子计算将会畅行无阻。未来的计算机是个什么样子，你难道不想知道吗？不妨看看接下来有关量子计算机的视频。

Nature：2018-04-05

Image reconstruction by domain-transform manifold learning

深度学习自动医疗影像重建

去年Nature以封面文章的形式刊载了斯坦福大学Esteva以Transfer Learning来训练深度卷积网络，并通过观察图片来诊断皮肤病，其诊断准确率已经超过皮肤科医生水平。本期Nature又讲述了如何训练一个简单通用的神经网络来轻松完成诸多医疗影像领域只有专家才能完成的图像重建工作。

在医疗影像邻域，无论是X-ray，PET-CT，多模态MRI等，都需要专家团队来负责从数据采集，图像重建，到病理解释的一连串烧脑工作。但无论哪种医疗影像模式，甚至雷达探测，GR引力波分析，地震测井，他们本质都是反问题的处理，即通过信号测量反推出产生该信号的物质的结构。传统上我们需要精心设计扫描实验，掌握数据产生采集原理，才能做重建工作。在大数据风行的今天，只要你有充足图片喂给神经网络来学习(甚至本文sensor data可以自己制造)，它就会像人脑一样通过改变突触权重来自动建立sensor与影像间联系。同样架构与同样超参数可以适应五花八门的反问题求解，这点像极了人脑。人脑通过基本相同的皮质结构，来灵活处理视觉，听觉，运动，语言，计算，决策，识别，记忆等方方面面‘科学上的’难题。就好像我们即便不懂得多普勒原理，也能通过声音判断汽车朝我们开来；即便不懂得气象学建模计算，也能够通过乌云判断马上要下雨。

未来，也许不再需要医生，棋师，影像专家的存在。未来，当快速高效智能的神经网络碰上浩如烟海的网络大数据，会发生什么，也许只在乎于你的想象力。

2017 Nobel Chemistry Prize: 2018-04-04

Cryo-EM Microscopy

冰冻电子显微镜

2017年诺贝尔化学奖授予三位冷冻电镜领域的学者，奖励他们对冷冻电镜技术的发展做出突出贡献。下面视频就冰冻电子显微镜原理，单分子蛋白3D重建算法，以及生物化学应用等诸多方面进行了深入的讲解。

Jacques Dubochet提出用Plunge & Freeze 的方法来冰冻处理样品，开启cryoEM的广泛研究。Joachim Frank的工作重点在‘2D投影重建3D分子结构算法’。Richard Henderson早期工作在电子晶相学上，近期在单粒子原子解析度成像上做出卓越贡献。

研究蛋白3D结构是当今科学最热门的领域。中国科学家施一公，颜宁都是这个领域顶尖的科学家。生命体都是生物大分子搭建起来的’乐高积木‘，因此研究人的生老病死关键在要弄清楚这些‘乐高积木’块儿的结构与功能。以往分子功能结构的研究手段主要是X-ray晶体衍射和NMR谱分析。近年来随着各种电子器件飞速发展，cryoEM已经突破解析度局限，实现原子级别成像。在不远的将来CryoEM将取代X-ray在蛋白结构解析上的地位。不用极端困难地纯化结晶生物分子，利用cryoEM，人们将进行大通量的各种生物分子及其不同构象功能的研究。

2017 Nobel Physics Prize: 2018-04-03

Observation of Gravitational Wave

观测引力波

2017年诺贝尔物理奖颁发给MIT和Caltech的物理学家Rainer Weiss，Barry Barish和Kip Throne。以表彰他们在LIGO(激光干涉引力波观测站)建设以及引力波事件观测中做出的卓越贡献。

2015年9月14日 09:50:45 UTC,位于美国西北部Hanford和南部Lovingston的两个LIGO探测器同时观测到人类第一个引力波事件GW150914. 该引力波信号持续0.2秒钟，频率由35Hz扫到250Hz，最大引力波应变幅度仅有1.0*10^-21. 经广义相对论计算，该引力波是由双黑洞互绕后合并过程产生的。信号可靠度达5.1西格玛，即假事件观测概率为20万年才会发生一次。该事件发生在距离我们13亿光年以外(或者说发生在13亿年以前)。起初有两个黑洞分别是36和29倍太阳质量，最终合并为一个62倍太阳质量的大黑洞，在此过程中有3个太阳质量的物质被转为能量，并以引力波的形式辐射向宇宙各个角落。在2015.09.24，聪明的人类幸运地观测到了他的发生，并根据所得信号还原出该黑洞合并事件的每个细节。

引力波的观测本身是件不可能完成的任务，三位科学家通过超人的才智和坚毅的品质完成了人类的这一创举。如果说冷冻电子显微镜为人类打开了一双观看微观世界的眼睛，那么LIGO则为人类装上了一双聆听宇宙的耳朵。科学世界无限精彩，学习这些科学壮举令人感动不已，那么请随綦峰一同走入引力波的世界吧。

2017 Nobel Medicine Prize:2018-04-02

Molecular Mechanism for circadian rhythm

昼夜节律分子机制

2017年诺贝尔医学生理学奖颁发给三名美国科学家Jeffry Hall, Michael Rosbash, 和Michael Young，以表彰他们在circadian rhythm关键分子的发现，以及反馈控制机制阐明上的突出贡献。科学家的工作揭示了生命体是如何利用转录转译分子相互作用网络来形成内源性生物钟，并在此基础上节律性调控诸如睡眠，荷尔蒙分泌，血压体温，新陈代谢等生理与行为模式。近年来分子生物技术飞速发展，诺奖工作尽管光辉闪耀，但已不能反映该领域蓬勃发展的当今现状。綦峰将就Takahashi 于2017年发表在NatureReviewGenetics上的一篇综述文章，以老鼠为模型来具体讲解：1）Circadian 网络的核心组件， 2）外部环境如何影响分子生物钟系统，3）生物钟系统如何输出影响老鼠生理与行为。该领域的成果对未来研究肿瘤抑制，代谢失调，失眠机理，以及开发相应靶向药物都是至关重要的。人们日出而作日落而息，与自然相得益彰。而有些人却常为失眠所困扰。你想了解这背后的科学道理吗？不妨听听綦峰是怎么说的吧！

2017 Nobel Economics Prize:2018-04-01

Behaviour Economics

行为经济学

2017年诺贝尔经济学奖颁发给芝加哥大学教授，经济学家Richard H. Thaler, 以表彰他在行为经济学上做出的卓越贡献。Thaler将心理学成果引入到经济学与市场分析之中，成功解释了现实中人与公司的有限理性行为。Thaler在经济理论上卓有建树，提出了禀赋效应，头脑账户理论，享乐修改，Planar-Doer model 等著名经济学理论，也设计出TokenVsMug以及Dictator I/II实验。Thaler还将这些理论成果应用于社会福利，养老投资等公共政策的制定，改善人类生活。本视频将分五点来展开介绍Thaler的贡献。 1）有限理性原理：传统经济学的基本假设是人与公司的行为决策都是理性的。消费者花钱来使自己各方面需求得到最大满足，公司会主动生产消费者最喜欢的产品来最大化收益。但现实告诉我们，真实的市场行为时常是非理性的，会系统性偏离传统经济学的预测。1944年，冯纽曼提出Expected Utility Theory，认为人的决策是基于生命总体效用最大化的原则。该理论在经济学，神经科学，以及人工智能领域都是milestone级别的指导性原则。DeepMind 开发的alphaGo就是基于此原则来优化自己走棋的策略,即所谓的增强学习。但是个体行为却常常不遵循这一理论，比如尽管人们知道吸烟有害健康，还是会选择吸烟..., 更多精彩内容敬请关注綦峰的深入讲解！

2016 Nobel Medicine Prize:

Cellular Autophagy

细胞自噬

2016年诺贝尔生理医学奖颁发给Yoshinori Ohsumi以表彰其在细胞自噬机制研究上做出的贡献。Ohsumi以酵母为模型，发现了细胞自噬过程的关键分子，揭示了整个自噬过程的分子通路，为人类理解研究对抗癌症等疾病的分子生物机制提供了深刻的洞见。

2016 Nobel Chemistry Prize:

Molecular Machine

分子机器

首先介绍了2017年诺奖得主JP Sauvage、sir J Fraser、BL Feringa分子机器领域的贡献。而后具体讲解机械键、电化学motion control、Rotaxane、分子肌肉、分子电梯、光控分子马达、Azobenzene分子开关、单向旋转机构、分子火箭、异构化旋转、纳米阀门、分子剪刀、纳米电梯、纳米蛋白合成器、以及纳米小汽车的制作与控制原理。未来也许是个奇幻异彩的纳米世界，你不可以不知道前沿的纳米进展、不可以不学习美妙的纳米技术。

Nature Materials:

Distance-dependent magnetic resonance tuning as a versatile MRI sensing platform for biological targets

多模式磁共振生物分子距离检测

本文利用此纳米颗粒量化可逆检测目标分子在化学反应中的基团距离变化。通过引入顺磁Enhancer和超顺磁Quencher，磁共振T1信号会受到Q-E距离而别调节亮暗。实验显示该分子距离尺能成功测量活体分子cleavage、binding、folding 和 unfolding等。是未来宏观磁共振研究生物体内在分子变化的绝佳平台

Nature：

Natural speech reveals the semantic maps that tile human cerebral cortex

脑皮层自然语言语义图谱

Jack Gallant组利用简单GLM模型分析fMRI成功描述了人脑语义分析图谱。被试在听数小时故事，期间功能磁共振扫描整个头部得BOLD信号。故事讲述被被分解为语义features的时间函数，再与所测的同步的voxel-wise BOLD信号做线性回归。回归系数矩阵就被赋予不同voxel说处理不同语义的概率统计。再通过所谓的PrAGMATiC模型将voxel-based语义map转化成不同语义片以供研究人员更好理解不同大脑区域所处理的信息类别。

Google Sites

Report abuse