本文來自微信公眾號:nextquestion (ID:gh_2414d982daee),提問:Lixia,編輯:summer、EY,頭圖來自:視覺中國
我們在日常生活中,每時每刻都在做決策。從簡單的晚餐吃什么,到復雜的與他人的互動,都有決策的身影。決策是認知和神經科學領域重要的一個研究方向,為了帶大家深入了解決策及其背后的機制,我們將以決策研究領域的問題進行追問,以多人聯動的方式,帶領大家了解決策背后的原理以及目前的最新進展。
本次我們采訪了北京大學心理與認知科學學院研究員朱露莎,朱露莎研究員將帶領我們了解目標導向性決策的相關研究。
朱露莎
Q:您為什么會選擇決策作為研究方向?
朱露莎:我主要研究人類決策意圖、對環境對他人的推斷,以及它們怎么影響決策的策略。比如,我們實驗室常研究博弈行為,在人際交互中,我們經常需要判斷對方的目的到底是什么(是合作共贏,還是騙一把就走),需要預測對方下一步的選擇是什么,以及對方的選擇會對我自己造成什么樣短期和長期的影響。
這種種看不見摸不著的意圖、推測和預判是人類智能中最高級最復雜的部分,也可能是人區別于其他物種的關鍵之處,更是人類各種重要的行為——比如合作、競爭、協作、交流——的智能基礎。我們希望能夠對這一部分智能有一個深入、定量、機制性的了解。這是一個認知科學的問題,一個博弈研究的問題,一個計算科學和神經生物學結合的問題,一個生物智能和人工智能結合的問題,一個自然科學和社會科學結合的問題,一個在我看來重要、有趣、多學科結合的問題。
我自己逐步在探索的過程中慢慢找到自己感興趣的方向。我本科讀的是物理,我喜歡物理學的研究方法,即將復雜的問題進行簡化和抽象,通過定量的手段和建模的方法,刻畫事物底層的關鍵規律,然后通過實驗去證明和證偽。
讀了幾年后,我覺得做物理實驗不太適合我,而且相比于自然界,我對人和社會更感興趣。當時我覺得經濟學是個跟物理學類似的學科,也用類似的建模手段探索復雜事物的底層規律,只不過研究對象不是自然界而是人的行為和社會活動。因此,我后頭就轉去做經濟學的研究。
在博士期間,我一開始的研究方向是博弈理論,有點類似于應用數學的研究,解一些復雜條件下的最優策略和均衡。做了幾年,我覺得這也不是我喜歡的東西,我慢慢感到,我自己真正感興趣的問題是,人到底是怎么做決策的,而不是人應該怎么做研究(博弈論的傳統研究問題)——事實上,人類的決策很多時候都會背離應該的、最優的策略。
我自己覺得真正有趣的是這些非最優策略是怎么產生的,底層的邏輯是什么?這些非最優策略是朝著一個方向產生系統性的、可預測的偏離,還是隨機的、噪音性的分布?
當時,決策神經科學(或者叫神經經濟學)這個新興的交叉學科領域正處于快速發展階段,研究者將多學科研究手段相結合,從底層神經生物學的角度探索決策機制。因為一些機緣巧合,我慢慢轉向這個領域的研究,之后干脆就將研究方向轉換到了決策神經科學??偟膩碚f,我希望從一個機制性的角度來理解決策的智能基礎,以及它們和一些社會性行為或社會現象之間的關系。這是我選這個領域的原因。
Q:您在做相關研究的過程中,用到了哪些方法和手段,可以跟我們分享一下嗎?
朱露莎:我們的研究涉及多個學科的方法,比如社會學、經濟學、語言學、計算機科學的一些方法,并把這些方法和認知神經科學中的一些手段,例如fMRI(功能性磁共振成像)、腦損傷、藥物,或者一些神經操控手段相結合,以人為對象進行研究。
通俗一點來說,比如在博弈相關的研究里,我們用博弈游戲搭建人際交互的實驗平臺,用腦科學研究手段(如核磁共振、腦損傷、腦刺激等)來探查交互個體決策的硬件,用博弈論、機器學習、計算語言學等模型來刻畫生成決策行為的軟件,由此來理解決策行為的認知和神經機制,以及這些機制在神經和精神疾病下將會出現怎樣的偏差。
Q:像您剛剛提到的,您的實驗室以人為研究對象,關注的是大腦的決策過程。人是社會性生物,在社會活動過程中涉及競爭、合作與交流,在這些過程中,人是如何做決策的?
朱露莎:先澄清一下,決策包括很多種,可以是感知覺決策、運動決策等等,都會受到社會交互的影響,比如國內有的實驗室會探索我們怎么判斷遠處兩個人的社會關系,這可以是很有趣的感知覺決策問題。
但我們實驗室關注的目標導向性決策(goal-directed decision making)——通俗地說,就是為了達成某種目的而做的決策,比如為了吃飽而覓食,為了利益最大化而和人合作。
具體到社會決策領域,目前主流的研究問題大約可以分成兩塊。一塊是意圖、動機、目的怎么影響社會決策。在社會環境中,我們的決策動機不像非社會環境中那么簡單,我們不僅僅要考慮個體利益最大化,還需要考慮他人、群體的利益,考慮公序良俗、社會規范等等,有些社會動機可能在漫長的演化過程中已經被內生為我們獎賞系統的一部分來影響我們的行為。
因此這里有趣的問題是這些看不見摸不著的社會性動機是怎么被我們的獎賞系統表征、運算、和其他的利益相互權衡影響我們的行為選擇的。其中一個挑戰是,這些抽象的社會性動機和復雜的社會行為,怎么被抽象的數學模型嚴格地刻畫,產生定量的行為和神經層面的預測。
另一塊研究是對社會環境和交互對象的推斷,例如我之前舉的例子中,對他人下一步行為的預判。在非社會情境中,我們的大腦常常通過統計學習,來推斷周邊的環境。
但在交互式的社會決策中,這種統計學習會變得非常復雜,就像玩石頭剪刀布一樣,當我們推斷對手的選擇時,他也在推斷我們的選擇,因此我們常常需要推斷對方關于我們的推斷等等,這種高階的遞歸的推斷是怎么產生的,大腦采用了什么算法,大腦的算法有沒有系統性偏差,存不存在智能的上界,以及這些推斷和合作競爭等社會行為的關系是什么等等,這些都是目前很活躍、有趣的研究問題。
Q:提到交互,您實驗室在Science Advances上發表了一篇非常有意思的文章,是關于如何理解交流對象的談話內容,如何理解言外之意、弦外之音,可否跟我們分享一下這篇研究?
朱露莎:在這篇文章里,我們關心的主要問題是,大腦怎樣針對特定的交流環境來使用交流信號,對交流信號進行解碼。
舉個例子來說,一個人問“你們學校老師講課怎么樣”,可能有個同學回答“有的老師課講得還不錯”。這時,你馬上能領會到這句話的言外之意:“有的,但并不是全部老師講課不錯,換言之,這個同學想說,有的老師課講得不怎么樣”。這種言外之意的理解,跟使用什么語言無關,所有人都能夠很快地、很正確地解碼出言外之意。
這種交流就是一種博弈行為。 我們研究的問題是這種言外之意的解碼到底是怎么進行的。我們的研究提出的一個主要的觀點是,聽話的人通過模擬說話的人對話語理性選擇的過程,來理解言外之意。
在剛才這個例子里面,聽話的人會想,如果說話人想說的是該學校全部老師課都講得好,他應該會選擇說“學校里老師講課都很好”,之所以說有的老師,而不是全部老師講課很好,大約是想暗示有些老師課講得不好。換言之,解碼交流信號的過程,可能包含了把自己放到說話人的立場上,模擬說話人在當下的語境中,怎樣最有效地選擇交流的信號,最優地表達自己想表達的意思。然后由這個過程反推出說話人到底想表達什么。
我們把認知神經科學、計算語言學、博弈論等方法結合起來,研究這個問題。我們發現,人類大腦通過靈活、自動、理性地模擬說話人理性的話語選擇,來推斷交流信號的潛在含義。這一過程可以在數學上描述為一個基于逆向推理的歸因過程,該推理過程所需的幾種關鍵的認知變量由腹內側前額葉和紋狀體的活動定量表征,為理解社會交流提供了一個簡單、可擴充的認知神經模型。
有趣的是,在有些情況下,聽眾無需推理,可以由字面含義獲知對方的意圖,聽眾的腹內側前額葉仍然穩定地表征了這模擬信號,意味著對交流伙伴行為的模擬也許是一個自動的神經加工過程。
Q:我們的日常交流有一來一往的面對面口頭交流,也有書面文字交流。在不同交流過程中,大腦理解他人意圖的方式,也就是解碼的過程會有區別嗎?
朱露莎:我們這個實驗本身是用書面文字呈現的,雖然我目前并沒有實驗數據,但是我猜,我們發現的規律并不局限于書面文字,應該對包括聲音、身體語言在內的多種交流信號都成立。當然,不同的情況會有一些特異性,比如不同于書面文字,口頭交流時說話人說得比較快,產生錯誤的概率也許比書面交流高,因此聽話人的生成模型的容錯度會不太一樣。
Q:您實驗室還關注了道德判斷的生物機制這方面的研究,對于人到底是性本善還是性本惡這樣的爭論由來已久,為什么人在社會生活過程中會受道德的約束?從進化上來說,人和動物之間的道德感在生物基礎上是否有本質區別?
朱露莎:我們前些年的研究和這個有關,這個問題說起來可以講整整一個學期的課了。簡單講一下我們相關的研究。人到底是性本善還是性本惡這樣的爭論,現代認知心理學家和道德哲學家們一直在認知控制機制的框架下討論,也就是心理學中很有名的雙系統——快系統(直覺,本能)和慢系統(認知控制后的反應)。
我們知道,前額葉背外側皮層是實施認知控制的最重要腦區之一,一旦這一腦區受損,我們可能就不能進行認知控制,只剩下本能反應。如果人性本善假設成立,失去認知控制后,我們只剩下本能的道德;反之,人性本惡理論下,失去認知控制后,我們只剩下本能的自私。在這個邏輯下有一系列研究來探索人性本善或者人性本惡。
我們之前研究了兩類大腦前額葉有損傷的病人,一類是前額葉背外側皮層有損傷,另一類是眼眶額葉皮質有損傷,還有一組大腦沒有受傷的人作為對照組。這些人參與了一個叫做“信號游戲”的實驗,這個游戲在進化生物學、博弈論以及實驗經濟學中被廣泛使用。
實驗分兩部分。第一部分實驗中,參與者面臨兩個選項:要么自己獲利更多,要么他人獲利更多。毫無意外,大部分參與者選擇自己獲利更多的選項。第二部分實驗中,參與者面臨同樣兩個選項,但他們不能直接做出選擇,而是需要向另一位參與者發送一條信息,告知哪個選項回報更多,說服其作出選擇。如果說真話,發信人將獲利較少;如果說假話,發信人將獲利較多?!?/p>
我們的研究表明,大腦沒有受傷的人往往更愿意說真話。而前額葉背外側皮層受損的人行為模式有所不同,一旦誠實與私利相矛盾,他們更多做出不誠實的抉擇。這一結果說明前額葉背外側皮層這一負責認知控制的重要腦區,也許是誠實行為的“開關”。換言之,這個結果支持了人性本自私的假說。
至于人和動物的道德感在生物基礎上是否有本質區別,我覺得當然是有的。比如,人類會面臨很多復雜的道德兩難情境,需要復雜的權衡和推理,這些過程就和社會決策息息相關,涉及我前面說過的高等的社會獎賞的計算,對其他社會個體意圖行為的預判等等,比如目前并沒有特別充足的證據證明動物會有和人一樣強大的心理理論(theory of mind)能力,所以動物的的道德權衡,即便有也大約會初級一些。
Q:您實驗室同時關注健康和疾病人群的社會決策的認知過程,可否與我們分享這方面的進展?
朱露莎:在決策領域近年來一個特別大的發展是計算精神病學(computational psychiatry),把包含決策神經科學在內的一些領域的研究成果,應用到精神疾病相關領域的研究中,以期為這類疾病的定量診斷和發展個性化治療手段提供一些新的思路。
最近幾年來,我們一方面和合作者一起,利用像強化學習在內的一些手段,研究抑郁、成癮和PTSD病人在決策上的特殊性。比如最近一個研究著眼于對抑郁癥的認知行為療法的研究,發現強化學習的行為模式和大腦激活模式可以跨越6年的時間長度,預測認知行為療法對抑郁癥的治療效果。
另一方面,我們把我們的社會決策研究成果應用到兒童和青少年人群中,以及那些有自閉特質的青少年中。比如我們發現14~15歲對于理解言外之意的能力是個很特殊的發展階段,以及自閉特質對于這一能力的發展可能有一些意想不到的影響。
Q:您實驗室未來的研究重點是什么?
朱露莎:之前,我們利用統計學習的方法,來研究過往社會交互的經驗怎么塑造我們的意圖、推斷和策略。然而,生物智能和人工智能領域中更有趣、也更有挑戰性的問題是,面對新環境新對象,大腦/人工智能用什么算法來預測他人的行為?它和知識的遷移泛化有什么算法和執行層面的關聯?它如何解釋理性/有限理性的行為? 這個問題很重要,也很有趣,我們實驗室長期招收博士后,特別歡迎在認知神經科學、機器學習、自然語言處理、博弈論和行為經濟學等方面有相關專長的研究者加入。
本文來自微信公眾號:nextquestion (ID:gh_2414d982daee),提問:Lixia,編輯:summer、EY
關鍵詞:
言外之意
交流信號
研究方向