0
學習到底是什么?
人類對于學習的認知往往受制于我們的感知能力和衡量標準,這也是為何千年以來人類學習的進化速度異常的緩慢。
然而,現代多模態傳感數據的處理能力日新月異,通過在實際的教育過程收集到的學生生理信號、言語表達、面部表情、姿勢等多模態數據,科學家們正在以一種新的視角重新審視和理解學習。
中國教育行業正在經歷一場以數據和人工智能為核心的技術變革,這也是為何在今年8月10日-16日于澳門舉辦的國際人工智能聯合會議上(IJCAI)上,圍繞多模態數據分析和智能教育的研討會AIMA4EDU受到了業內極大的關注。
AIMA4EDU,全稱為“基于人工智能的多模態分析用于理解現實世界教育環境中的人類學習”,由中國人工智能教育獨角獸乂學教育-松鼠AI聯合舉辦,8月11日舉辦為期一天。研討會除了頒發最佳論文和最佳學生論文之外,還邀請了來自加州伯克利大學、孟菲斯大學和松鼠AI的專家,分享他們基于多模態數據的教育前沿研究。
明年的AIMA4EDU研討會將與IJCAI 2020一起在日本橫濱舉辦。
最佳論文
獲得最佳論文的是來自荷蘭開放大學和德國萊布尼茨教育研究和信息研究所的“Multimodal Pipeline: A generic approach for handling multimodal data for supporting learning(多模態工作流:用于處理多模態數據以支持學習的通用方法)”。
多模態工作流是一種用于支持學習的多模態數據的收集、存儲、注釋、處理和利用的方法。 在目前的發展階段,多模態工作流由兩個相關的原型組成:1)多模態學習中心,用于收集和存儲來自多個應用程序的傳感器數據;2)可視化檢查工具,用于可視化和記錄所記錄的會話。 多模態工作流可用于支持各種學習場景,如演示技巧、患者人體模型的醫學模擬等,可以提供不同的支持策略,包括檢測錯誤,并在智能輔導系統中提示實時反饋,或通過學習分析儀表板激勵自我反省。論文鏈接在此。
最佳學生論文
獲得最佳學生論文的是來自新南威爾士大學研究團隊的“Deep Multi-agent Attentional Learning for Cognitive Attention Analysis in Educational Context(深層多智能體學習在教育語境中的認知注意力分析)”。
傳感系統的最新發展允許連續產生大量傳感數據,這使得復雜的學習成為可能。為了應對日益增長的對教育問題的關注,本文將學生的EEG信號與教育背景下的認知注意狀態聯系起來。研究團隊考慮人類關注的兩個固有特征,即空間 - 時間上不同的特征顯著性和個體特征之間的關系。 基于這些,本文提出了一種多智能體時空關注模型。時空關注機制有助于智能地選擇信息渠道及其活躍期。 并且所提出的模型中的多個智能體表示具有集體全局選擇的單個特征的生理現象。 通過共同目標,智能體共享獲得的信息并協調他們的選擇策略以學習最佳的注意力分析模型。論文鏈接在此。

以下是大會演講的亮點匯總:
孟菲斯大學Frank Andrasik:關于神經反饋治療自閉癥譜系障礙的方法論思考
Andrasik博士目前擔任田納西州孟菲斯大學心理學系行為醫學中心的杰出教授、主席和主任。他在1979年獲得俄亥俄大學臨床心理學博士學位,至今發表過大約270篇文章,并發表了大量演講。Andrasik博士同時還是心理學家,以及Applied Psychophysiology和Biofeedback兩份刊物的主編。
Andrasik博士的演講討論了神經反饋(Neurofeedback)在治療自閉癥譜系障礙患者(Autism Spectrum Disorder,簡稱ASD)的方法論。ASD簡單而言就是自閉癥,但是一個更廣義上的醫學名詞。
腦神經反饋訓練則是目前一種比較新穎的治療手段,通過檢測患者的腦波活動狀態,針對大腦薄弱的區域通過特殊的手段鍛煉大腦神經。在過去三年,這項技術呈現井噴式增長,并且開始大量用于商業化,位于佛羅里達的Neurocore是目前美國最大的神經反饋服務供應商之一,美國教育部長貝齊·德沃斯(Betsy DeVos)擁有該公司的部分股權。
盡管神經反饋的發展迅猛,但Andrasik博士列舉了該治療技術在過去幾年出現的問題:比如安慰劑效應,忽略了衡量維度,缺乏長期跟蹤患者狀態的機制。
神經反饋公司夸大的宣傳也是行業的普遍現象:美國聯邦貿易委員會指控Lumos游戲的創建者Lumos Labs欺騙消費者,毫無根據地聲稱他們的游戲可以幫助患者在工作和學校中表現更好,并減少或延遲與年齡和其他嚴重健康狀況相關的認知障礙。
那么該如何推動這個行業前進?Andrasik博士總結了七個方向:
1. DSM-5提高診斷精度。DSM-5是美國精神疾病診斷與統計手冊第五版,把當代人們所有因為情緒控制不當和各種奇葩的病癥列為各類輕~重型精神病;
2. 認識到皮質缺乏不是癥狀的唯一原因。 外周生理活動、例如心率及其變異性,與神經生理學信號密切相關,并與社會參與度有關;
3. 確定反應的預測因素,治療可能需要40-80個療程;
4. 利用非接觸式電容式EEG電極,基于近紅外光譜(NIRS)的傳感器,可穿戴式頭盔設備等,在最需要的環境中每天練習;
5. 加強對治療機制的關注;
6. 利用機器學習方法;
7. 關注在真實環境而不是實驗室環境中的功效。

松鼠AI 首席架構師、Richard Tong:基于智能體的自適應教學系統設計框架
松鼠AI首席架構師Richard Tong曾擔任過Knewton的大中華區負責人和Amplify Education的解決方案架構總監,除此之外,他還是IEEE AIS(自適應教學系統)標準工作組成員以及互操作性小組的主席(IEEE 2247.2)。
Richard Tong介紹了松鼠AI建立自適應教學系統框架的初衷和細節。他認為,阻擋優質教育的普及和規模化的最大障礙來自于三點:成本、可行性、系統慣性。基于此,松鼠AI堅信教育方法需要重新定義:
? 每個學生都不同,任何基于團隊的教學都不能有效地利用學生的時間;
? AI現在可以提供大規模的連續自適應一對一體驗;
? 人類教師(教練)應提供有針對性的、社會的和具有動機的個人支持。
那為什么教育需要一個基于智能體的框架?Richard 認為,一個智能體框架能設計出更好的教育過程:
? 智能體更好地了解整個教育過程和產品,學習的關鍵條件可以在智能體框架中得到很好的體現,包括學習的準備、學習能力、以及學習環境;
? 智能體框架是一個發生學習的自然框架,可以更好地幫助學生學習科學,擁有更好的可解釋性和人機界面設計;
? 更好地智能體設計可以更好地設計教育系統,智能體的水平應主要通過智能體改善學習成果的能力來衡量,而不是通過實施方法的復雜程度來衡量
Richard 簡單介紹了松鼠AI自適應教學系統的設計框架,主要由三部分組成:一個教學智能體,學習擁有本體層、傳感器、資源和工具;一個復合模型,包含領域模型、學習模型、交互模型;以及一個教學模型,可以看成是一個強化學習的策略,有行為、規則、和獎勵函數。
在整個框架下,松鼠AI設計了四種智能體:外環智能體、內環智能體、伴侶智能體、模擬學生智能體。
需要著重了解的是這個外環-內環框架機制,也可以理解宏觀-微觀適應性架構。外環智能體會遍歷一個動態的任務序列,結合本體層的學習地圖和內容地圖以及算法層的學生畫像、知識狀態評估、推薦引擎,為學生選定合適的任務進行學習。
內環智能體則是獲得一個動態的學習行為,遍歷學習一個任務的不同步驟,架構類似但不同的模塊更加細分。這使得松鼠AI的系統真正具有適應性 - 不僅可以提供有關任務的反饋,還可以提供各個步驟的反饋。將兩者結合之后得到的智能體學習行為,會保存在LRS中作為智能體先前的學習歷史。
Richard也列舉了目前依然遇到的挑戰,比如:智能體之間的交流、本體層、傳感信息的融合、以及上下文信息的同步。松鼠AI的下一步是進行更多的聯合研究,目前已經和卡內基梅隆大學以及斯坦福大學達成聯合研究的項目;做更多的參考設計和實驗;標準化系統之間的智能體接口和其他組件。

松鼠AI KP Thai:用于多模態教學和學習分析的大規模數據集
松鼠AI的高級學習和數據科學家KP Thai博士主要介紹了松鼠AI研究團隊的最新成果:一個用于多模態教學和學習分析的大規模數據集MULTA。
Thai博士介紹稱,搭建這個數據的原因是高頻多模態數據采集技術和AI/ML分析技術的進步可以為學習提供新的見解,但目前公開的可用的數據集并不多,尤其是來自現實世界的學習環境、松鼠AI希望通過發布數據集以幫助探索多模態學習分析和數據挖掘,促進教學和學習的進步。
松鼠AI收集了來自兩個課后學習中心的156名中學生的數據,他們參與了5個科目:數學、英語(語法和閱讀)、中文、物理、化學。在五周的時間里,學生們被要求佩戴腦波耳機并進行錄像。
在學習過程中,松鼠AI收集了其系統上的用戶記錄、腦電波(使用BrainCo的腦電圖頭帶)、以及網絡攝像頭視頻(通過Debut視頻錄制軟件的網絡攝像頭)。研究團隊將腦電波和網絡攝像頭視頻同步到用戶記錄上,根據時間同步三個數據源,基于不同的問題分割腦波和網絡攝像頭視頻數據。
數據集目前還存在一些不足,比如數據收集過程并未如同設想的一致,導致可用數據少于預期
網絡攝像頭和腦波數據的長度與課程長度不同,網絡攝像頭沒有正確設置等等。
未來,松鼠AI將優化數據收集和準備過程,繼續收集數據,尋求多模態之間同步的工具,并更好地理解腦電波的特征表示。
后文將對其余演講者的內容做簡單介紹:
來自新南威爾士大學的研究團隊介紹了他們的最新論文“On Using EEG Signals for Human Attention Estimation(用EEG信號進行人體注意力估計)”。EEG信號是估計人類注意力的主要媒介。當前的EEG研究通常需要針對不同受試者的適應步驟,然后腦計接口經過調整后才能用在新的實驗者身上,這會耗費大量的時間和人力。研究者提出了卷積遞歸注意模型(CRAM),利用卷積神經網絡編碼腦電信號的高級表示和反復注意機制,以探索腦電信號的時間動態,并專注于最具辨別力的時間周期。
來自北京交通大學和北京師范大學的研究團隊介紹了他們的最新論文“Understanding Schoolchildren Test Anxiety through Online Writing Analysis(通過在線寫作分析了解學童考試焦慮)”。如何科學有效地判斷學生是否有考試焦慮,從而及時給予幫助是一個值得關注的研究 課題。與高成本的自我報告相比,本文的研究試圖通過分析在線寫作來了解考試焦慮的表現并預測個體考試焦慮的程度。研究發現考試焦慮與一些寫作習慣有關,例如易用詞的使用頻率和猜測詞的使用類型。 通過應用機器學習技術,建立并評估基于在線書寫數據的考試焦慮預測模型。 隨機森林回歸器目前實現了最佳性能。
來自悉尼科技大學、南京航空航天大學、和北京化工大學的研究團隊介紹了他們的最新論文“Student Sentiment Analysis Through Students’ Assignments(通過學生作業分析學生情緒)”。學生情緒分析對學生管理學習和生活至關重要。為了解決這個問題,本文提出了一個分層的學生情緒分析框架來分析學生的作業情緒。 該框架包括兩個流:參考流和學生語句流,它們能夠從引號和引用中分析部分學生情緒。 實驗結果證明這個框架在大學生作業數據集方面優于其他競爭對手。
來自悉尼科技大學和蒙納士大學的研究團隊介紹了他們的最新論文“Universal Graph Embedding for Heterogeneous Study-trajectory Graph(用于異構研究軌跡圖的通用圖嵌入)”。當前的學習興趣發現方法使用單個時間序列單調地模擬每個學生的學習軌跡,忽略了學生和課程之間的相互依賴性。 本文中將學生和課程構建為研究軌跡圖中的異構節點源,并提出了一種通用圖嵌入框架(UGE)來同時捕獲同質節點之間的相互關系以及異構節點之間的相互依賴性。
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。