“全球AI+智適應(yīng)教育峰會”在北京嘉里中心大酒店盛大開幕,峰會由雷鋒網(wǎng)聯(lián)合乂學(xué)教育松鼠AI,以及IEEE(美國電氣電子工程師學(xué)會)教育工程和自適應(yīng)教育標(biāo)準(zhǔn)工作組共同舉辦,匯聚國內(nèi)外頂尖陣容。
AI 自適應(yīng)學(xué)習(xí)是目前產(chǎn)學(xué)研三界關(guān)注度最高的話題之一。此次峰會邀請到美國三院院士、機器學(xué)習(xí)泰斗 Michael Jordan,全球公認(rèn)機器學(xué)習(xí)之父 Tom Mitchell,斯坦福國際研究院(SRI)副總裁 Robert Pearlstein、美國大學(xué)入學(xué)考試機構(gòu) ACT 學(xué)習(xí)方案組高級研究科學(xué)家 Michael Yudelson 等頂尖學(xué)者。
在 16 日上午主論壇上,Tom Mitchell 帶來了一場精彩的主題演講。以下為他的演講內(nèi)容,雷鋒網(wǎng) AI 科技評論整理。
我認(rèn)為這 10 年對自適應(yīng)教學(xué)來說是最好的 10 年,因為我們開始看到技術(shù)變得成熟,越來越多的公司開始運用這些技術(shù),我相信本次會議將是這個領(lǐng)域的轉(zhuǎn)折點。
我今天主要想跟大家談幾點想法,內(nèi)容主要關(guān)于人工智能可以如何與自適應(yīng)學(xué)習(xí)產(chǎn)生聯(lián)系。
YouTube 上截取的這幾張圖片告訴我們什么是自適應(yīng)學(xué)習(xí)。在自適應(yīng)體系中,老師會不斷地評估學(xué)生的能力、發(fā)現(xiàn)他們的不足點、給他們設(shè)立目標(biāo)、發(fā)掘他們的學(xué)習(xí)需求,甚至根據(jù)他們的學(xué)習(xí)速度來提供更好的建議。我們發(fā)現(xiàn)已經(jīng)有系統(tǒng)開始在做這件事情,然而都處于早期階段,我們接下來的工作重點應(yīng)該更多放在系統(tǒng)改善上。
機器學(xué)習(xí)和人工智能,將成為自適應(yīng)學(xué)習(xí)的驅(qū)動式技術(shù)
機器學(xué)習(xí)這 10 年的發(fā)展非常快。比如一開始表現(xiàn)不怎么理想的計算機視覺,后來的識別精度已經(jīng)變得幾乎跟人眼一樣;語音學(xué)習(xí)的情況也一樣;還有圍棋,AI 已經(jīng)成功打敗了世界冠軍;機器人汽車方面,我們將迎來越來越多的無人駕駛汽車。
展望未來,機器學(xué)習(xí)將如何促進 AI 的發(fā)展,進而促進自適應(yīng)學(xué)習(xí)的發(fā)展呢?這里有三個問題值得我們來一起來討論:
1. 機器應(yīng)該學(xué)習(xí)什么?
我們需要個性化的、基于每個學(xué)生的教學(xué)戰(zhàn)略。我們希望機器可以根據(jù)學(xué)生的退學(xué)率、學(xué)生的考試成績來提出一些建議,包括老師應(yīng)該在什么時候介入,以及老師應(yīng)該如何在學(xué)生和機器之間進行介入等等。
2. 應(yīng)該從哪些數(shù)據(jù)中進行學(xué)習(xí)?
現(xiàn)在存在各種類型的數(shù)據(jù),當(dāng)中包括環(huán)境式的數(shù)據(jù),比如說教室里的攝象頭、耳麥、話筒等等,通過這些環(huán)境數(shù)據(jù)我們可以更好地了解學(xué)習(xí)者的情況;身體的傳感數(shù)據(jù),比如說智能手表、智能椅子,可以感知到學(xué)習(xí)者當(dāng)下的學(xué)習(xí)狀態(tài);還可以通過 EEG 監(jiān)測大腦的數(shù)據(jù)??傊?,選擇什么樣的數(shù)據(jù)來源,對機器學(xué)習(xí)來說很重要。
對機器學(xué)習(xí)來說同樣很重要還有算法。
以監(jiān)督式學(xué)習(xí)為例,卡耐基梅隆大學(xué)一名博士生提出的網(wǎng)絡(luò)可以預(yù)測哪些學(xué)生會從網(wǎng)課中退學(xué)。它監(jiān)測的數(shù)據(jù)包括學(xué)生在課程上花的時間、鼠標(biāo)的點擊數(shù)等等,實現(xiàn)從輸入與輸出兩端進行監(jiān)測。
由于監(jiān)督式學(xué)習(xí)對自適應(yīng)教育來說很重要,所以我們需要一系列的技術(shù)來提升監(jiān)督式學(xué)習(xí)的精確度和效率,同時考慮學(xué)習(xí)環(huán)境的情景。從預(yù)測學(xué)生會從哪門網(wǎng)課中退學(xué),從而預(yù)測該學(xué)生會不會也從其他課程中退學(xué),是在跨任務(wù)轉(zhuǎn)移當(dāng)中需要我們重點關(guān)注的。
3. 多任務(wù)處理學(xué)習(xí)
這是 20 世紀(jì) 90 年代末提出的學(xué)習(xí)理論,要想提升系統(tǒng)預(yù)測的準(zhǔn)確度,就要將其他變量也一并考慮進來。比如說監(jiān)測哪個肺炎病人的病情將會惡化,除了肺炎本身的嚴(yán)重程度,我們還會一并考慮病人的白細(xì)胞數(shù)量、是否曾經(jīng)轉(zhuǎn)入 ICU 治療等等,通過這種方式來更好地預(yù)測病人肺炎惡化的幾率。同樣的模式運用到學(xué)生的退學(xué)率預(yù)測上,我們可以將學(xué)生的其他變量如期終考試成績等一并考慮進來。
這個技術(shù)之所以能成功,是因為它可以訓(xùn)練我們的系統(tǒng)進行包含多變量的預(yù)測,在這過程中會產(chǎn)生一些歸納程序,進而有效提升系統(tǒng)的預(yù)測效果。
另外一個有意思的算法是非監(jiān)督式學(xué)習(xí)。
這是我的同事在卡耐基梅隆大學(xué)做的研究,他們根據(jù)學(xué)生回答問題的正確率,對學(xué)生進行分類。大家可以看到圖中有三種不同顏色的曲線。
綠色一組最開始的表現(xiàn)特別好,后來表現(xiàn)突然下降了,之后再沒之前的表現(xiàn)好。對于非監(jiān)督式學(xué)習(xí),只要發(fā)現(xiàn)一個規(guī)律后我們就可以進行干預(yù),比如我們可以預(yù)測這三組學(xué)生的期末考試成績,以便更好地指導(dǎo)其他學(xué)生。
接下來談一下增強學(xué)習(xí),這種算法的特殊性在于,我們會在不同的時間點給予不同的行動指示,比如 AlphaGo 就是通過這種方式不斷增強自身能力,最終打敗了圍棋冠軍。簡單來說,圍棋上的每個點、走的每步棋都是決策過程,我們通過設(shè)置一個獎勵機制,不停地告訴系統(tǒng)應(yīng)該如何做才能取得成功,在這過程中將產(chǎn)生數(shù)百萬個行動的序列,我們通過這種方式反復(fù)對網(wǎng)絡(luò)進行訓(xùn)練。
這種方式其實是跟自適應(yīng)學(xué)習(xí)非常類似,在自適應(yīng)學(xué)習(xí)中也存在不同的狀態(tài)和行動,這個狀態(tài)指的是學(xué)生的學(xué)習(xí)狀態(tài)、心理狀態(tài)等;而行動則指教學(xué)行為,比如我們應(yīng)該進行考試、視頻播放還是學(xué)習(xí)評估。我們可以定義獎勵機制,讓機器告訴我們什么樣的行動更能促進學(xué)生的學(xué)習(xí)。
增強學(xué)習(xí)在過去 5 年取得了很大的進展,過程中產(chǎn)生了很多富有變化兼具個性化的模型。在機器學(xué)習(xí)的研究人員來看,這些沉淀下來的抽樣方法、算法選擇、數(shù)據(jù)選擇,對于發(fā)展AI + 教育而言是個寶藏。
機器學(xué)習(xí) + 教育的探索
我們來看一些更加具體的研究。這是我同事正在做的,讓人可以跟計算機產(chǎn)生互動。這個系統(tǒng)可以做到每一秒都在追蹤人類的面部表情和語音,從而推斷出這個人的情感狀態(tài),熒幕上的紅點在不斷地移動,反映的是這個人的情感狀態(tài)。當(dāng)系統(tǒng)推斷出學(xué)生存在沮喪和消極的情緒,這時老師就會介入提供幫助。當(dāng)老師與學(xué)生一同將問題解決時,系統(tǒng)檢測到了學(xué)生的積極情緒。
這個技術(shù)一旦實現(xiàn),老師可以根據(jù)系統(tǒng)每秒鐘的反饋,找出哪一名學(xué)生需要被指導(dǎo)。研究發(fā)現(xiàn),教師延時的反饋和負(fù)面影響是有正相關(guān)關(guān)系的。
這是我給大家舉的一個例子,可能會對教育界產(chǎn)生非常大的影響。
另外一個很有意思的研究方向是探索新的教學(xué)互動方式。我們發(fā)現(xiàn),通過教別人我們自己反而能學(xué)得好,因此,我們考慮讓學(xué)生充當(dāng)老師的角色,教導(dǎo)由計算機扮演的模擬學(xué)生。模擬學(xué)生通過屏幕征求人類的解答,而學(xué)生則負(fù)責(zé)教導(dǎo)模擬學(xué)生正確答題,在這過程中,我們會引入教學(xué)督導(dǎo)的角色,一旦學(xué)生在教導(dǎo)的過程中遇到問題時,教學(xué)督導(dǎo)將及時進行記錄和指導(dǎo)。
我們發(fā)現(xiàn)這種方式比傳統(tǒng)的教學(xué)更加有效,然而只有人工智能技術(shù)發(fā)展到一定程度,我們才能實現(xiàn)這種教學(xué)。
為此,我的團隊試圖建立一個能讓學(xué)生對計算機進行教學(xué)的系統(tǒng)。這個想法最初跟教育沒什么關(guān)系,我們主要想讓手機用戶能夠?qū)κ謾C進行重新編程。比如我們跟機器說「四點鐘的時候我們要開會」,機器會說「我不知道四點鐘開會是什么意思」,然后接著說「你想要教我的話你就教我」,我們會跟系統(tǒng)解釋「下午四點開會」是什么意思,接下來分別要做什么事情,系統(tǒng)經(jīng)過訓(xùn)練之后,他們在第二次就會快速理解這主人的指示,這是自然語言學(xué)習(xí)向來的做法。
這里要強調(diào)兩個理念,第一個是每句話的句式都是可以被執(zhí)行的,我們可以對句式進行翻譯并且變成可執(zhí)行的代碼。第二個是系統(tǒng)會不停學(xué)習(xí)新的步驟,最開始它可能不知道「告訴」是什么意思,而現(xiàn)在它知道了。這個研究最開始只是一個小想法,并沒有想到要應(yīng)用到教育上,后來我們發(fā)現(xiàn)如果能把這種想法與當(dāng)前的教育行業(yè)結(jié)合起來,當(dāng)中的潛力是很大的。
最后給大家做一個總結(jié),這是對自適應(yīng)教育來說最好的一個時代,人工智能會是這個時代的主要驅(qū)動力,將方方面面改變數(shù)據(jù)的本質(zhì),我們會收集到非常多人與電腦之間的互動性數(shù)據(jù),這些都可以應(yīng)用到對話式學(xué)習(xí)上。過去我們會覺得教育是老師和學(xué)生之間的事情,現(xiàn)在我覺得它老師、學(xué)生和電腦之間三方的事情。
中國在此擁有獨一無二的優(yōu)勢,有望在 AI 教育領(lǐng)域成為世界的領(lǐng)航者,能夠向其他國家展示如何運用這方面的知識。
評論