USC信息科學(xué)研究所(ISI)的研究負(fù)責(zé)人和USC維特比工程學(xué)院的計(jì)算機(jī)科學(xué)研究助理教授Jonathan May正在與ISI程序員分析師兼前途的USC Viterbi博士Justin Cho探討這個(gè)問題。學(xué)生,通過他們的精選對可學(xué)習(xí)即興創(chuàng)作(SPOLIN)項(xiàng)目。他們的研究將即興對話納入聊天機(jī)器人,以產(chǎn)生更具吸引力的互動。
SPOLIN研究資料庫由68,000多個(gè)英語對話對,或?qū)υ捵龀鲅杆俜磻?yīng)和隨后的回應(yīng)所組成。這些對以“是”和“對話”為模型,這是即興創(chuàng)作的基本原則,鼓勵(lì)進(jìn)行更多有基礎(chǔ)和相關(guān)的對話。收集數(shù)據(jù)后,Cho和May建造了SpolinBot,這是一個(gè)即席即用的代理程序,該程序使用第一個(gè)yes-and research集合編程,該集合足以訓(xùn)練聊天機(jī)器人。
7月6日,在7月5日至10日舉行的計(jì)算語言協(xié)會會議上,發(fā)表了項(xiàng)目研究論文“即興對話與即興對話”。
梅正在他的工作中尋找新的研究思路。他對語言分析的熱愛使他從事自然語言處理(NLP)項(xiàng)目的工作,并且他開始尋找可以使用的更有趣的數(shù)據(jù)形式。
他說:“我在大學(xué)里做了一些即興創(chuàng)作,并一直呆在那些日子里。”“然后,一個(gè)在我大學(xué)即興表演團(tuán)里的朋友建議,有一個(gè)‘是-’機(jī)器人可以和它一起練習(xí),這很方便,這給了我靈感-制作一個(gè)可以即興創(chuàng)作,這很實(shí)用!”
May對這個(gè)想法的探索越深入,他發(fā)現(xiàn)這個(gè)想法就越有效。是-并且是即興創(chuàng)作的支柱,它促使參與者接受另一位參與者所說的現(xiàn)實(shí)(“是”),然后通過提供其他信息(“和”)在該現(xiàn)實(shí)之上建立。該技術(shù)是在互動中建立共同基礎(chǔ)的關(guān)鍵。如May所言,“是的,并且是即興社區(qū)所說的“接地”的方式。”
是的,并且很重要,因?yàn)樗鼈兛梢詭椭鷧⑴c者共同建立一個(gè)現(xiàn)實(shí)。例如,在電影腳本中,可能有10-11%的行被視為是和,而在即興創(chuàng)作中,至少有25%的行被視為是。這是因?yàn)椋c電影已經(jīng)為觀眾確定的設(shè)置和角色不同,即興創(chuàng)作者的表演沒有場景,道具或任何客觀現(xiàn)實(shí)。
喬說:“由于即興表演場景幾乎沒有既定現(xiàn)實(shí),所以在即興表演中進(jìn)行對話會積極嘗試達(dá)成共同的假設(shè)和諒解。”“這使即興對話比大多數(shù)普通對話更有趣,后者通常是根據(jù)已經(jīng)存在的許多假設(shè)(根據(jù)常識,視覺信號等)進(jìn)行的。”
但是,找到從中提取即興對話的來源是一個(gè)挑戰(zhàn)。最初,May和Cho檢查了典型的對話集,例如電影劇本和字幕集,但這些消息來源所含的Yes-ands不夠多。而且,可能很難找到已記錄的,更不用說轉(zhuǎn)錄的即興創(chuàng)作了。
在2018年秋季以交換生的身份訪問南加州大學(xué)之前,Cho與May進(jìn)行了接觸,詢問他可以參加的NLP研究項(xiàng)目。Cho來到USC之后,他了解了May的即興項(xiàng)目。
喬說:“我對它如何觸及我不熟悉的利基很感興趣,我特別感興趣的是,在這方面幾乎沒有或沒有以前的工作。”“當(dāng)喬恩說我們的項(xiàng)目將回答一個(gè)尚未被問到的問題時(shí),我感到很困惑:這個(gè)問題是如何通過“是和行動”即興進(jìn)行建模的基礎(chǔ)如何有助于改善對話系統(tǒng)。”
Cho研究了多種收集即興數(shù)據(jù)的方法。他最終遇到了Spontaneanation,這是由多產(chǎn)演員和喜劇演員Paul F. Tompkins主持的即興播客,播客時(shí)間為2015年至2019年。
憑借其開放式專題節(jié)目,大約30分鐘的持續(xù)即興創(chuàng)作,高質(zhì)量的錄音以及相當(dāng)大的規(guī)模,Spontaneanation是為該項(xiàng)目挖掘是與否的理想來源。二人將其自發(fā)化數(shù)據(jù)輸入程序,SpolinBot誕生了。
梅解釋說:“該項(xiàng)目的一個(gè)很酷的部分是我們找到了一種即興使用的方法。”“自發(fā)化對我們來說是一個(gè)很好的資源,但是隨著數(shù)據(jù)集的發(fā)展,它是很小的;從中我們只能得到大約10,000個(gè)肯定的答案。但是,我們使用那些肯定的答案來構(gòu)建一個(gè)分類器(程序),可以查看對話并確定它們是否為“是”。
首先,與即興對話進(jìn)行合作有助于研究人員從其他來源中找到是和否,因?yàn)榇蠖鄶?shù)SPOLIN數(shù)據(jù)都來自電影腳本和字幕。梅說:“最終,SPOLIN語料庫包含的yes和非即興來源的數(shù)量是即興創(chuàng)作的五倍,但我們只能從即興開始獲得這些yes。”
SpolinBot有一些控件可以優(yōu)化其響應(yīng),使它們從安全無聊到有趣和古怪,還可以生成五個(gè)響應(yīng)選項(xiàng),用戶可以從中選擇以繼續(xù)對話。
這對二人為SpolinBot制定了許多計(jì)劃,并將其對話能力擴(kuò)展到“是”之外。“我們想探索其他使即興創(chuàng)作變得有趣的因素,例如角色塑造,場景塑造,‘如果這(通常是一個(gè)有趣的異常)是真的,還有什么是真的?’和回叫(指的是對象) /上次對話中提到的事件),” Cho說。“我們還有很長的路要走,這讓我為我在整個(gè)博士學(xué)位期間以及以后所能探索的一切感到更加興奮。”
可能會與Cho的觀點(diǎn)相呼應(yīng)。他說:“最終,我們希望建立一個(gè)良好的對話伙伴和良好的創(chuàng)造力伙伴。”他指出,即使是即興創(chuàng)作,是的,也只是對話的開始。“當(dāng)今的機(jī)器人(包括SpolinBot)并不能很好地保持對話的進(jìn)行。應(yīng)該有一種感覺,兩個(gè)參與者不僅在建立一個(gè)現(xiàn)實(shí),而且還在一起體驗(yàn)這個(gè)現(xiàn)實(shí)。”
后一點(diǎn)很關(guān)鍵,因?yàn)檎缑匪忉尩哪菢樱玫幕锇閼?yīng)該像Alexa和Siri一樣平等,不能屈服。他說:“我希望我的伴侶與我一起做出決定并集思廣益。”“我們最終應(yīng)該能夠從人類長期合作中受益于團(tuán)隊(duì)合作和合作中獲得收益。虛擬伙伴的另一個(gè)好處是,與我相比,數(shù)學(xué)水平更高,更快,并且實(shí)際上不需要吃飯! ”
-
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
12721 -
自然語言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14038 -
nlp
+關(guān)注
關(guān)注
1文章
490瀏覽量
22503
發(fā)布評論請先 登錄
評論