如何利用20萬條客戶咨詢消息,打造一款功能定制化的自動聊天應答機器人?如何將大量消息轉化為常見問題,整合進機器人的設計工作流程中?本文除了回答這些問題之外,還從需求、設計思路、面向人群、 實現方式等方面作了一番梳理。
我們在六個月內收集了一家大型房地產公司從訪問該網站的數據中收集的20萬條消息,并進行了深入分析,設計了一個滿足特定需求的聊天機器人。
首先看需要確定哪些因素,包括:
最常見的問題(FAQ)/服務需求
這些問題的主題,以及不同主題之間的分布情況
訪問者通過詢問這些主題試圖實現的目標是什么
我們為什么決定這樣做?簡而言之就是,我們希望做出數據驅動的決策。
客戶來到我們這里,他們的潛在客戶或現有客戶在訪問網站時發送了20萬條消息,這些消息是發送給實時聊天服務的。包括由在線代理機器人回復的消息,以及客服離線期間錯過的消息。
我們運行了一種數據算法,將這些消息分類為類似信息的集群。在這一點上,我們無法自信地考慮他們的意圖。我們花了很多精力將它們設計成我們設計聊天機器人的意圖。
這20萬條消息可以歸結為90個FAQ,我們通過人工分類劃分為3類,分別是:
1、可以自動回答的問題
2、在回答之前需要一系列問題來獲取上下文信息
3、需要機器人客服將訪問者轉接到人工客服,以獲得準確的答案
算法解決什么問題?
以前,在決定將哪些會話流轉接給聊天機器人時,很多靠的是猜測。因為并沒有能夠獲得數據,讓我們確定哪些對話對用戶而言是最有用的,因為我們不知道用戶想知道什么。
如何實現?
實際上,實現這個目標是一個“意圖聚類”的過程。這有助于分析兩人之間的聊天記錄。我們將這些信息輸入算法,確定具有相似含義的語句簇,這一過程就是所謂的“語義聚類”。語義聚類讓我們可以考慮優先使用哪些短語來訓練聊天機器人,來理解并進行對話(NLP訓練),哪些問題應該通過在問答服務中進行訓練,以命令和響應的方式提供靜態的答案,在這種情況下,可以使用微軟的問答機器人。
潛在用戶有哪些?
UX /會話設計師。這種分析可以實現以用戶為中心的設計,因為可以得知需要構建哪些用戶路徑。我們的目標是提供問題的在當前文本情景下的答案,這類問題是聊天機器人無法正確處理的。
機器人訓練師。他們現在知道哪些意圖是最重要的。訓練師可以優先訓練機器人,以了解它們最常被問及的主題的不同短語。
客戶。我們提供關于對話的概述摘要,內容包含主要數據點、對話中提及的主題類型和頻率,消息數量等。
這個過程具體分哪幾步?下面用“門外漢”式的方式解釋一下。
1、從客戶或第三方聊天機器人供應商出獲得會話腳本。
2、運行算法,通過機器學習模型進行對話,并處理每個對話中的句子,按語義對句子進行分類。
3、然后運行另一種算法,將這些按預測具有相似“意圖”的句子分成組。注意,這時的同一聚類中可能包含彼此不完全相關的句子。這些句子中只是包含類似的信息。
4、接著人工瀏覽這些句子,并對句子集群進行分析,向聚類內容分配標簽,得到一個單獨的“意圖”列表。
集群與意圖:這里需要對這兩個概念作一個區分。集群是一組具有相似語義的句子。比如可以確定10個句子,內容似乎都是關于購買房產的。但是因為這是一種無監督的機器學習算法,沒有人類背景,確定某個集群是否可以轉化為“意圖”必須要人類進行驗證。
5、設計師利用這些“意圖”和常見問題設計工作流程,以便能夠順利回答人類提出的問題,或滿足人們的請求。
我們對客戶提出問題和要求進行了調查,內容包括:
客戶詢問的主要主題和每個主題中的消息數量
在每個主題中子話題的類型
前10個主題中的消息頻率和分布情況
關于客服人員在線或不在線時的對話主題的比較
結果發現,在最熱門10個消息主題中,有一半與房價、設施和地理位置有關。
這三個主題占到用戶查詢在線客服機器人消息總量的一半。
最冷門的話題是關于停車位的,只占查詢信息總量的3%。
算法的工作原理
算法從對話中獲取句子并進行向量化。在更高一級,向量化的句子對詞語之間的關系進行分配,比如算法會確定,素食者吃蔬菜。
然后再使用另一種基于向量的算法,將句子分組為具有相似語義的群集。
面臨的挑戰
要準確地將意圖分配給對應的信息集群需要人工操作。當集群數量很多時,對團隊而言就是個很繁瑣的任務。而且,將90個常見問題整理成能夠反映用戶意圖的工作流程,需要多元化背景團隊的密切合作。
-
微軟
+關注
關注
4文章
6636瀏覽量
104571 -
機器人
+關注
關注
211文章
28745瀏覽量
208854 -
nlp
+關注
關注
1文章
489瀏覽量
22125
原文標題:如何用20萬條客服咨詢消息“喂”出定制化聊天機器人
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論