我欲封天耳根小说零,穿越小说完本 ,好看的玄幻小说

如何利用20萬條客戶咨詢消息，打造一款功能定制化的自動聊天應(yīng)答機(jī)器人？如何將大量消息轉(zhuǎn)化為常見問題，整合進(jìn)機(jī)器人的設(shè)計(jì)工作流程中？本文除了回答這些問題之外，還從需求、設(shè)計(jì)思路、面向人群、實(shí)現(xiàn)方式等方面作了一番梳理。

我們在六個(gè)月內(nèi)收集了一家大型房地產(chǎn)公司從訪問該網(wǎng)站的數(shù)據(jù)中收集的20萬條消息，并進(jìn)行了深入分析，設(shè)計(jì)了一個(gè)滿足特定需求的聊天機(jī)器人。

首先看需要確定哪些因素，包括：

最常見的問題（FAQ）/服務(wù)需求

這些問題的主題，以及不同主題之間的分布情況

訪問者通過詢問這些主題試圖實(shí)現(xiàn)的目標(biāo)是什么

我們?yōu)槭裁礇Q定這樣做？簡而言之就是，我們希望做出數(shù)據(jù)驅(qū)動的決策。

客戶來到我們這里，他們的潛在客戶或現(xiàn)有客戶在訪問網(wǎng)站時(shí)發(fā)送了20萬條消息，這些消息是發(fā)送給實(shí)時(shí)聊天服務(wù)的。包括由在線代理機(jī)器人回復(fù)的消息，以及客服離線期間錯(cuò)過的消息。

我們運(yùn)行了一種數(shù)據(jù)算法，將這些消息分類為類似信息的集群。在這一點(diǎn)上，我們無法自信地考慮他們的意圖。我們花了很多精力將它們設(shè)計(jì)成我們設(shè)計(jì)聊天機(jī)器人的意圖。

這20萬條消息可以歸結(jié)為90個(gè)FAQ，我們通過人工分類劃分為3類，分別是：

1、可以自動回答的問題

2、在回答之前需要一系列問題來獲取上下文信息

3、需要機(jī)器人客服將訪問者轉(zhuǎn)接到人工客服，以獲得準(zhǔn)確的答案

算法解決什么問題？

以前，在決定將哪些會話流轉(zhuǎn)接給聊天機(jī)器人時(shí)，很多靠的是猜測。因?yàn)椴]有能夠獲得數(shù)據(jù)，讓我們確定哪些對話對用戶而言是最有用的，因?yàn)槲覀儾恢烙脩粝胫朗裁础?/p>

如何實(shí)現(xiàn)？

實(shí)際上，實(shí)現(xiàn)這個(gè)目標(biāo)是一個(gè)“意圖聚類”的過程。這有助于分析兩人之間的聊天記錄。我們將這些信息輸入算法，確定具有相似含義的語句簇，這一過程就是所謂的“語義聚類”。語義聚類讓我們可以考慮優(yōu)先使用哪些短語來訓(xùn)練聊天機(jī)器人，來理解并進(jìn)行對話（NLP訓(xùn)練），哪些問題應(yīng)該通過在問答服務(wù)中進(jìn)行訓(xùn)練，以命令和響應(yīng)的方式提供靜態(tài)的答案，在這種情況下，可以使用微軟的問答機(jī)器人。

潛在用戶有哪些？

UX /會話設(shè)計(jì)師。這種分析可以實(shí)現(xiàn)以用戶為中心的設(shè)計(jì)，因?yàn)榭梢缘弥枰獦?gòu)建哪些用戶路徑。我們的目標(biāo)是提供問題的在當(dāng)前文本情景下的答案，這類問題是聊天機(jī)器人無法正確處理的。

機(jī)器人訓(xùn)練師。他們現(xiàn)在知道哪些意圖是最重要的。訓(xùn)練師可以優(yōu)先訓(xùn)練機(jī)器人，以了解它們最常被問及的主題的不同短語。

客戶。我們提供關(guān)于對話的概述摘要，內(nèi)容包含主要數(shù)據(jù)點(diǎn)、對話中提及的主題類型和頻率，消息數(shù)量等。

這個(gè)過程具體分哪幾步？下面用“門外漢”式的方式解釋一下。

1、從客戶或第三方聊天機(jī)器人供應(yīng)商出獲得會話腳本。

2、運(yùn)行算法，通過機(jī)器學(xué)習(xí)模型進(jìn)行對話，并處理每個(gè)對話中的句子，按語義對句子進(jìn)行分類。

3、然后運(yùn)行另一種算法，將這些按預(yù)測具有相似“意圖”的句子分成組。注意，這時(shí)的同一聚類中可能包含彼此不完全相關(guān)的句子。這些句子中只是包含類似的信息。

4、接著人工瀏覽這些句子，并對句子集群進(jìn)行分析，向聚類內(nèi)容分配標(biāo)簽，得到一個(gè)單獨(dú)的“意圖”列表。

集群與意圖：這里需要對這兩個(gè)概念作一個(gè)區(qū)分。集群是一組具有相似語義的句子。比如可以確定10個(gè)句子，內(nèi)容似乎都是關(guān)于購買房產(chǎn)的。但是因?yàn)檫@是一種無監(jiān)督的機(jī)器學(xué)習(xí)算法，沒有人類背景，確定某個(gè)集群是否可以轉(zhuǎn)化為“意圖”必須要人類進(jìn)行驗(yàn)證。

5、設(shè)計(jì)師利用這些“意圖”和常見問題設(shè)計(jì)工作流程，以便能夠順利回答人類提出的問題，或滿足人們的請求。

我們對客戶提出問題和要求進(jìn)行了調(diào)查，內(nèi)容包括：

客戶詢問的主要主題和每個(gè)主題中的消息數(shù)量

在每個(gè)主題中子話題的類型

前10個(gè)主題中的消息頻率和分布情況

關(guān)于客服人員在線或不在線時(shí)的對話主題的比較

結(jié)果發(fā)現(xiàn)，在最熱門10個(gè)消息主題中，有一半與房價(jià)、設(shè)施和地理位置有關(guān)。

這三個(gè)主題占到用戶查詢在線客服機(jī)器人消息總量的一半。

最冷門的話題是關(guān)于停車位的，只占查詢信息總量的3%。

算法的工作原理

算法從對話中獲取句子并進(jìn)行向量化。在更高一級，向量化的句子對詞語之間的關(guān)系進(jìn)行分配，比如算法會確定，素食者吃蔬菜。

然后再使用另一種基于向量的算法，將句子分組為具有相似語義的群集。

面臨的挑戰(zhàn)

要準(zhǔn)確地將意圖分配給對應(yīng)的信息集群需要人工操作。當(dāng)集群數(shù)量很多時(shí)，對團(tuán)隊(duì)而言就是個(gè)很繁瑣的任務(wù)。而且，將90個(gè)常見問題整理成能夠反映用戶意圖的工作流程，需要多元化背景團(tuán)隊(duì)的密切合作。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6673

瀏覽量
105383
機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
213

文章
29504

瀏覽量
211609
nlp

nlp

+關(guān)注

關(guān)注
1

文章
490

瀏覽量
22488

原文標(biāo)題：如何用20萬條客服咨詢消息“喂”出定制化聊天機(jī)器人

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

如何利用20萬條客戶咨詢消息，打造一款功能定制化的自動聊天應(yīng)答機(jī)器人？

評論