本文主要從文本匹配、歷史行為偏好建模以及混合推薦三個(gè)角度介紹了當(dāng)前人崗匹配中的主要模型與方法。
引言:隨著互聯(lián)網(wǎng)產(chǎn)業(yè)快速發(fā)展,網(wǎng)絡(luò)招聘已經(jīng)成為一種普遍的求職服務(wù)并從中衍生出了人崗匹配(Person-Job Fit,PJF)任務(wù)。與傳統(tǒng)僅需關(guān)注用戶興趣偏好的商品或電影推薦不同,PJF這種雙邊場(chǎng)景下的推薦雙方都存在主動(dòng)行為及自身偏好,如求職者有自身的目標(biāo)職位,工作職位也有對(duì)求職者的能力要求。正因這種雙邊建模需求,PJF涌現(xiàn)出了各種各樣與傳統(tǒng)推薦不同的模型與方法,其中,求職者簡(jiǎn)歷與職位描述之間的文本匹配和從雙方歷史交互行為提取偏好信息成為了大家關(guān)注的重點(diǎn)。本文將主要從文本匹配、歷史行為偏好建模以及混合推薦方法三個(gè)角度向大家介紹當(dāng)前PJF中的主要模型與方法。歡迎大家批評(píng)指正,相互交流。
基于文本匹配的PJF
基于文本匹配的方法認(rèn)為求職者與職位是否匹配主要依賴于求職者簡(jiǎn)歷中的技能或工作經(jīng)歷與職位要求描述之間是否相對(duì)應(yīng),因此這種方法往往將PJF問(wèn)題建模為一個(gè)簡(jiǎn)歷與職位描述之間的文本匹配問(wèn)題。早期的文本匹配方法中人們以一種無(wú)監(jiān)督的方式創(chuàng)建文本的向量表示并計(jì)算相似度,如許多研究者使用具有TF-IDF權(quán)重的詞袋,還有一些則基于Word2Vec方法。隨著自然語(yǔ)言處理技術(shù)(NLP)的快速發(fā)展,CNN、RNN乃至Transformer等新型技術(shù)也開始應(yīng)用于PJF問(wèn)題并逐漸成為主流。本文選擇了一小部分工作進(jìn)行簡(jiǎn)單介紹。
【PJFNN】Person-Job Fit: Adapting the Right Talent for the Right Job with Joint Representation Learning (TMIS 2018)
https://dl.acm.org/doi/abs/10.1145/3234465
本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的模型——PJFNN,PJFNN使用二分神經(jīng)網(wǎng)絡(luò)架構(gòu),對(duì)與職位要求描述以及求職者簡(jiǎn)歷中的工作經(jīng)歷分別使用兩個(gè)類似的CNN進(jìn)行編碼,它們之間唯一的不同是最后的pooling方法,職位要求使用Max-pooling,而求職者工作經(jīng)歷使用Mean-pooling。作者認(rèn)為CNN最終輸出的潛在表示的每個(gè)維度都可以反映專業(yè)知識(shí)的某些方面,職位的要求描述往往格式良好,不同要求項(xiàng)目通常獨(dú)立的代表專業(yè)知識(shí)的不同方面。相比之下,求職者的每一項(xiàng)工作經(jīng)歷往往蘊(yùn)含多種專業(yè)知識(shí),因此更需要潛在表示之間的充分混合。
【APJFNN】Enhancing Person-Job Fit for Talent Recruitment: An Ability-aware Neural Network Approach (SIGIR 2018)
https://dl.acm.org/doi/abs/10.1145/3209978.3210025
與PJFNN基于CNN不同,本文中作者使用了LSTM+attention的方式進(jìn)行求職者工作經(jīng)歷與職位要求的編碼,在編碼過(guò)程中兩個(gè)部分的編碼表示也不再相互獨(dú)立,而是通過(guò)attention使得求職者工作經(jīng)歷與職位要求之間產(chǎn)生了充分的交互。整個(gè)模型的結(jié)構(gòu)如下圖:
作者首先基于雙向LSTM完成了單詞級(jí)的表示(圖中Word-level Representation),再通過(guò)兩次attention完成了對(duì)職位要求的句子級(jí)表示以及全局表示(圖中Job Requirement Representation),整個(gè)職位要求的編碼表示過(guò)程與求職者部分獨(dú)立。而對(duì)于求職者工作經(jīng)歷的編碼則與職位要求息息相關(guān),作者認(rèn)為對(duì)于工作經(jīng)歷的編碼過(guò)程應(yīng)提取出與當(dāng)前職位要求相關(guān)的信息,即工作經(jīng)歷中的某一項(xiàng)與當(dāng)前職位的哪一個(gè)要求相匹配是關(guān)注的重點(diǎn),因此在句子級(jí)以及全局表示的attention中都結(jié)合了職位要求表示完成(圖中Candidate Experience Representation)。
【IPJF】Towards Effective and Interpretable Person-Job Fitting (CIKM 2019)
https://dl.acm.org/doi/abs/10.1145/3357384.3357949
本文的亮點(diǎn)在于不僅僅考慮到了求職者與職位之間的雙向匹配,還結(jié)合了求職者和職位雙方各自的獨(dú)立意圖,提出了一個(gè)多任務(wù)框架。此外,作者不再將正例之外的所有目標(biāo)都視為負(fù)例,而是將數(shù)據(jù)分為三種。以求職者為例,達(dá)成面試的職位為正例;求職者提出面試申請(qǐng)但遭到拒絕的職位為中性樣本,代表單向意圖;求職者沒(méi)有提出面試申請(qǐng)的職位為負(fù)例。
【SCLPJF】Domain Adaptation for Person-Job Fit with Transferable Deep Global Match Network (EMNLP 2019)
https://aclanthology.org/D19-1487/
本文作者注意到了人崗匹配中帶標(biāo)簽數(shù)據(jù)的稀缺問(wèn)題,并希望通過(guò)領(lǐng)域適應(yīng)(Domain Adaptation)的方法緩解這個(gè)問(wèn)題。例如在招聘市場(chǎng),科技領(lǐng)域的職位往往占比較大,數(shù)據(jù)較多,而設(shè)計(jì)相關(guān)的職位和數(shù)據(jù)較少,作者希望模型可以從具有足夠標(biāo)記數(shù)據(jù)的源域中獲得的知識(shí)和信息來(lái)提高具有有限或很少標(biāo)記數(shù)據(jù)的目標(biāo)域中的預(yù)測(cè)性能。
本文提出的模型主要分為Hierarchical Attention-based RNN Encoder和Global Match Representation兩部分。前者基于雙向GRU(BiGRU)對(duì)求職者簡(jiǎn)歷和職位發(fā)布信息進(jìn)行編碼,并使用attention完成從單詞級(jí)到句子級(jí)以及從句子級(jí)到全局表示的聚合,最終獲得職位發(fā)布表示和簡(jiǎn)歷表示。后者通過(guò)CNN建模職位發(fā)布與求職者簡(jiǎn)歷之間的匹配信息。
為了實(shí)現(xiàn)模型在不同領(lǐng)域之間的可遷移性,作者首先使用文本領(lǐng)域自適應(yīng)中的經(jīng)典SCL算法得到相比于原始句子級(jí)表示更具可遷移性的SCL表示。其次將Global Match Representation中的匹配權(quán)重矩陣分解為兩個(gè)矩陣的乘積,分別是多領(lǐng)域共享部分A和依托于特定領(lǐng)域的B;最后將卷積網(wǎng)絡(luò)分為源域和目標(biāo)域兩部分實(shí)現(xiàn)了可遷移的匹配信息提取。
基于歷史行為偏好的PJF
不同于基于文本匹配的方法,基于歷史行為偏好的模型更注重于從求職者與職位雙方的交互歷史記錄中提取出各自的偏好信息。雖然很多模型還會(huì)根據(jù)求職者簡(jiǎn)歷與職位描述生成embedding,但不再通過(guò)各種復(fù)雜的方法進(jìn)行簡(jiǎn)歷文本與職位描述文本之間的匹配交互。
【DPGNN】Modeling Two-Way Selection Preference for Person-Job Fit (RecSys 2022)
https://dl.acm.org/doi/abs/10.1145/3523227.3546752
本篇文章獲得了ACM RecSys 2022 Best Student Paper Runner-up。
本文提出了一種有別于單向選擇推薦以及整體文本匹配建模的雙視角圖表示學(xué)習(xí)方法DPGNN。在雙視角交互圖中,作者為每個(gè)求職者(或職位)建模兩個(gè)不同的節(jié)點(diǎn),一個(gè)捕捉自己選擇職位(或求職者)的偏好,是一種主動(dòng)表示,另一個(gè)是被動(dòng)表示,用于與對(duì)方的偏好進(jìn)行匹配。作者使用BERT對(duì)求職者簡(jiǎn)歷和職位描述進(jìn)行編碼,結(jié)合基于ID的embedding表示對(duì)雙視角交互圖中的節(jié)點(diǎn)進(jìn)行初始化,之后使用GCN進(jìn)行混合偏好傳播,區(qū)別于原始的GCN,DPGNN為單向偏好邊和雙向匹配邊的信息傳播賦予了不同的權(quán)重。在最終匹配預(yù)測(cè)上,DPGNN結(jié)合了兩個(gè)視角的意圖(求職者選擇職位和職位選擇求職者)。此外,作者還針對(duì)性的設(shè)計(jì)了一種四元組損失,為每一對(duì)求職者—職位正例分別采樣一個(gè)負(fù)例求職者和一個(gè)負(fù)例職位。
【JRMPM】Interview Choice Reveals Your Preference on the Market: To Improve Job-Resume Matching through Proling Memories (KDD 2019)
https://dl.acm.org/doi/abs/10.1145/3292500.3330963
本文中作者提出了一種結(jié)合歷史偏好的匹配網(wǎng)絡(luò)(JRMPM),關(guān)鍵思想是從職位或求職者歷史交互目標(biāo)的文本信息中提取潛在偏好。具體來(lái)說(shuō),作者提出了一種基于記憶模塊的偏好更新機(jī)制,以職位的偏好為例,JRMPM模型通過(guò)一個(gè)記憶矩陣M記錄職位的句子級(jí)潛在偏好,并根據(jù)時(shí)間順序,一步步根據(jù)職位歷史交互求職者的簡(jiǎn)歷信息更新記憶矩陣M。同理,對(duì)于求職者來(lái)說(shuō)則是根據(jù)其歷史交互職位的描述信息更新記憶矩陣。最終,通過(guò)Max-pooling將求職者與職位的句子級(jí)偏好記憶矩陣轉(zhuǎn)換為全局偏好向量并輸入MLP得到匹配預(yù)測(cè)結(jié)果。
【DPJF-MBS】Beyond Matching: Modeling Two-Sided Multi-Behavioral Sequences for Dynamic Person-Job Fit (DASFAA 2021)
https://link.springer.com/chapter/10.1007/978-3-030-73197-7_24
本文中,作者將關(guān)注點(diǎn)落到了求職者和招聘職位雙方在實(shí)現(xiàn)匹配之前產(chǎn)生的豐富的輔助行為,如點(diǎn)擊、申請(qǐng)、聊天等,不同于在PJF問(wèn)題中非常稀疏的匹配行為,這些輔助行為往往更為密集且蘊(yùn)含豐富的偏好信息。
整個(gè)模型(DPJF-MBS)分為兩個(gè)部分,Write Operation根據(jù)時(shí)間順序?qū)⒍喾N行為信息更新于記憶矩陣M中,Read Operation則從記憶矩陣中讀出不同行為的偏好信息。具體來(lái)說(shuō),模型包含多個(gè)用戶共享的全局鍵矩陣{,,,, },在Write Operation過(guò)程中,將當(dāng)前行為對(duì)應(yīng)的全局鍵矩陣當(dāng)作key計(jì)算attention權(quán)重用于更新偏好記憶矩陣M,在Read Operation過(guò)程中也將根據(jù)不同的全局鍵矩陣計(jì)算不同的行為偏好權(quán)重,并根據(jù)權(quán)重聚合記憶矩陣M生成多個(gè)行為偏好向量。此外,作者還敏銳的注意到了多種行為之間的級(jí)聯(lián)關(guān)系,例如在達(dá)成匹配的前提是經(jīng)歷過(guò)點(diǎn)擊、申請(qǐng)等前置行為,因此最終的匹配預(yù)測(cè)是一個(gè)級(jí)聯(lián)過(guò)程,對(duì)于匹配的判斷需要前置行為的輸出作為輸入。
混合推薦方法
結(jié)合文本匹配與歷史行為偏好建模的PJF方法也是研究者們的研究熱點(diǎn),這些方法往往是將從雙方文本中提取的顯式偏好與從歷史行為中獲得的隱式偏好相結(jié)合完成推薦。下面筆者選擇了一部分工作進(jìn)行介紹。
【PJFFF】Learning Effective Representations for Person-Job Fit by Feature Fusion (CIKM 2020)
https://dl.acm.org/doi/abs/10.1145/3340531.3412717
本文中提出了一種結(jié)合特征融合、文本匹配以及歷史行為偏好建模的PJF模型,整個(gè)模型分為兩個(gè)部分,一部分以求職者簡(jiǎn)歷和職位描述中的顯式信息為輸入,另一部分建模雙方的歷史行為序列,建模隱式偏好特征。
在簡(jiǎn)歷或職位描述中除了技能描述、職位要求等文本信息外,還有一些可以通過(guò)NLP技術(shù)提取出的語(yǔ)義實(shí)體,如年齡、性格、大學(xué)等等,本文作者將這些實(shí)體也作為顯式信息輸入,通過(guò)DeepFM模型完成建模,對(duì)于文本信息則使用CNN得到向量表示,最終兩種顯示特征concat作為第一部分的輸出。
模型第二部分則通過(guò)兩個(gè)LSTM對(duì)求職者和職位的歷史行為進(jìn)行建模,用于提取雙方的隱式特征,模型輸入是第一部分獲得的顯式特征與匹配結(jié)果onehot向量的拼接。最終的預(yù)測(cè)過(guò)程中首先將雙方的顯式特征與隱式特征拼接,之后通過(guò)內(nèi)積得到匹配得分。
【PJFCANN】Person-job fit estimation from candidate profile and related recruitment history with Co-Attention Neural Networks (Neurocomputing 2022)
https://www.sciencedirect.com/science/article/pii/S0925231222007299
本文將文本匹配與從歷史交互記錄中提取的關(guān)系圖相結(jié)合。文本匹配部分通過(guò)mashRNN實(shí)現(xiàn)了單詞級(jí)編碼,之后通過(guò)co-attention完成了簡(jiǎn)歷與職位描述間的匹配交互與句子級(jí)編碼,最終基于另一個(gè)簡(jiǎn)單的attention獲得文本的本地(local)編碼向量。此外,作者根據(jù)歷史交互記錄建立了職位—職位和求職者—求職者之間的關(guān)系圖,以職位與職位之間的關(guān)系圖為例,假設(shè)我們需要預(yù)測(cè)的job—resume對(duì)為 (J, R),若另一職位 J' 與當(dāng)前簡(jiǎn)歷 R 也產(chǎn)生過(guò)交互則在 J 與 J' 之間建立一條邊,這條邊的權(quán)重通過(guò)兩個(gè)職位描述信息的相似度得到。獲得兩個(gè)關(guān)系圖后通過(guò)GNN得到圖中各個(gè)節(jié)點(diǎn)的表示,并基于attention機(jī)制獲得職位和求職者簡(jiǎn)歷的全局(global)表示。最終的匹配預(yù)測(cè)同樣基于MLP實(shí)現(xiàn)。
其他
除了上述幾類方法外,還有很多其他方法,例如基于特征工程的傳統(tǒng)機(jī)器學(xué)習(xí)方法,基于單邊偏好建模的職位推薦,靈活運(yùn)用用戶搜索歷史或其他輔助數(shù)據(jù)的方法等。
The Influence of Feature Selection on Job Clustering for an E-recruitment Recommender System (2020):基于特征選擇與提取。
A Session-based Job Recommendation System Combining Area Knowledge and Interest Graph Neural Networks (2020):加入領(lǐng)域知識(shí)增強(qiáng)的單邊序列推薦。
Using autoencoders for session?based job recommendations (2020):基于autoencoder的單邊序列推薦。
Learning to Match Jobs with Resumes from Sparse Interaction Data using Multi-View Co-Teaching Network (2020):為了緩解PJF任務(wù)中交互數(shù)據(jù)稀疏且嘈雜的問(wèn)題,作者提出了一種基于稀疏交互數(shù)據(jù)的新型多視圖協(xié)同教學(xué)網(wǎng)絡(luò),結(jié)合基于文本匹配的模型和基于關(guān)系的模型,兩個(gè)部分采用協(xié)同教學(xué)機(jī)制來(lái)減少噪聲對(duì)訓(xùn)練數(shù)據(jù)的影響。核心思想是讓兩個(gè)組件通過(guò)選擇更可靠的訓(xùn)練實(shí)例來(lái)相互幫助。
Leveraging Search History for Improving Person-Job Fit (2022):不再局限于求職者與職位之間的歷史匹配記錄,而是結(jié)合了求職者的搜索歷史信息進(jìn)行偏好建模。
Job Recommendation Based on Extracted Skill Embeddings (2022):從求職者簡(jiǎn)歷與職位要求描述中提取技能短語(yǔ),使用Word2Vec編碼后計(jì)算相似度。
小結(jié)
本文從文本匹配、歷史行為偏好建模以及混合推薦方法三個(gè)角度向大家介紹了當(dāng)前人崗匹配中的主要模型與方法,可以看到,單純基于文本匹配的人崗匹配方法在最新的研究中較少出現(xiàn),隨著BERT等系列大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的快速涌現(xiàn),文本匹配任務(wù)也不再局限于簡(jiǎn)單的監(jiān)督訓(xùn)練,最近的很多PJF工作中都將BERT作為一個(gè)基線且表現(xiàn)出不俗的性能,因此結(jié)合對(duì)歷史行為偏好的建模是當(dāng)前人崗匹配研究的主要方向。但同時(shí)人崗匹配的實(shí)際場(chǎng)景使得交互數(shù)據(jù)非常稀疏,如何解決數(shù)據(jù)稀疏也是當(dāng)前的一大研究熱點(diǎn)。
審核編輯 :李倩
-
模型
+關(guān)注
關(guān)注
1文章
3500瀏覽量
50101 -
cnn
+關(guān)注
關(guān)注
3文章
354瀏覽量
22665 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14051
原文標(biāo)題:一文速覽人崗匹配領(lǐng)域研究進(jìn)展
文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
升降速曲線對(duì)直線電機(jī)系統(tǒng)性能影響的研究
氧化鎵射頻器件研究進(jìn)展

一文詳解水下機(jī)器人的產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢(shì)分

汽車焊接機(jī)器人的智能控制系統(tǒng)研究進(jìn)展
香港科技大學(xué)陳敬課題組揭示GaN與SiC材料的最新研究進(jìn)展

二極管泵浦高能激光的研究進(jìn)展(1)

清華大學(xué):軟體機(jī)器人柔性傳感技術(shù)最新研究進(jìn)展

石墨烯鉛蓄電池研究進(jìn)展、優(yōu)勢(shì)、挑戰(zhàn)及未來(lái)方向
中山大學(xué):在柔性觸覺(jué)傳感電子皮膚研究進(jìn)展

高能點(diǎn)焊電源技術(shù)在現(xiàn)代工業(yè)制造中的應(yīng)用與研究進(jìn)展

上海光機(jī)所在多路超短脈沖時(shí)空同步測(cè)量方面取得研究進(jìn)展

AI大模型的最新研究進(jìn)展
清華大學(xué):軟體機(jī)器人柔性傳感技術(shù)最新研究進(jìn)展

導(dǎo)熱紙(膜)的研究進(jìn)展 | 晟鵬技術(shù)突破導(dǎo)熱芳綸紙

評(píng)論