當前位置:成語大全網 - 書法字典 - CTR(1):ij Cai 2020-深度反饋推薦網絡

CTR(1):ij Cai 2020-深度反饋推薦網絡

顯性反饋和隱性反饋都可以反映用戶對項目的看法,這對於學習用戶的偏好非常重要。然而,目前大多數推薦算法只關註隱式正反饋(例如點擊),而忽略了其他包含信息的用戶行為。

本文旨在聯合考慮顯性/隱性和正/負反饋,以學習用戶對推薦任務的無偏偏好/(更準確的偏好建模)。具體而言,提出了壹種新的深度反饋網絡(DFN)模型,用於對點擊、不點擊和不喜歡等用戶行為進行建模。

DFN有壹個內部反饋交互組件,用於捕獲個體行為之間的細粒度交互。還有壹個外部反饋交互組件,它使用準確但相對罕見的反饋(點擊/不喜歡)從豐富但嘈雜的反饋中提取有用的信息(不是點擊)。

在實驗中,對壹個真實的推薦系統——看看數百萬用戶使用的微信——進行了離線和在線評估,驗證了DFN的有效性和魯棒性。

諸如用戶-項目交互之類的信息可以分為兩種類型,即顯式反饋和隱式反饋。

近年來,推薦系統通常將個性化推薦視為點擊率預測任務。因此,自然地,大多數推薦算法主要關註隱式正反饋,例如點擊,這在實踐中很容易收集。這些模型直接通過點擊行為和以點擊率為導向的目標進行優化,這將不可避免地導致以下問題:

這兩段充分而準確地表達了兩個關鍵問題,指出了負反饋和顯性反饋的價值,這也是本文的兩個觀點。好論文讀起來很舒服~

多個顯性/隱性和正面/負面反饋可以相互補充,反映用戶的良好推薦。目前,負反饋往往被忽視或僅限於顯性反饋,而顯性反饋是準確而罕見的。

壹些工作認為不點擊或錯過行為是隱性負反饋,以放大負反饋信息。然而,這種假設帶來了很多噪音,大大限制了推薦效果。因為這些隱藏的負面反饋可能是由除了不喜歡以外的各種原因引起的。更多的噪音

本文的重點是通過使用不同類型的顯式/隱式和正面/負面反饋來提高推薦性能。針對傳統推薦方法存在的問題,提出了壹種新的深度反饋網絡(DFN),該網絡在基於深度模型的推薦中綜合考慮了多種反饋及其相互作用。圖1顯示了DFN中使用的不同類型的反饋,包括隱式正反饋(例如點擊)、隱式負反饋(例如不點擊)和顯式負反饋(例如不喜歡)。

具體來說,我們首先為每個反饋序列中的目標項和行為構建壹個轉換器,以捕獲內部行為級別的交互。

接下來,我們使用高質量但相對罕見的點擊和不喜歡的行為(顯式反饋)來減少豐富但嘈雜的無點擊行為與外部反饋水平之間的交互。這些提取的反饋特征與其他特征相結合,然後輸入到包括Wide、FM和Deep組件的特征交互模塊中。

DFN的主要優勢在於它成功地結合了多種反饋信息,學習了用戶無偏見的積極偏好(喜歡)和消極偏好(不喜歡),並解決了反饋信息的質量和數量困境。

在真實推薦系統上建立DFN模型,並從用戶的歷史行為中收集三種反饋:

深度反饋網絡DFN主要由兩部分組成:深度反饋交互模塊和特征交互模塊。

最後,實現用於特征聚合的Wide、FM和Deep組件。特征交互模塊的輸出反饋到全連接層和softmax層,並基於正負樣本之間的損失對模型進行優化。

其層次可分為內部交互模塊和外部交互模塊:

以點擊序列為例:預測/目標項的嵌入和點擊序列的嵌入形成輸入矩陣;

隱性負反饋就夠了,但很吵。壹般來說,不點擊行為似乎暗示著負面反饋,但暴露給用戶的項目是由壹些策略精心選擇的,其中可能還包含粗粒度的用戶興趣。外部反饋交互組件旨在根據點擊和不喜歡行為中的強反饋信息來區分用戶真正喜歡和不喜歡的點擊行為。具體來說,我們進行了兩種原始的註意機制,其中在fc和fd中嵌入了隱式正反饋和顯式負反饋作為從無點擊序列中提取正面和負面偏好的指導:

在特征交互中,我們將提取的反饋特征與其他特征相結合,包括用戶畫像、物品特征和推薦上下文特征。

我們將這些稀疏特征分為m個字段,包括連續字段(例如年齡)和類別字段(例如位置)。所有字段都表示為單個熱嵌入。查找表用於為所有字段生成密集特征嵌入。然後使用寬、調頻和德普分量進行特征組合。(壹般架構)

廣泛的

特征的線性組合:

深的

簡單的MLP操作:

訓練集根據三種反饋類型分為三個部分。

註意這裏的比例設置,顯性負反饋占比很大。

該工作在充分分析數據反饋的基礎上,借助自身產生式系統收集和使用顯性負反饋和隱性正反饋,並利用這兩類重要信息對帶有噪聲的隱性負反饋進行調整,基於註意力架構從隱性負反饋中分離出更多有價值的特征。在實際系統中具有良好的性能。其中註意感設計可以在相關比賽中嘗試,值得借鑒。

如果妳覺得有用,請喜歡並關註它。如果妳對推薦感興趣,歡迎評論區/私信交流~ ~ ~