13
2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集 基於情境感知及模糊理論的智慧型推薦系統 -以交談平台的廣告推薦為例 摘要 智慧型推薦系統在許多科技應用領域都 扮演著相當重要的角色,然而,要達到有效的 推薦,必須有充分的資訊與良好的推論模型, 所以,本研究提出以情境感知及模糊理論為基 礎的智慧型推薦系統,希望藉由情境感知的技 術來收集並整理出所需的資訊,並藉由模糊理 論的推理法則,將專家的經驗融入於推理引擎 之中,如此可以達到有效的推薦。 本研究以交談平台的廣告推薦為例,實作 出一個具有個人化廣告特色的交談平台,我們 藉由使用者的交談內容來獲取短期情境資 訊,以使用者的個人化資訊為長期情境資訊, 並以這些情境資訊為基礎,藉由模糊推論引擎 找出符合使用者需求的廣告,最後再進行推 薦,如此便能更吸引使用者點閱廣告,也能幫 助廣告主獲得更良好的廣告成效。 關鍵詞:情境感知、模糊理論、智慧型推薦系 統、廣告推薦、交談平台。 Abstract The Smart Recommender System often acts as a key role in many application fields of technology. Hence, to obtain an effective recommendation, both sufficient information and good inference model are very important. For this reason, we propose a smart recommender system based on context-awareness and fuzzy set theory. We collect the needed information by using the technique of context-awareness. And then, the recommendation can be effective by using the inference rules which integrate the experiences of experts. We establish a conversation platform of advertisement recommendation to be an example of our proposed smart recommender system. We extract the conversation contents of users to obtain short-term contextual information and use the personal information of users to be long-term contextual information. And, based on these contextual information which is more close to the interests of users, the more interested advertise of user can be recommended by the fuzzy inference rules. Finally, the best advertise is recommended to user. Thus, the advertisement can attract users to click effectively and the advertiser can acquire more effective advertising. Keywords: Fuzzy Set Theory, Smart Recommender System, Advertisement Recommendation, Conversation Platform. 1. 前言 隨著網路的發達,人們藉由網際網路就能 夠找到許多資源,但是過多的資源反而讓使用 者感到困擾,因為使用者只想快速且直接的獲 得符合需求的資源,所以,如何發展一個具個 人化特色的推薦系統一直是一個相當熱門的 議題;但是推薦系統的發展至今普遍還是以內 容式及協同式兩種方法為主[18][19][12][11]所根據的資訊也往往偏向使用者長期以來的 嗜好,因此容易忽略使用者當前較有興趣的短 期資訊,故本研究提出結合情境感知和模糊理 論的推薦方法。 我們同時考量使用者的短期偏好和長期 偏好,我們所指的短期偏好指的是當下的情 境,它是比較即時性的,並且會隨著使用者所 做的事情或是所處環境而有所改變,例如使用 者在瀏覽網頁的時候可能會從購物網站轉換 至音樂網站,這代表著瀏覽網頁的過程中情境 會一直不斷的改變,因此所包含的情境資訊也 會有所差異,例如正在閱讀的文章、正在討論 的話題、正在瀏覽的文章等;長期偏好則是指 使用者長期以來的習性與興趣,例如嗜好、交 陳榮昌 蕭朝維 朝陽科技大學資訊管理系 副教授 朝陽科技大學資訊管理系 研究生 e-mail[email protected] e-mail[email protected] AIT / NCWIA 2012

基於情境感知及模糊理論的智慧型推薦系統 以交談平台的廣告推薦 …rcchen/research/html/ms/s9914617-weichao/AIT2012-106.pdf · 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    基於情境感知及模糊理論的智慧型推薦系統 -以交談平台的廣告推薦為例

    摘要

    智慧型推薦系統在許多科技應用領域都

    扮演著相當重要的角色,然而,要達到有效的

    推薦,必須有充分的資訊與良好的推論模型,

    所以,本研究提出以情境感知及模糊理論為基

    礎的智慧型推薦系統,希望藉由情境感知的技

    術來收集並整理出所需的資訊,並藉由模糊理

    論的推理法則,將專家的經驗融入於推理引擎

    之中,如此可以達到有效的推薦。

    本研究以交談平台的廣告推薦為例,實作

    出一個具有個人化廣告特色的交談平台,我們

    藉由使用者的交談內容來獲取短期情境資

    訊,以使用者的個人化資訊為長期情境資訊,

    並以這些情境資訊為基礎,藉由模糊推論引擎

    找出符合使用者需求的廣告,最後再進行推

    薦,如此便能更吸引使用者點閱廣告,也能幫

    助廣告主獲得更良好的廣告成效。

    關鍵詞:情境感知、模糊理論、智慧型推薦系

    統、廣告推薦、交談平台。

    Abstract The Smart Recommender System often

    acts as a key role in many application fields of technology. Hence, to obtain an effective recommendation, both sufficient information and good inference model are very important. For this reason, we propose a smart recommender system based on context-awareness and fuzzy set theory. We collect the needed information by using the technique of context-awareness. And then, the recommendation can be effective by using the inference rules which integrate the experiences of experts.

    We establish a conversation platform of advertisement recommendation to be an example of our proposed smart recommender system. We extract the conversation contents

    of users to obtain short-term contextual information and use the personal information of users to be long-term contextual information. And, based on these contextual information which is more close to the interests of users, the more interested advertise of user can be recommended by the fuzzy inference rules. Finally, the best advertise is recommended to user. Thus, the advertisement can attract users to click effectively and the advertiser can acquire more effective advertising. Keywords: Fuzzy Set Theory, Smart Recommender System, Advertisement Recommendation, Conversation Platform.

    1. 前言 隨著網路的發達,人們藉由網際網路就能

    夠找到許多資源,但是過多的資源反而讓使用

    者感到困擾,因為使用者只想快速且直接的獲

    得符合需求的資源,所以,如何發展一個具個

    人化特色的推薦系統一直是一個相當熱門的

    議題;但是推薦系統的發展至今普遍還是以內

    容式及協同式兩種方法為主[18][19][12][11],所根據的資訊也往往偏向使用者長期以來的

    嗜好,因此容易忽略使用者當前較有興趣的短

    期資訊,故本研究提出結合情境感知和模糊理

    論的推薦方法。 我們同時考量使用者的短期偏好和長期

    偏好,我們所指的短期偏好指的是當下的情

    境,它是比較即時性的,並且會隨著使用者所

    做的事情或是所處環境而有所改變,例如使用

    者在瀏覽網頁的時候可能會從購物網站轉換

    至音樂網站,這代表著瀏覽網頁的過程中情境

    會一直不斷的改變,因此所包含的情境資訊也

    會有所差異,例如正在閱讀的文章、正在討論

    的話題、正在瀏覽的文章等;長期偏好則是指

    使用者長期以來的習性與興趣,例如嗜好、交

    陳榮昌 蕭朝維 朝陽科技大學資訊管理系

    副教授 朝陽科技大學資訊管理系

    研究生 e-mail:[email protected] e-mail:[email protected]

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    談過的話題、行為、流覽路徑、購買頻率以及

    瀏覽時間等等,這些情境資訊將有助於推薦系

    統在推薦上的分析,另外我們也將透過知識本

    體的語意描述特性找出相關的情境資訊,以改

    善情境資訊不足的情形,最後透過模糊推論引

    擎對每個廣告打分數,並且經由分數門檻值篩

    選出分數較高的廣告推薦給使用者。

    圖 1 傳統交談平台上的廣告

    圖片來源:豆豆聊天室[31]

    在本研究裡,我們將以交談平台上的廣告

    推薦為例來說明本研究的應用。目前在交談平

    台上的廣告大多是以隨機推薦的方法來推薦

    廣告,圖 1的交談平台為例[31],上面所放置的網路廣告都是隨機呈現的,如此一來將會產

    生推薦出來的廣告與使用者興趣不符的情

    形,這樣不僅可能導致使用者感到厭煩,也連

    帶使得廣告點閱率偏低,企業主無法從中獲得

    良好的廣告效益。雖然目前的網路廣告推薦系

    統已經有許多學者提出個人化的推薦方法,例

    如 Huang 等 學 者 (2008) 提 出 利 用 Yahoo! Directory作為分類樹將使用者們的交談議題進行分類並且應用到廣告的推薦上[13],但是此研究的重點並不是在廣告的推薦上,而是在探

    討分類樹節點延伸的設置以及詞性的影響程

    度等,而且只能針對英文的交談議題來進行推

    薦。Kazienko和Adamski兩位學者(2007)提出以網頁行為(Web usage)與網頁內容探勘(Web mining)來實作出ㄧ個具有個人化特性的網頁廣告推薦系統「AdROSA」[17],這個系統能夠隨著使用者所瀏覽的網頁的不同來推薦個

    人化的廣告,此研究的貢獻主要是提出ㄧ個不

    需要詢問使用者個人資料,系統就能夠自動分

    析使用者的特性然後進行個人化推薦的方

    法,但是此方法只能用在瀏覽網頁上,並且只

    適用於英文的網頁內容。Jang等學者(2007)提出利用基於知識本體的關鍵字管理系統來幫

    助廣告的推薦,此推薦方法主要是藉由TF-IDF計算關鍵字的權重值,然後再透過Apriori演算

    法找出關鍵字之間的關聯性[16],此方法只有考慮到關鍵字的因素而忽略掉了其他相關因

    素的影響,並且並不適於在中文廣告的推薦

    上。

    目前處理中文的個人化廣告推薦系統還

    有許多改進的空間,因為中文字的內容在分析

    上比較困難且複雜,所以我們將此方法應用到

    中文廣告的推薦上,利用情境感知的技術來收

    集並整理出所需的資訊,並且藉由模糊理論的

    推理法則,找到使用者更有興趣的廣告,如此

    可以達到有效的推薦。

    2. 文獻回顧

    2.1 情境感知(Contextual-Awareness)

    情境感知最早可追溯於 1994 年由Schilit 和 Theimer(1994)兩位學所提出,他們在研究裡指出使用者所處的區域以及附近的資源都

    是屬於「情境」的一部分[27],此外,學者Dey(2001)對「情境」也提出了更進ㄧ步的解釋,他們認為情境是任何可以用來描述實體環

    境特徵的資訊,所謂的實體指的是人,位置或

    是資源,這些資訊都可以當作是與使用者相關

    的資訊[10],Schilit(2009)將情境內容的類型分成三大類 [25],分別為運算情境 (Computing Context)、使用者情境(User Context)以及實體情境(Physical Context),所謂的運算情境包含了硬體資訊、網路頻寬和週遭的資源等,使用

    者情境則包含了使用者的興趣、個人檔案以及

    使用者的所在位置等,而實體情境指的是週遭

    的環境,例如溫度、溼度、亮度等,因此所有

    跟使用者本身或是周遭環境相關的資訊可稱

    為情境資訊(Contextual Information)。 情境感知在不同的應用上都有各自的定

    義,例如Rong等學者(2010)[23]提出了一個以情境感知為基礎的網頁服務需求分析,如圖 2使用者所提出的網頁服務需求(Web Service Request)必須經過情境資訊的需求分析才能了使用者的真正需求,而系統的網頁服務(Web Service Requirement)也必須經過情境資訊的需求分析才能了解使用者的需求,也就是使用者

    所提出的網頁服務需求與系統的網頁服務必

    須經由情境資訊分析的溝通,系統才能提供符

    合使用者需求的網頁服務給使用者。

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    AIT / NCWIA 2012

    圖 2 基於情境資訊的網頁服務需求分析[23]

    Chen等學者於 2004 年提出了一個情境代

    理 人 的 架 構 (Context Broker Architecture; Cobra)[6],並將此架構應用於智慧型的會議室系統,簡稱EasyMeeting,該系統可以針對會議參與者推薦相關的服務和資訊給他們,圖 3為Cobra之架構,情境代理人主要是由下列四個部分所組成: (1)情境知識(Context knowledge base) 情境知識主要是來自使用者的個人資料或

    是週遭環境的相關資訊,例如溫度、亮度、

    位置、使用者的興趣及使用者的情緒等資

    訊。 (2)情境推論引擎(Context Reasoning Engine) 在取得相關的情境知識之後,情境推論引

    擎可以根據模糊規則來得到推論的結果。 (3)情境取得模組(Context Acquisition Module) 情境取得模組負責蒐集相關的情境知識,

    並且經由過濾只留下較有意義且重要的情

    境知識。 (4)情境管理模組(Context Management Module)

    情境管理模組可以訂定特定的策略,再依據策略來來進行規範,例如限制情境知識的

    存取範圍以及使用者的隱私權等。 我們採用此架構的概念,將情境感知的技

    術融入我們的推薦系統當中,我們從使用者交

    談內容、閱讀的文章等取得所需的短期資訊,

    並與使用者過去的相關資訊結合而為情境知

    識,透過對情境知識的推理及分析來找到適當

    的廣告來推薦給使用者。

    圖 3 Cobra 之架構圖[6]

    2.2 模糊理論(Fuzzy Set Theory)

    模糊理論最早是由美國柏克萊大學的

    Zadeh教授所提出,他分別在 1965 年和 1973年相繼提出了模糊集合(Fuzzy Set)與模糊邏輯(Fuzzy Logic)[28][29],模糊理論這個概念主要是用來幫助解決「不確定性」的問題,因為在

    現實生活中,人們對於一個問題通常都是以主

    觀的看法來衡量一個問題的標準,例如考試的

    時候通常是以一個分數標準來判斷是否為及

    格,但這樣的方式對於分數差距很小的人來說

    其實是不公平的,因此模糊理論可以幫助我們

    將衡量的標準以較寬鬆的範圍來進行判斷。

    具體來說,模糊理論是一種數學模組

    (Mathematics model),它以模糊集合(Fuzzy Sets)來判斷一個問題的答案,而傳統的普通集合

    (Crisp Sets)只是以二分法來解答一個問題,其定義如下:

    AxAx

    xUxxxA AA 

          

    ,0,1

    )(,}|)(,{ (1)

    其中U 指的是一個全部集合,而 )(xa 指的是x 在 A 集合或是不在 A 集合;模糊集合則有別於傳統集合,它是利用歸屬程度(Membership Function)來判斷一個事件屬於某個答案的程度有多少,其定義為:

    UxxfxUxxxA AA ),()(,}|)(,{     (2)

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    其中, 表示為 0~1 之間的函數,而)(xf )(xA表示為 x 屬於 A 集合的程度,透過模糊集合運算,我們可以推論出一個更精準的答案。

    圖 4 模糊推論引擎之架構[26]

    模糊理論目前普遍用在不同的領域,例如

    推薦系統、數位學習(E-learning)、控制系統(Control System)等,而一個模糊推論系統的架構主要可分為三大部分,分別為模糊化

    (Fuzzifier)、解模糊化(Defuzzifier)及模糊推論引擎(Fuzzy Inference Engines),圖 4為模糊推論引擎之架構圖[26],首先,在模糊化的部分,主要是用來將真實世界中的數值藉由歸屬程

    度映射到模糊集合中,而解模糊化則與模糊化

    的過程相反,它能夠將模糊集合的數值由模糊

    轉換成明確,目前較為常見的解模糊化方法主

    要都是依據權重平均法 (Weighted Average Formula)而衍生而成,其定義為:

    N

    ii

    i

    N

    ii y

    xy

    1

    1)(

    )(

    (3)

    其中, )(yi 代表的是輸出集合的歸屬程度, i指的是第 i 個規則的權重,N 則是規則的總數。

    在推論引擎的部分,它必須透過模糊規則

    庫來進行推論,而模糊規庫是由許多條 If-Then型式的模糊規則 所組成,因此可定義成

    ,目前最普遍的模糊規則型式

    包含了函數式模糊規則 (Takagi-Sugeno-Kang Fuzzy Rule; TSKFR )和語意式模糊規則(Mamdani Fuzzy Rule; MFR),本研究採用TSKFR 的方式,其規則定義如下:

    iR},...,,{ 21 nRRRR

    ),,(isThen

    isandandisIf:

    1

    11)(

    njj

    jnn

    jj

    xxfyAxAxR

    (4)

    2.3 個人化知識本體(Personal Ontology)

    知識本體是一種概念化的明確描述,他可以用來幫助不同領域知識的分類與分享,因此若

    是加入個人化的概念後,也可以用來描述使用

    者個人的知識或興趣,因此個人化知識本體漸

    漸的被使用在推薦系統、搜尋引擎等應用上,

    如Chaffee等學者利用領域本體和個人化知識本體之間的比對(Mapping)來幫助使用者找出符合需求的網頁[7],Carmichael等學者在智慧型環境中藉由個人化知識本體的輔助來幫助

    特徵的擷取 [8],Huhns和Stephens兩位學者(1999)針對個人化知識本體做了相關的研究,他們認為使用個人化知識本體具有支援離線

    功能、支援瀏覽與搜尋、支援短暫的排序以及

    平衡粗糙與精細以及深度與廣度等優點[15],本研究將應用個人化知識本體於長期情境的

    分析上,用來記錄與查詢使用者的長期偏好。

    2.4 案例式推理(Case-Base Reasoning, CBR)

    案例式推理最早是由Schank[24]所提出的概念,吳伯彥認為案例式推理就如人類在進行

    決策時的思考方式,人類的大腦猶如一個案例

    式資料庫,內部存在著之前所有已經解決的案

    例和解決的方法[4]。詹國良對於過去學者的定義統整後指出案例式推理的概念為根據以前

    的經驗來推論現在所面臨的問題,所以使用的

    經驗為過去相似的案例[1],圖 5為Aamodt和Plaza[5]所提出的案例式推理之循環圖,主要步驟包含了擷取、重新使用及改編,舉例來說,

    學生在考試的時候,遇到某個問題會先思考以

    前是否有寫過相同或是類似的題目,若有就將

    其解決方法直接拿來使用或是經過修改再使

    用,因此案例式推理的優點是可以透過歷史記

    錄快速的找到解決方法並且能夠將方法改進

    以供未來使用,本研究將利用案例式推理來記

    錄點。本研究將案例式推理的概念應用於長期

    情境的分析上,用來記錄與查詢使用者曾經點

    閱過的廣告。

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    圖 5 案例式之循環圖[5]

    2.5 推薦系統(Recommender System)

    3. 研究方法

    3.1 研究架構

    我們的研究架構主要可分為三個部分,如圖 6所示,首先是情境資訊蒐集模組,此模組將蒐集短期情境與長期情境的相關資訊,所謂

    的短期情境是指使用者最近所接觸的事物或

    概念,例如最近的談論的話題或最近較熱門的

    話題等;我們將利用專家知識本體的語意描

    述,找出更多具有關聯性的情境資訊,長期情

    境則是指使用者長期以來的行為偏好,例如使

    用者輪廓(User Profile)以及歷史紀錄都屬於長期情境裡面的資訊,因此,我們將利用個人化

    知識本體來記錄使用者過去曾經接觸的概

    念,此外,也融入案例式推理的概念來分析過

    去的相關資訊;透過短期情境與長期情境所包

    含的資訊便可以了解使用者個人的短期偏好

    與長期偏好;有了相關的情境資訊之後,我們就能經由情境運算模組算出情境資訊與每一個

    項目之間的相似度,所謂的項目指的是要推薦

    的服務,如廣告、指商品和文章等;最後我們

    將相似度模糊化,利用模糊集合找出每個項目

    屬於高相似的歸屬程度,然後利用模糊推論引

    擎進行推論,將每一個項目打分數,並且進一

    步篩選出分數較高的項目依序推薦給使用者。

    推薦系統主要是用來幫助使用者直接找到符合需求的資源,目前較常見的推薦系統可

    分為以內容為基礎(Content-Based Filtering)、協同 式 (Collaborative Filtering) 以 及 混 合 式(Hybrid Approach),Middleton定義以內容為基礎的推薦系統是以二分法的方式來進行推

    薦,並且著重在訓練資料(Training Data)的集合,分析哪些項目對於使用者來說是有興趣

    [22],Liao等學者(2010)利用中國圖書分類法作為參考本體(Reference Ontology),並利用使用者在參考本體裡面的興趣主題,重新組成一個

    個人化的知識本體然後用於書籍的推薦[20]。協同式推薦系統則是利用利用分群的概念,透

    過使用者的評估回饋機制,將興趣相似的使用

    者聚集在一起然後進行推薦,Hsu等學者(2006)將個人化知識本體應用到部落格,利用使用者

    自訂的文章分類做為個人化知識本體,並跟好

    友的個人化知識本體來做相似度的比較,以找

    出興趣相似的使用者來進行推薦 [14] ,Cao(2007)利用模糊理論實做出一個智慧型推薦系統[9],此推薦系統克服了因為電子商務商品過多而產生的資訊負載的問題,翁頌舜(2006)等學者認為使用者對於項目的經驗背後隱含

    了許多情境因素,除了顧客偏好與項目特性

    外,還包含了時間、地點、人物、事件及目的

    等,都有可能成為主導顧客需求的原因[3],因此本研究將利用情境資訊和模糊理論於推薦

    系統上,透過情境資訊的分析及語意的延伸,

    並結合模糊推論引擎來找出符合使用者需求

    的資源給使用者。

    相關情境資訊

    情境運算模組

    情境資訊蒐集模組

    短期情境 長期情境

    項目評分

    專家知識本體

    篩選與推薦

    模糊推論引擎

    個人化知識本體

    案例式庫

    圖 6 研究架構

    3.2 基於交談平台的廣告推薦系統

    我們將推薦方法應用於交談平台上的廣

    告推薦,並實作出一個可以根據交談話題推薦

    廣告的推薦系統(以購物領域為推薦範圍),如圖 7所示,在情境資訊蒐集模組的部分,系統

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    AIT / NCWIA 2012

    情境運算模組

    交談話題相似度

    廣告分數

    篩選與推薦

    專家知識本體

    廣告案例相似度

    個人偏好相似度

    個人偏好歸屬程度

    交談話題歸屬程度

    模糊推論引擎

    廣告熱門相似度

    廣告熱門歸屬程度

    廣告案例歸屬程度

    廣告

    情境資訊蒐集模組

    將針對短期情境與長期情境來進行蒐集,對於

    短期情境我們考慮了交談話題以及廣告熱門

    相似度兩個因素,而在長期情境的部份,我們

    則是利用個人化知識本體來了解個人偏好,此

    外,也透過案例式推理來分析過去相似的資

    訊;之後,每一個廣告都將經由情境運算模組

    分別算出廣告和四種情境資訊之間的相似度。

    圖 7 廣告推薦流程圖

    詞彙重組

    贅字處理

    同義字轉換

    TF計算

    前置處理

    斷詞處理

    圖 8 前置處理之流程圖

    首先是交談話題相似度,系統會根據時間

    或是字元數來決定擷取交談內容,我們暫時分

    別設定成 30 秒和 300 個字,接下來將經由前置處理得到交談話題的關鍵字組,如圖 8所示,其步驟主要包含了: (1)斷詞處理 由於中文並不像英文有空格可以區分詞彙,因

    此必須經由斷詞的處理才能得到詞彙,我們利

    用了中研院所開發的CKIP(Chinese Knowledge Information Processing Group)來進行斷詞。 (2)詞彙重組 中文詞彙的組成是非常複雜的,有些名詞可以

    拆解成兩個名詞,有些名詞經由合併也可以從

    多個詞彙變成單一詞彙,因此可能造成斷詞的

    誤判,所以我們進一步將詞彙進行重組,其重

    組的方式是根據[21]的詞彙重組規則進行重組,如表 1所示。

    表 1 詞彙重組規則[21]

    Left word Right word CompositeNa, Nb, Nc Na, Nb, Nc Na A, VH, Neu,Nes, VH13

    Na, Nb, Nc, Nd

    Na

    VJ VH Na VC, VD Na Na Nba Nba Nba Dfa VH, V_2 VH13 Nes, Neu Neu Neu Neu, Nes, FW

    Nf Nf

    Neu VH Nf Nep Nf, Nd Nf

    (3)過濾贅字 我們參考了[2]的過濾方式,根據詞性來移除贅字和標點符號,如表 2所示。 (4)同義字轉換 建立同義字典,利用同義字的轉換來達到用詞

    的一致性。 (5)組成關鍵字組

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    我們利用詞彙頻率(Term Frequency)的計算以及門檻值(暫時設為 3)的設定,只留下重要的關鍵字,並且組成關鍵字組。

    表 2 重要的詞性[2]

    詞性標註 詞性描述 舉例

    Na 普通名詞 老師

    Nb 專有名詞 洋基隊

    Nc 地方名詞 台北

    Nd 時間名詞 昨天

    VA 動作不及物動詞 跌倒

    VC 動作單賓動詞 救援

    VD 雙賓動詞 給

    VHC 狀態使動動詞 熱

    VH 狀態不及物動詞 瀰漫

    VJ 狀態單賓動詞 得到

    圖 9 購物領域之專家知識本體

    當系統取得關鍵字組後,將藉由專家知識本體

    的概念組成延伸概念組,在專家知識本體的部

    分,我們是參考Yahoo! Dictionary[21]建置而成,如圖 9所示,延伸概念組代表著使用者之間的交談的話題T,同樣的,廣告也擁有自己的延伸概念組A,系統將利用公式

    |AT||AT|

    tS (5)

    計算出交談話題相似度 。 除了以交談話題當作短期情境資訊,系統

    也加入了廣告點閱次數的考量,因為廣告被點

    閱越多次代表該廣告的吸引力越高,因此系統

    將每一個廣告的點閱次數經由公式

    tS

    minmax

    min

    AfAfAfAfS ih

    (6)

    得到廣告熱門相似度 ,其中 為第i個廣告的點閱次數,Af 為所有廣告中點閱的最少次數, 為最多廣告次數。 在長期情境的部份,主要包含了個人化知

    識本體和案例式推理兩個技術,個人化知識本

    體是藉由使用者所接觸的概念建置而成,其運

    作流程如

    hS iAf

    min

    maxAf

    圖 10所示,每當使用者接觸了某ㄧ個概念之後,系統會將該概念的偏好度加 1,

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    並且透過下列兩個公式 把偏好度正規化而轉換成正規化後的偏好度數值(Normalized Interested Degree Value),簡稱偏好值,其中 為第 i 個概念的偏好度。為個人化知識本體中所有概念的最低偏好

    度, 為最高的概念偏好度。最後再透過

    公式(10)找出個人化知識本體裡偏好值最高的概念,並以該概念的偏好值當作該廣告的個人

    偏好相似度。

    i

    s

    ppp N

    pp

    (7) p pmin

    maxpsss pp (8)

    將其延伸概念(即父概念和子概念)的偏好度 (Interested Degree) (即 與 )更新,其中pp sp

    p 是是父概念的影響權重, s 則是子概念的影響權重,我們利用此兩種權重來修正父概念

    及子概念的影響程度。

    ))(),...,(),(),(max( 321 np pNpNpNpNS (10)

    除了利用個人化知識本體記錄使用者的

    概念偏好,我們也將案例式推理的概念融入推

    薦系統中,當使用者點閱了某一個廣告,那就

    代表談論與 TA 類似的交談話題時,廣告 A 容易被接受,系統會將該交談話題的延伸概念組

    記錄到案例式庫裡,然後透過公式

    |TAT||TAT|

    cS (11)

    比對目前的交談話題 T 與曾經接受的廣告所相對應的話題 TA 之間的相似度,如果某一個熱門廣告所對應的交談話題不只一個話題,我們

    可以找出其相似度最大的話題,即由公式

    ))TA,T( , ,)TA,T(,)TA,T(max( m21 simsimsimS c

    (12) 圖 10 個人化知識本體之運作流程

    此外,我們也考慮到使用者的興趣可能隨著時

    間的過去而有所改變,所以當最大偏好度達到

    門檻值(例如 10000)後將所有偏好度減半,如此便能反應出偏好度的轉變。此外,由於偏好度

    並不能明確的表示使用者對某概念的喜好程

    度,所以當要查詢使用者對某一概念的偏好程

    度時,我們必須經公式

    minmax

    mini)N(pp

    pppi

    (9)

    來得到廣告案例相似度 。

    cS圖 11為案例式推理之舉例,假設有一個交

    談題的延伸概念組T={衣服,買,洋裝,平價},以及廣告的延伸概念組A={衣服 ,帽子 ,平價 ,襯衫},而且該廣告過去曾經被點閱了 3 次,其對應的交談話題包含了TA1={衣服,女性,特價}、TA2={衣服 ,淑女 ,項鍊 ,高跟鞋 ,拍賣 }以及TA3={襯衫,二手,衣服,日本,平價},每一個過去的交談話題TA與T的相似度分別為 0.2、0.1 以及 0.3;最後,再從案例式庫裡選出最大相似度的延伸概念組TA3,因此可得廣告案例相似度為 0.3。

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    T={衣服,買,洋裝,平價} 廣告

    ={衣服,女性,特價}

    ={衣服,淑女,項鍊,高跟鞋,拍賣}

    A={衣服,帽子,平價,襯衫}={襯衫,二手,衣服,日本,平價

    0.3)3.0 ,1.0 .2,0max(

    )),(,),(,),(max()TA,T(

    321

    TATsimTATsimTATsimSc

    1TA

    2TA

    3TA

    T:目前的交談議題

    TA:廣告過去所對應的交談議題A:廣告的關鍵字組

    案例式庫

    圖 11 案例式推理之舉例

    接下來,我們針對不同情境資訊相似度的模糊

    集合進行定義,將模糊集合切割成三個區間

    (Partition),分別對應了低相似度、中相似度及高相似度三個語意變數,如圖 12所示,這些隸屬函數的參數只是一個例子,參數設定將依

    實際應用而定。我們根據表 3的模糊規則來得到每條規則的可適用度(權重值 )及取得不同規則給予的分數( )。在

    iw

    if 表 3裡面,模糊規則R1 代表著四種情境資訊相似度的歸屬程度都很高時的情況,即短期情境和長期資訊適合度

    都很高,當滿足了所有的條件,所以取四種歸

    屬程度裡最面高的數值當作R1 的可適用度,並以此當權重値;R2 代表著交談話題歸屬程度及廣告熱門歸屬程度都很高時的情況,即短期情

    境資訊適合度較高,所以將取交談話題和廣告

    熱門的歸屬程度之最大值當作可適用度,即R2的權重値;R3 是指個人偏好和廣告案例的歸屬程度都很高的情況,即長期情境資訊適合度較

    高,因此將取兩者之一的最大值當作可適用

    度,即R3 的權重値;而R4 到R7 則是代表其中

    一種情境資訊相似度的歸屬程度為很高的情

    況,例如R4 為只要話題相似度很高就以交談話題歸屬程度當作R4 的可適用度,R5 是指只要廣告熱門相似度很高就以廣告熱門歸屬程度

    當作R5 的可適用度,R6 代表只要個人偏好相似度很高就以個人偏好歸屬程度當作R6 的可適用度,R7 是指只要案例相似度很高就以交談話題歸屬程度當作R7 的可適用度。最後,透過公式(13)的權重平均法,就能算出每一個廣告的分數,然後再利用分數門檻值的設定篩選分

    數較高的廣告並依序推薦給使用者。各廣告的

    分數為

    n

    ii

    n

    iii

    i

    w

    fwAdGrade

    1

    1)( (13)

    其中 代表每一個規則的可適用度, 是每個

    專家所給予的分數,n 是規則的總數。 iw if

    0 0.3

    0.5

    1

    t

    tS

    high

    0.70.5

    low middle

    0 0.3

    0.5

    1

    h

    hS

    high

    0.70.5

    low middle

    0 0.3

    0.5

    1

    p

    pS

    high

    0.70.5

    low middle

    0 0.3

    0.5

    1

    c

    cS

    high

    0.70.5

    low middle

    圖 12 四種情境資訊相似度的模糊集合

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    表 3 我們所定義的模糊規則

    R1 If is high and is high and is high and

    is high then is

    tS

    max{

    hS

    iW100

    pS

    ,h

    cS

    },, cpt

    R2 If is high and is high then is

    tS

    max{

    hS

    iW100}, ht

    R3 If is high and is

    high then W is pS

    max{

    cS

    i

    100}, cP

    R4 If is high then is tS)(y

    iW100t

    R5 If is high then is hS)(y

    iW100h

    R6 If is high then is pS)(yp

    iW100

    R7 If is high then is cS)(y

    iW100c

    4. 實例說明

    本章節將以實際的例子來進行說明,假設有一個對話內容經由前置處理之後,得到關鍵

    字包含了特價、背包、鞋子、外套及生活用品,

    然後經由專家知識本體的概念延伸之後就能

    組成延伸概念組T={特價, 背包, 鞋子, 外套, 生活用品, 線上購物, 禮品, 美容用品},假設在廣告資料庫裡有七個廣告分別為 、

    、 、 、 、 及 ,每一個廣告同樣也有自己的延伸概念組以及被

    點閱的次數,如

    1

    7AdAd

    Ad Ad Ad Ad Ad

    S Ad S Ad SAd Ad

    2 3 4 5 6

    表 4,因此,系統將透過公式(4)先算出廣告在交談話題上的相似度,其分別

    為 ( )=0.6 、 ( )=0.2 、 ( )=0、 ( )=0.4、 ( )=0、 ( )=0.2 以及 ( )=0。除了計算每個廣告的交談話題相似度,同時也會找出每個廣告

    的點閱次數,並經由公式(6)來得到每個廣告的熱門相似度,其分別為 ( )=0.8、 ( )=0、 ( )=0.5、 ( )=1、 ( )=0.4、 ( )=0 以及 ( Ad )=0.2,如表 4 所示。

    t

    3Ad

    6Ad

    2Ad

    5Ad

    1

    S

    S

    t

    7Ad

    2

    tS

    hS

    hS

    hS

    t

    tS

    hS

    hS

    t

    h

    hS

    4

    tS

    3Ad

    6Ad

    5

    1Ad

    4Ad

    7

    表 4 廣告的熱門相似度

    廣告的延伸概念組 A 點閱次數

    hS

    特價, 飾品, 生活用品, 線上購物 ,禮品,

    美容用品

    10 0.8 1Ad

    2Ad

    襯衫, 百貨公司, 外套, 牛仔褲, 特價

    0 0

    3Ad

    餅乾,麵包,美食 7 0.5

    4Ad

    生活用品, 美容用品, 禮品, 線上購物, 日系

    商品

    13 1

    5Ad

    家具, 書櫃, 電腦桌, 電燈

    5 0.4

    6Ad

    背包, 流行, 錢包, 書包, 手提包, 特價

    0 0

    7Ad

    電腦, 華碩, 手機, 螢幕

    2 0.2

    當系統分別取得了每一種短期情境資訊

    的相似度之後,接下來也會利用長期情境的資

    訊來進行分析,首先,系統會根據每一個廣告

    的延伸概念組到個人化知識本體裡查詢每個

    概念的偏好度,假設使用者的個人化知識本體

    如圖 13所示,以廣告A1 為例,A1={特價, 飾品, 生活用品, 線上購物, 禮品,美容用品},其中偏好度最高的是線上購物的 7.3,因此經由公式 9 轉換成偏好值之後,我們可以得到

    ( )=1,同樣的,其他 6 個廣告也透過個人化知識本體的查詢與正規化來得到個人偏好

    相似度,分別為 ( )=0.4、 ( Ad )=0、( )=1、 p 5 )=0.6、 6d )=0.4

    pSAd

    Ad (

    1

    pSpS 2Ad pS 3

    A4 S ( Ad pS

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    AIT / NCWIA 2012

    A 以及 pS 7d )=0.8。(

    5.2

    6.47

    7.3

    4.2

    3.5 1

    購物

    線上購物

    生活用品

    美容用品禮品

    特價 飾品 電腦 電腦桌 美食

    4.5

    5.12

    6.3 3.3

    背包 鞋子 外套

    4.563.8 2.9

    SAd S Ad S Ad

    圖 13 使用者的個人化知識本體

    表 6 廣告所對應的情境資訊相似度 此外,系統也將利用目前交談話題T和案例式庫裡曾經點閱過的廣告所對應的交談話

    題TA做比較,如表 5所示,經由公式(11)取得T與TA的相似度,然後再透過公式(12)算出每個廣告的案例相似度,其結果分別為 ( )=0.4、 ( )=0、 ( )=0、 ( )=0.6、 ( )=0、 ( )=0 及 ( )=0。

    c

    cS

    cS1

    4

    7

    c

    cS2

    5Adc

    cS3

    6AdAdAd

    表 5 廣告與過去案例的情境資訊相似度

    廣告過去所對應的交談話題 TA cS

    1Ad 新鮮, 水果, 拍賣, 生活用品, 禮品, 線上購物, 美容用品

    0.4

    2Ad none 0

    3Ad 餅乾, 點心, 糖果, 蛋糕 0

    4Ad 化妝品, 生活用品, 美容用品, 禮品, 線上購物, 特價

    0.6

    5Ad 電腦, 電腦桌, 便宜 0

    6Ad none 0

    7Ad 電腦, 華碩, 筆電, 顯示卡, 便宜, 螢幕

    0

    tS hS pS cS

    1Ad 0.6 0.8 1 0.4

    2Ad 0.2 0 0.4 0

    3Ad 0 0.5 0 0

    4Ad 0.4 1 1 0.6

    5Ad 0 0.4 0.6 0

    6Ad 0.2 0 0.4 0

    7Ad 0 0.2 0.8 0

    表 7 廣告的情境資訊在高相似的歸屬程度

    )( thigh S )( hhigh S )( Phigh S )( chigh S

    1Ad 0.5 1 1 0

    2Ad 0 0 0 0

    3Ad 0 0 0 0

    4Ad 0 1 1 0.5

    5Ad 0 0 0.5 0

    6Ad 0 0 0 0 0 0 1 0

    7Ad 在取得廣告所有的情境資訊相似度之

    後,如表 6,我們將依據相似度對應到高相似的模糊集合,便能將情境資訊相似度轉換成情

    境資訊歸屬程度,如表 7,最後,藉由公式

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    (13),推論引擎就能推論出廣告的分數為:

    63.0010010050100100100

    4.0011008.01006.0504.010006.1004.0100)( 1

    AdGarad

    0)( 2 AdGarad 0)( 3 AdGarad

    67.0501001000100100100

    6.050110011004.006.01004.01004.0100)( 4

    AdGarad

    53.00500050050

    006.0504.00006.0504.004.050)( 5

    AdGarad

    0)( 6 AdGarad

    26.0 0100001000100

    008.01002.000001002.000100)( 7

    AdGarad

    因此,當分數門檻值為 0.6 的時候, 及兩個廣告均符合條件,因此系統將可以根據分

    數高低,依序推薦 、 給使用者。

    1Ad 4Ad

    4Ad 1Ad

    5. 結論與未來工作

    本研究提出了一個基於情境感知與模糊理

    論的推薦系統,並應用於交談平台的廣告推薦

    上,實做出一個具有個人化特色的廣告推薦系

    統,此平台不僅考慮了使用者的短期偏好,也

    考慮了使用者的長期偏好,因此當目前的交談

    話題與所有的廣告相似度偏低時,我們就可能

    以使用者的長期偏好為主來進行推薦,如此便

    能互補兩種情境資訊不足的情形。此外,我們

    的個人化廣告推薦改善了傳統廣告推薦的缺

    點,可以針對交談話題來推薦,所以推薦出來

    的廣告吸引力較高,使用者就樂意去點閱廣

    告,因此廣告點閱率就會跟著提升,企業主便

    能從中獲得更好的廣告效益。在未來,我們將

    實作出來並經由實驗來了解廣告點閱率的改

    善結果,此外,我們也將藉由實驗來取得更好

    的參數設定,例如擷取交談內容的時機點以及

    廣告分數的門檻值等。 參考文獻 [1] 詹國良,“案例式推理於企業信用評等決策

    之輔助應用”,碩士論文,國立成功大學工業管理科學系,台南,2002。

    [2] 陳慶龍,“可供語意搜尋之部分知識建構”,碩士論文,國立成功大學工程科學系,台

    南,2006。 [3] 翁頌舜、陳文典,“整合情境資訊之多維度

    推薦環境”,2006 電子商務與數位生活研討會論文集,台北,光碟,2006。

    [4] 吳柏諺,“以案例式推理為基礎之高速公路上危險事件預測系統”,碩士論文,國立台灣師範大學資訊工程系,台北,2008。

    [5] Aamodt, A. and Plaza, E., “Case-based reasoning: foundational issues, Methodological Variations, and System Approaches,” AI Communications. IOS Press, Vol. 7, No. 3, pp. 39-59, 1994.

    [6] Chen, H., Finin, T., Joshi A., Kagal, L., Perich F. and Chakraborty, D., “Intelligent Agents Meet the Semantic Web in Smart Spaces,” IEEE Internet Computing, Vol. 8, No. 6, pp. 69-79, 2004.

    [7] Chaffee, J. and Gauch, S., “Personal Ontologies for Web Navigation,” Proceedings of the 9th International Conference On Information Knowledge Management (CIKM), pp. 227-234, 2000.

    [8] Carmichael, D. J., Kay, J. and Kummerfeld, B., “Personal Ontologies for feature selection in Intelligent Environment visualisations,” Proceedings of the Workshop on Artificial Intelligence in Mobile Systems, pp. 44-51, 2004.

    [9] Cao, Y. and Li, Y., “An intelligent fuzzy-based recommendation system for consumer electronic products,” The Journal Expert Systems with Applications, Vol. 33, pp. 230–240, 2007.

    [10] Dey, A. K., “Understanding and using context,” Personal and Ubiquitous Computing, Special issue on Situated Interaction and Ubiquitous Computing, Vol. 5, No. 1, pp. 4-7, 2001.

    [11] Degemmis, M., Lops, P. and Semeraro, G., “A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation,” User Modeling and User-Adapted Interaction, Vol. 17, No. 3, pp. 217-255, 2007.

    [12] Gupta, G. and Lee, W. C., “Collaborative Spatial Object Recommendation in Location Based Services,” Proceedings of the 2010 39th International Conference on Parallel Processing Workshops, pp. 24-33, 2010.

    [13] Huang, H. C., Lin, M. S. and Chen, H. H., “Analysis of Intention in Dialogues Using Category Trees and Its Application to Advertisement Recommendation,” Proceedings of the Third International joint conference on Natural Language Processing, pp. 625-630, 2008.

    AIT / NCWIA 2012

  • 2012 資訊科技國際研討會暨第二屆網路智能與應用研討會論文集

    AIT / NCWIA 2012

    [14] Hsu, P. L., Liu, P. C., and Chen, Y. S., “Using Ontology to Map Categories in Blog,” AIDM '06 Proceedings of the International Workshop on on Integrating AI and Data Mining, pp. 65-72, 2006.

    [15] Huhns, M. N. and Stephens, L. M., “Personal ontologies,” Internet Computing, IEEE, Vol. 3, No. 5, pp. 85-87, 1999.

    [16] Jang, Y., Lee, T., Kim, K. and Lee, W., “Keyword Management System based on Ontology for Contextual Advertising,” Proceedings of the Sixth International Conference on Advanced Language Processing and Web Information Technology, pp. 440-445, 2007.

    [17] Kazienko, P. and Adamski, M., “AdROSA–Adaptive Personalization of Web Advertising,” Information Sciences, Vol. 177, No.11, pp. 2269-2295, 2007.

    [18] Kim, J. H., Chung, K. Y., Ryu, J. K., Rim, K. W. and Lee, J. H., “A Recommendation Agent System Using HMM-Based Collaborative Filtering in Smart Home Environment,” Proceedings of the Third International Conference on Convergence and Hybrid Information Technology, pp. 214-217, 2008.

    [19] Kayaalp, M., Özyer, T. and Özyer, S. T., “A Collaborative and Content Based Event Recommendation System Integrated With Data Collection Scrapers and Services at a Social Networking Site,” Proceedings of the 2009 International Conference on Advances in Social Network Analysis and Mining, pp. 113-118, 2009.

    [20] Liao, S. C., Kao, K. F., Liao, I. E., Chen, H. L. and Huang, S. O., “PORE: a personal ontology recommender system for digital libraries,” Electronic Library, Vol. 27, No 3, pp. 496-508, 2009.

    [21] Lee C. W., Shih, C. W., Day, M. Y., Tsai, T. H., Jiang, T. J., Wu, C. W., Sung, C. L., Chen, Y. R., Wu, S. H., and Hsu, W. L., “ASQA: Academia Sinica Question Answering System for NTCIR-5 CLQA,” Proceedings of the NTCIR-5 Workshop Tokyo, pp. 202-208, 2005.

    [22] Middleton, S. E., Roure, D. D. and Shadbolt, N. R., “Ontology-based recommender systems,” International Handbooks on Information Systems, Vol. 6, pp 4779-796, 2009.

    [23] Rong, W. and Liu, K., “A Survey of Context Aware Web Service Discovery: From User’s

    Perspective,” Proceedings of the 2010 Fifth IEEE International Symposium on Service Oriented System Engineering, pp. 15-22, 2010.

    [24] Schank, R. C., “Dynamic Memory: A Theory of Reminding and Learning in Computers and People,” Cambridge University Press, 1982.

    [25] Schilit, S B., Adams, N. and Want, R., “Context-aware computing applications,” Proceedings of the IEEE Workshop on Mobile Computing Systems and Applications, pp 85-90, 1994.

    [26] Sargolzaei, J. and Khoshnoodi, M., “Fuzzy inference system to modeling of cross flow milk ultrafiltration,” Applied Soft Computing, Vo. 8, No. 1, pp 456-465, 2008.

    [27] Schilit, S B. and Theimer, M., “Disseminating Active Map Information to Mobile Hosts,” IEEE Network, Vol. 8, No. 5, pp. 22-32, 1994.

    [28] Zadeh, L. A., “Fuzzy Sets,” Information and Control, Vol. 8, No. 3, pp. 338-353, 1965.

    [29] Zadeh, L. A., “Outline of a New Approach to Analysis of Complex Systems,” IEEE Trans. on Sys. Man and Cyb, Vol. 1, No.1, pp. 28-44, 1973.

    [30] Yaoo! Dictionary。2011 年 10 月 15 日取自:http://tw.dir.yahoo.com/

    [31] 豆豆聊天室。2011 年 10 月 5 日取自:http://doo.idv.tw/

    http://tw.dir.yahoo.com/http://doo.idv.tw/

    摘要Abstract1. 前言2. 文獻回顧R1If is high and is high and is high and is high then is R2If is high and is high then is R3If is high and is high then is R4If is high then is R5If is high then is R6If is high then is R7If is high then is