將想法與焦點(diǎn)和您一起共享

范例推理下旅游計劃推薦系統設計的關(guān)鍵問(wèn)題發(fā)布者:本站     時(shí)間:2020-05-03 11:05:52

隨著(zhù)我國旅游業(yè)和互聯(lián)網(wǎng)電子商務(wù)的迅猛發(fā)展,互聯(lián)網(wǎng)上的旅游電子商務(wù)網(wǎng)站成百上千,而這些網(wǎng)站提供的旅游相關(guān)信息堪稱(chēng)海量。這為普通游客設計自己的旅游計劃提供了豐富的選擇和參考,但同時(shí)也大大增加了 信 息 篩 選 和 比 對 的 難 度。例 如,使 用“百 度”搜 索 引 擎 檢 索 關(guān) 鍵 字“九 寨 溝 三 日 游”,檢 索 結 果 獲 得23 800 000個(gè)頁(yè)面。為此,建立一個(gè)第三方網(wǎng)站,通過(guò)“推薦系統”向游客提供旅游計劃個(gè)性化服務(wù)具有很高的實(shí)用價(jià)值和商業(yè)價(jià)值。傳統的“推薦系統”一般基于用戶(hù)的歷史記錄(例如網(wǎng)頁(yè)瀏覽記錄、產(chǎn)品購買(mǎi)記錄、對產(chǎn)品的評價(jià)或評分等)設計推薦算法,但旅游活動(dòng)不同于一般的產(chǎn)品消費,即游客一般不會(huì )重復地旅游或者頻繁地旅游。因此,旅游電子商務(wù)網(wǎng)站的“推薦系統”有必要選擇其他 理論和技術(shù)作為基礎。比較普遍的情況是,游客對于自己將進(jìn)行的旅游活動(dòng)僅有一些初步的想法(例如時(shí)間、費用、旅游地點(diǎn)等),對于具體行程安排不太了解,所以在制定旅游計劃的過(guò)程中往往喜歡參考別人的旅游計劃或者經(jīng)驗,并以此作為自己旅游計劃的基礎和依據,修改這些例子以形成自己的旅行計劃。有鑒于此,范例推理(Case-based Reasoning)理論和技術(shù)可運用到旅游電子商務(wù)網(wǎng)站的“推薦系統”設置中。范例推理理論和技術(shù)起源于美國,是人工智能領(lǐng)域中較新穎和成熟的一種問(wèn)題求解和學(xué)習方法。它的基本思路是在新問(wèn)題的解決過(guò)程中,通過(guò)尋找與之相似的歷史范例,挖掘歷史范例中可資借鑒的信息和知識,進(jìn)而形成新問(wèn)題的對應解決方案?;诜独评淼膯?wèn)題求解過(guò)程的可以分為4個(gè)階段:范例檢索(Retrieve)、范例重用(Reuse)、范例修正(Revise)和范例保存(Retain)。

1 機構框架

基于范例推理的旅游計劃推薦系統由三個(gè)層次構成,即游客應用層、Web服務(wù)層和數據源層,見(jiàn)圖1.
(1)游客應用層。該層為游客訪(fǎng)問(wèn)推薦系統提供一個(gè)的良好的交互操作界面,游客可輸入文字、數字等信息,瀏覽、修改和保存旅游計劃推薦系統的輸出結果。(2)Web服務(wù)層。該層負責從數據源中檢索、更新數據。旅游計劃推薦系統運行在該層。該層主要模塊包括管理模塊(負責和“游客應用層”相互作用,管理其他模塊、維護“數據源層”、檢索模塊(負責CBR技術(shù)中的檢索、匹配功能)。(3)數據源層。該層包括旅游計劃收集庫、旅游計劃范例庫和游客資料庫等。其中,旅游計劃收集庫包含大量采集自各網(wǎng)站的、未經(jīng)整理的旅游信息資料;旅游計劃范例庫包含大量的標準化的旅游計劃范例;游客資料數據庫包含著(zhù)登陸游客的相關(guān)歷史記錄。

旅游計劃推薦系統結構

2 關(guān)鍵技術(shù)與方法

基于范例推理理論和技術(shù),本文將范例推理系統作為旅游計劃推薦系統的核心組成部分。為了保證旅游計劃推薦系統正常運作,該范例推理系統必須解決3個(gè)關(guān)鍵問(wèn)題,即旅游計劃采集系統、旅游計劃范例庫和旅游計劃范例檢索設計。

(1)旅游計劃采集系統。旅游計劃范例的搜集工作主要依賴(lài)旅游計劃自動(dòng)采集系統進(jìn)行。該系統通過(guò)“URL模板匹配庫”過(guò)濾出可以解析的網(wǎng)頁(yè),然后將可解析的HTML文檔進(jìn)行網(wǎng)頁(yè)結構化處理,生成XML文檔。最后結合DOM4J和XPath語(yǔ)言建立頁(yè)面解析模板,從XML文檔中抽取指定節點(diǎn)信息,并將其存儲進(jìn)入旅游計劃收集庫。旅游計劃采集系統工作流程參見(jiàn)圖二。需要說(shuō)明的是,筆者將XML語(yǔ)言應用在網(wǎng)頁(yè)信息自動(dòng)抽取過(guò)程中。XML是一種元標記語(yǔ)言,它將結構、內容和表現分離,提供描述結構化資料的格式,有著(zhù)較好的數據存儲格式,可擴展性,高度結構化,語(yǔ)義性強、能夠解決HTML網(wǎng)頁(yè)的數據的異構性和半結構化問(wèn)題。URL模板匹配庫是一個(gè)包含了旅游電子商務(wù)網(wǎng)站URL特征的XML文件,與待抽取網(wǎng)頁(yè)的URL進(jìn)行模板匹配,判斷頁(yè)面是否可以被解析并確定其網(wǎng)頁(yè)解析模板。XPath(XML Path Language)是一種在XML文檔中查找信息的語(yǔ)言,可用來(lái)在XML文檔中對元素和屬性進(jìn)行遍歷。用DOM4J解析器可以從指定的XML文檔中自動(dòng)抽取出所需信息。
 旅游計劃采集系統工作流程

(2)旅游計劃范例庫。各旅游商務(wù)網(wǎng)站提供的旅游計劃包含大量信息,內容側重點(diǎn)和格式等大相徑庭,因此必須將這些旅游計劃進(jìn)行標準化處理,即將一個(gè)個(gè)旅游計劃依據需要事先確立旅游計劃范例模板轉化為旅游計劃。該范例模版既能夠最大限度地反應普通游客對旅游計劃的諸多關(guān)注要點(diǎn),而且信息應該言簡(jiǎn)意賅,一目了然。為了更好的了解普通游客對旅行計劃的關(guān)注要點(diǎn),筆者與Phuket ABC Tour合 作 進(jìn) 行 了 旅 游 計 劃 網(wǎng)絡(luò )問(wèn)卷調查,歷時(shí)30天,獲得“旅游計劃問(wèn)卷調查表”100份(該問(wèn)卷調查表調研對象為普通游客,調研主要內容為對旅游計劃的關(guān)注要點(diǎn)進(jìn)行排序和打分)“旅游計 劃問(wèn)卷調查表”統計結果顯示,普通游客對旅游計劃的關(guān)注要點(diǎn)由強到弱排序為景點(diǎn)、時(shí)間、費用、住宿、餐飲、交通。為此,筆者設計了一個(gè)旅游計劃范例模版(以成都國旅的九寨溝三日游為例),見(jiàn)表1.旅游計劃范例庫存儲有大量旅游計劃范例,并且能夠不斷補充的新的旅游計劃范例。
 旅游計劃范例模版

(3)旅游計劃范例檢索。與旅游計劃范例模板相匹配,筆者設計了新旅游計劃模版,游客可根據自身需要選填各項。新旅游計劃模版見(jiàn)表2.表2中,“關(guān)注程度排序”可理解為游客賦予各“關(guān)注要點(diǎn)”的權重;“時(shí)間”和“費用”兩項為數值,“地點(diǎn)”、“住宿”、“餐 飲”、“景 點(diǎn)”、“交通”和“旅游對象”項為字符。假設新旅游計劃與旅游計劃范例分別表示為t和s,fti和fsi分別表示新 旅 游 計 劃 和 旅 游 計 劃 范 例 的 第i個(gè)“關(guān)注要點(diǎn)”的數值或字符。
新旅游計劃模版

對于旅游活動(dòng)的“時(shí)間”和“費用”而言,如果新旅游計劃設定的數值與旅游計劃范例的數值之間差距過(guò)大,則游客 一般 難 以 接 受,例 如5 000元與50 000元之間的差距,5天與10天之間的差距。故根據生活常識設定兩者差距介于0.5和1.5倍之間為有效相似度,否則為無(wú)效相似度。

公式一

地點(diǎn)“、”住宿“、”餐飲“、”景點(diǎn)“、”交通“和”旅游對象“等字符項目相似性計算公式為

公式二

將單個(gè)關(guān)注要點(diǎn)的相似度與其權重相乘(w{1,2,3…7}),其結果再相加得到新旅游計劃與旅游計劃范例的總體相似度??傮w相似度越大,說(shuō)明新旅游計劃與旅游計劃范例越相似。旅游計劃范例按照總體相似度降序輸出。



選擇我們,優(yōu)質(zhì)服務(wù),不容錯過(guò)
1. 優(yōu)秀的網(wǎng)絡(luò )資源,強大的網(wǎng)站優(yōu)化技術(shù),穩定的網(wǎng)站和速度保證
2. 15年上海網(wǎng)站建設經(jīng)驗,優(yōu)秀的技術(shù)和設計水平,更放心
3. 全程省心服務(wù),不必擔心自己不懂網(wǎng)絡(luò ),更省心。
------------------------------------------------------------
24小時(shí)聯(lián)系電話(huà):021-58370032
最新国产精品第二页_色资源av中文无码先锋_中国xx爽69护士_日韩欧美亚洲每日更新在线观看