熟女人妻少妇精品视频,污污的网站,无码熟熟妇丰满人妻啪啪,中文人妻AV久久人妻水

專(zhuān)業(yè)的廣州網(wǎng)站建設公司、廣州網(wǎng)站設計制作公司為您服務(wù),電話(huà):020-85548809,29883069
新聞中心
專(zhuān)業(yè)專(zhuān)注專(zhuān)心,行業(yè)行情行規
分享交流,永無(wú)止境,我們愿與您共同進(jìn)步

網(wǎng)站建設之搜索引擎HITS算法

發(fā)布日期:[2009/10/7]   編輯:奇億廣州網(wǎng)站建設

      近來(lái)發(fā)現百度等搜索引擎的算法更新越來(lái)越頻繁,導致很多網(wǎng)站的關(guān)鍵字排名也漂浮不定。但你知道他們?yōu)楹我绱祟l繁地更改算法呢?恐怕并不是想完善算法那么簡(jiǎn)單吧?因為核心算法早已成熟,下面就跟大家來(lái)談?wù)凥ITS算法。

       HITS算法是Web結構挖掘中最具有權威性和使用最廣泛的算法。其基本思想是利用頁(yè)面之間的引用鏈來(lái)挖掘隱含在其中的有用信息(如權威性),具有計算簡(jiǎn)單且效率高的特點(diǎn)。HITS算法通過(guò)兩個(gè)評價(jià)權值——內容權威度(Authority)和鏈接權威度(Hub)來(lái)對網(wǎng)頁(yè)質(zhì)量進(jìn)行評估。

       內容權威度與網(wǎng)頁(yè)自身直接提供內容信息的質(zhì)量相關(guān),被越多網(wǎng)頁(yè)所引用的網(wǎng)頁(yè),其內容權威度越高;鏈接權威度與網(wǎng)頁(yè)提供的超鏈接頁(yè)面的質(zhì)量相關(guān),引用越多高質(zhì)量頁(yè)面的網(wǎng)頁(yè),其鏈接權威度越高。

       HITS算法認為對每一個(gè)網(wǎng)頁(yè)應該將其內容權威度和鏈接權威度分開(kāi)來(lái)考慮,在對網(wǎng)頁(yè)內容權威度做出評價(jià)的基礎上再對頁(yè)面的鏈接權威度進(jìn)行評價(jià),然后給出該頁(yè)面的綜合評價(jià)。然而HITS算法也有其明顯的不足。

       首先,它完全將網(wǎng)頁(yè)的內容或文本排除在外,僅考慮網(wǎng)頁(yè)之間的鏈接結構來(lái)分析頁(yè)面的權威性,這與現實(shí)網(wǎng)絡(luò )中的權威頁(yè)面相比,其不科學(xué)性顯而易見(jiàn)。因為權威頁(yè)面必須針對某一主題或關(guān)鍵詞而言。某一頁(yè)面對一確定主題的具有較大權威性的頁(yè)面并不意味在其他與其無(wú)關(guān)的主題方面同樣具有權威性。

       其次一個(gè)頁(yè)面對另一頁(yè)面的引用有多種情況,其中包含了一頁(yè)面對另一頁(yè)面的認可,但除此之外也有其他目的鏈接,如為了導航或為了付費廣告。而HITS算法在實(shí)現過(guò)程中均沒(méi)有考慮以上情況.導致了結果與目標的差距。就HITS算法的思想與實(shí)現過(guò)程做了細致的研究與概括。

       針對前面第一種不足,就有相關(guān)的學(xué)者提出了一種利用超鏈文字及其周?chē)淖峙c關(guān)鍵字相匹配而計算超鏈權值的方法,并引入系數對周?chē)淖趾统溛淖诌M(jìn)行權值的相對控制,很好地將頁(yè)面文本信息引入到HITS算法,提高了算法的可靠性,并在現實(shí)中取得了很好的效果。

       對HITS算法的第二個(gè)不足,即非正常目的的引用。在HITS算法看來(lái),也誤認為是正常引用,導致實(shí)際結果與目標的出入。后來(lái),經(jīng)過(guò)不斷的改進(jìn)。HITS算法又引入了時(shí)間參數,即利用對一鏈接引用的時(shí)問(wèn)長(cháng)短來(lái)評價(jià)是否為正常引用。因為非正常鏈接其引用時(shí)問(wèn)肯定不會(huì )很長(cháng)(如交換鏈接、廣告鏈接),相反,如果一頁(yè)面對另一頁(yè)面的鏈接時(shí)間較長(cháng),則必然反映此頁(yè)面就是用戶(hù)的尋找頁(yè)面。即目標頁(yè)面或至少是正常引用。

       如果設定時(shí)間閥值,則可以將非正常引用的鏈接在HITS算法的實(shí)現過(guò)程中篩選出來(lái)。如設定訪(fǎng)問(wèn)時(shí)間少于1分鐘者為非正常引用。另外可構造時(shí)間訪(fǎng)問(wèn)函數,控制權威頁(yè)面的相對大小。如隨訪(fǎng)問(wèn)時(shí)間的增大而其權威性也逐漸非線(xiàn)性增大.這樣可為HITS算法的權威頁(yè)面提供更合理、更科學(xué)的解釋。鏈接穩定性,在外部鏈接的建設中,占據非常重要的地位。鏈接越穩定,對排名的幫助就越大。 

       從HITS算法的這些特征,我們大概就能想到各大搜索引擎為何每隔一段時(shí)間又要更新其算法的原因了。

廣州建網(wǎng)站、廣州做網(wǎng)站
或者將本文《網(wǎng)站建設之搜索引擎HITS算法》收藏和分享到:
復制本文《網(wǎng)站建設之搜索引擎HITS算法》地址給好友:
台前县| 红原县| 华安县| 荣昌县| 白河县| 淮阳县| 上蔡县| 绥德县| 横峰县| 科技| 敦化市| 台北市| 利津县| 九龙县| 青龙| 虹口区| 绍兴县| 英山县| 正定县| 丹凤县| 达日县| 祁连县| 平罗县| 庆城县| 灌阳县| 七台河市| 东台市| 商河县| 雷山县| 县级市| 新郑市| 浦江县| 汶川县| 大安市| 志丹县| 临朐县| 巴楚县| 阜宁县| 响水县| 丰镇市| 辽中县|