<rt id="tf2wb"><bdo id="tf2wb"><kbd id="tf2wb"></kbd></bdo></rt>
    1. <button id="tf2wb"><thead id="tf2wb"></thead></button>

      <rp id="tf2wb"><bdo id="tf2wb"></bdo></rp>
      <delect id="tf2wb"><td id="tf2wb"></td></delect>
      <rt id="tf2wb"></rt>
      <rt id="tf2wb"><bdo id="tf2wb"></bdo></rt>
    2. 企業(yè)與個(gè)人網(wǎng)絡(luò )營(yíng)銷(xiāo)一站式服務(wù)商
      網(wǎng)站建設 / SEO優(yōu)化排名 / 小程序開(kāi)發(fā) / OA
      0731-88571521
      136-3748-2004
      做網(wǎng)站SEO優(yōu)化中關(guān)鍵詞分詞技術(shù)
      信息來(lái)源:長(cháng)沙網(wǎng)站制作   發(fā)布時(shí)間:2011-12-31   瀏覽:

        背景資料:

        策先生——策恩“世界名鞋淘寶客”推廣大賽特約評委

        曾于第一季推廣大賽期間對參賽選手表現進(jìn)行每周精簡(jiǎn)點(diǎn)評,專(zhuān)治疑難雜癥,為一眾參賽選手所知曉。為人低調且神秘,專(zhuān)注網(wǎng)站推廣數年,F任第二季策恩“世界名鞋淘寶客”推廣大賽評委,行蹤不甚明朗。

        說(shuō)到中文分詞,我覺(jué)得只要從事SEO工作有關(guān)的朋友都應該深刻理解這一知識,理解搜索引擎是如何識別詞與詞之間的關(guān)系,如何判別語(yǔ)句的含義的。因為您只有充分的了解、貫穿應用中文分詞才可以在關(guān)鍵詞收集、分析、布局,包括標題的攢寫(xiě)做得更加得心應手,才會(huì )寫(xiě)出更加出色的軟文。中文分詞已經(jīng)是SEO知識中的核心知識。

        SEOER必須要理解搜索引擎是如何工作的這一點(diǎn)尤其重要,也是最基礎的。

        我們先來(lái)了解中文分詞的概念,什么是中文分詞?

        中文分詞技術(shù)屬于自然語(yǔ)言處理技術(shù)范疇,對于一句話(huà),人可以通過(guò)自己的知識來(lái)明白哪些是詞,哪些不是詞,但如何讓計算機也能理解?其處理過(guò)程就是分詞算法。

        目前搜索引擎對于中文分詞可以分為三大類(lèi):基于字符串匹配的分詞方法、基于理解的分詞方法和基于統計的分詞方法。

        1、基于字符串匹配的分詞方法

        搜索引擎在接受用戶(hù)搜索的時(shí)候第一個(gè)會(huì )判斷用戶(hù)搜索的“詞”跟數據庫里面的“詞”是否匹配,匹配度如何來(lái)進(jìn)行掃描;

        按照輸入的“關(guān)鍵詞”或是“句子”不同長(cháng)度優(yōu)先匹配的情況,可以分為最大(最長(cháng))匹配和最小(最短)匹配;

        如下:

        1)正向最大匹配法(由左到右的方向);

        例子:策恩“世界名鞋淘寶客”推廣大賽。

        正向最大切分出的關(guān)鍵詞是:策恩、世界名鞋淘寶客、推廣大賽(不上圖了,大家百度一下,然后查看快照即可)

        2)逆向最大匹配法(由右到左的方向);這個(gè)跟第一點(diǎn)是一樣的分詞方式,只是關(guān)鍵詞的前后順序換過(guò)來(lái),在搜索引擎數據庫查詢(xún)得到的結果是一樣的。

        3)最少切分(使每一句中切出的詞數最小);

        例子:策恩“世界名鞋淘寶客”推廣大賽

        最少切分出來(lái)的詞是:策恩、世界、名鞋、淘寶客、推廣、大賽;

        4)雙向最大匹配法(進(jìn)行由左到右、由右到左兩次掃描)||

        2、基于理解的分詞方法

        這種分詞方法是通過(guò)讓計算機模擬人對句子的理解,達到識別詞的效果。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語(yǔ)義分析,利用句法信息和語(yǔ)義信息來(lái)處理歧義現象。這種方法一直對抗著(zhù)長(cháng)期偽原創(chuàng )的做法,在09年一般的換換同義詞,近義詞的偽原創(chuàng )百度會(huì )收錄,到了2010年偽原創(chuàng )的幅度需要做到更大才可以有效,在今年的六月底,百度的一次大更新過(guò)后,很多同學(xué)發(fā)現原來(lái)的采集的站,或是偽原創(chuàng )力度不大的網(wǎng)頁(yè)內容被百度大量的放出來(lái),不在收錄,說(shuō)明百度這一分詞技術(shù)方法越來(lái)越成熟,越來(lái)越完善了。偽原創(chuàng )也是越來(lái)越難了。

        3、基于統計的分詞方法

        從形式上看,詞是穩定的字的組合,因此在上下文中,相鄰的字同時(shí)出現的次數越多,就越有可能構成一個(gè)詞。因此字與字相鄰共現的頻率或概率能夠較好的反映成詞的可信度。搜索引擎通過(guò)這一方法在“下拉框”或是“相關(guān)搜索”中可以充分提現出來(lái)。最近幾年大家發(fā)現很多網(wǎng)絡(luò )公司有一項業(yè)務(wù)是【刷百度相關(guān)關(guān)鍵詞】,當用戶(hù)輸入某個(gè)關(guān)鍵詞的時(shí)候,我們可以做到指定在百度下拉框出現自己想要的關(guān)鍵詞,利用的就是這個(gè)基于統計的分詞原理。

        最后說(shuō)下關(guān)鍵詞在標題的應用,理解中文分詞與網(wǎng)站標題的關(guān)系。

        1、搜索詞與網(wǎng)站標題完全匹配

        當用戶(hù)在百度搜索的時(shí)候,搜索詞如果和您的網(wǎng)站標題完全匹配,而且你的網(wǎng)站也達到了一定的權重的時(shí)候就會(huì )有好的排名,這個(gè)也解釋了標題一定要出現關(guān)鍵詞,就是原因,反之,如果搜索的詞不和您的網(wǎng)站標題完全匹配的時(shí)候搜索引擎就進(jìn)行分詞,分詞的方式參與了中文分詞原理的綜合方式。

        2、搜索詞不匹配才進(jìn)行分詞

        當詞語(yǔ)與您的網(wǎng)站標題不匹配的時(shí)候就會(huì )進(jìn)行分詞,分詞的方式會(huì )參與,正向、逆向、統計、理解、同義詞、以及新詞和歧義詞。這個(gè)時(shí)候搜索引擎理解起來(lái)會(huì )比較難,從而影響到網(wǎng)頁(yè)的排名;

        說(shuō)到這里我提下之前在一個(gè)策恩淘寶客大賽交流QQ群189321234發(fā)過(guò)一些淘寶上熱搜的關(guān)鍵詞出來(lái),在上次夢(mèng)江跟我的一次訪(fǎng)談中一位策恩的淘寶客說(shuō)到這些詞在淘寶上搜索次數很大,但是在百度的話(huà)幾乎是零,當時(shí)我建議優(yōu)化“行業(yè)詞+策恩、行業(yè)詞+策恩皮鞋”這類(lèi)型的關(guān)鍵詞,還說(shuō)我會(huì )在往后寫(xiě)文專(zhuān)門(mén)說(shuō)清楚,我再舉一個(gè)例子,希望可以更加清楚點(diǎn)。

        標題:休閑皮鞋策恩波文、時(shí)尚男人韓版風(fēng)

        按照最大匹配法來(lái)分:休閑皮鞋、策恩波文、時(shí)尚男人、韓版風(fēng)。里面至少包含了“休閑皮鞋、休閑皮鞋策恩、策恩波文,策恩皮鞋波文”這4個(gè)詞,這樣既優(yōu)化了在百度的熱門(mén)詞“休閑皮鞋”,精準詞:休閑皮鞋策恩,同時(shí)也優(yōu)化了在淘寶的熱門(mén)詞精準詞“策恩波文、策恩皮鞋波文”,盡可能的做到跟用戶(hù)搜索的詞匹配度較高,我當時(shí)說(shuō)的就是這個(gè)意思。




      上一條: 新做的網(wǎng)站怎樣解決網(wǎng)站只收錄首頁(yè)的四大方法
      下一條: 做好網(wǎng)站之后在百度知道上自行推廣七大注意七大技巧
      案例鑒賞
      多年的網(wǎng)站建設經(jīng)驗,斌網(wǎng)網(wǎng)絡(luò )不斷提升技術(shù)設計服務(wù)水平,迎合搜索引擎優(yōu)化規則
      精辟網(wǎng)文
      多年的網(wǎng)站建設經(jīng)驗,網(wǎng)至普不斷提升技術(shù)設計服務(wù)水平,迎合搜索引擎優(yōu)化規則
      長(cháng)沙私人做網(wǎng)站    長(cháng)沙做網(wǎng)站    深圳網(wǎng)站建設    株洲做網(wǎng)站    東莞做網(wǎng)站    南京防腐木    湖南大拇指養豬設備    株洲做網(wǎng)站    
      版權所有 © 長(cháng)沙市天心區斌網(wǎng)網(wǎng)絡(luò )技術(shù)服務(wù)部    湘公網(wǎng)安備 43010302000270號  統一社會(huì )信用代碼:92430103MA4LAMB24R  網(wǎng)站ICP備案號:湘ICP備13006070號-2  
      国产精品久久久久精品|久久网国产精品色婷婷免费|国产另类小说 视频 中文字幕|亚洲欧洲日产国码在线|2020最新国产在线不卡A|无码人妻少妇久久中文字幕蜜|99国产一区二区精品久久

          <rt id="tf2wb"><bdo id="tf2wb"><kbd id="tf2wb"></kbd></bdo></rt>
        1. <button id="tf2wb"><thead id="tf2wb"></thead></button>

          <rp id="tf2wb"><bdo id="tf2wb"></bdo></rp>
          <delect id="tf2wb"><td id="tf2wb"></td></delect>
          <rt id="tf2wb"></rt>
          <rt id="tf2wb"><bdo id="tf2wb"></bdo></rt>