Profile cover photo
Profile photo
SEO 搜尋引擎優化
66 followers -
SEM(Marketing), SEF(Friendly)... SEO 3.0
SEM(Marketing), SEF(Friendly)... SEO 3.0

66 followers
About
Posts

Post has shared content
雖然要去了解這些數字的意義有點複雜, 但這也是必要的工夫阿..
網點 (網站完全評點) 的目的不是單純的從資料探勘 Data Mining 來看搜尋引擎最佳化 (Search Engine Optimization), 因為要了解自己網站的狀況, 除了像 Google Analytics 或 Webmaster Tools 之外, 須要使用的工具還很多, 有些是要自己做, 有些要參考的資料不只是自己而已, 甚至有些要以各種面相去觀察.

所以除了搜集資料, 儲存資料的歷史外, 更重要的是要用甚麼方式去呈現, 畢竟資料最後是要給人去了解的, 而了解的容易與否取決於資料呈現 (Data Presentation) 的好壞, 只是說到這個 Data Presentation 是我的弱項, 雖然如此我還是努力去試試看.

在之前的一篇 "從數字的歷史來看網站經營, 網點: 網站完全評點", 提到 Data Cleaning & Correcting 之後用簡單的圖表來呈現, 其中用的是 Google Chart Tools 的折線圖, 而 Google Chart Tools 也有一個 Table 的工具, 所以在數字比較的表格, 我也嘗試著用 Google Chart Tools 來畫.

比較有趣的是這個 Javascript 的 Table 可以按照自己的觀點來排序, 因此可以觀察的出那一個數字, 或那個比例值對排行榜影響比較大, 只是要比較的話, 當然是以相同關鍵字但的不同網站來觀察, 所以我做了一個這樣的網頁, 例如大家可以看兵家必爭的 "購物網站" 的狀況: 

這個是以購物這個關鍵字來看這幾個 EC 網站的各項數字的表現, 若在這邊看不到, 大家可以直接去看看.

從這邊大家可以看得出來, 連結數是很重要的關鍵, 當然那四項比例中, 專注度與標題比對排名的影響較大, 尤其是專注度, 相較收錄數分數等等的單一數值來看相對重要, 但這個往往是個很麻煩的問題, 基本上網站收錄數越多, 比例也會降低, 但也代表的內容的專注度要靠更多的內容.

就像是我在 Facebook 上面有說到, "畢竟在做 SEO 的人知道內容是王道, 外部連結是女王, 而網址是無法動搖的基礎, 而我們來檢驗連結的 "錨定文字" 吧.", 內容最後還是重點阿.

只是這些都是種說法, 若你想要多了解的話,可以自己輸入自己的網站以及跟你競爭網站的網址, 只要是用相同關鍵字建立, 都可以在 "關鍵字比較" 網頁看到這個表格, 然後可以多多觀察與實作, 畢竟我都常說, 要真的了解網站與 SEO, 須要多年的經驗, 其中包括唸書與實作, 這樣才能真的提升自己的能力, 想靠黑帽 (只靠行銷而不管內容) 的方式來操作, 雖然我也無法阻止, 只是我這邊也幫不了忙.

P.S. 此網比較表網址為 http://seo.datamining.tw/skid.php?skid=170

Post has shared content
畢竟在做 SEO 的人知道內容是王道, 外部連結是女王, 而網址是無法動搖的基礎, 而我們來檢驗外部連結的 "錨定文字" 吧.
若能做出以網站自身內容的關鍵字做成錨定文字做延展, 這對幫助使用者操作, 提高內部連結, 加強關鍵字強度, 增加內容性等等都很有幫助,

瘦肉精網址: http://seo.datamining.tw/keyword.php?keyword=%E7%98%A6%E8%82%89%E7%B2%BE

在開始寫這篇之前, 先弄個小 box 讓大家回顧之前有關 網站完全評點 (原SEO鑑價系統) 的文章:

對黑帽 SEO 的回應 (SEO 鑑價系統的初探 I)
內容關鍵字的數量與比例 (SEO 鑑價系統的初探 II)
你找的 SEO 公司真的有成效嗎? (SEO 鑑價系統的初探 III)
從部落格觀察的失敗來看 Crawler 的設計 (SEO 鑑價系統的初探 IV)
SEO 評價的四面相 (SEO 鑑價系統的初探 V)

除此之外, 也寫過兩篇文章:

從關鍵字使用量看社群使用量, 台灣對臉書的依賴過高?
從數字的歷史來看網站經營, 網點: 網站完全評點

這幾篇文章可以說是我對 SEO 中的稽核部份的數字觀點的小結與再出發, 而說到再出發也包含了一些新的實驗與實作, 其中最近做了一個相當有趣的實驗, 就是利用 Google 的搜尋結果來做 "語意網路" 的延伸, 這是相當有趣的, 例如

以觀光這個字來計算, 可以算出下面兩種面向的延伸:

延伸關鍵字 : 觀光巴士 糖廠 旅遊網 黃健庭 旅遊資訊 王乾發 旅遊 酒廠 李朝卿 台灣旅遊  
被關連 : 公車 旅遊網 糖廠 旅遊資訊 交通 軍人

而用馬英九來計算, 結果是: 
延伸關鍵字 : 總統 胡志強 黃敏惠 陳水扁 王乾發 蘇貞昌 總統府 謝長廷 傅崐萁 證所稅  
被關連 : 瘦肉精 蘇貞昌 林書豪 國民黨 陳水扁 總統府 證所稅 總統

大家有興趣可以自己點進去看, 例如 瘦肉精 可以延伸出甚麼?

這就是一個有趣的 Data Mining/Text Mining (文字探勘) 的小實驗, 以這系統自己本身已有的關鍵字資料來做延展, 這對幫助使用者操作, 提高內部連結, 加強關鍵字強度, 增加內容性等等都很有幫助, 這也是我在很多公開場合講過但還沒寫出來過的不算密技的密技, 因為這個是大家都知道, 但實作出來卻須要很多背景知識與經驗.

上面這個本該是獨立出一篇文章, 但可以寫的東西太多, 反而沒有時間完成, 在這邊就小提一下, 但在這次的實驗中, 是增加 inanchor 與 inurl 的觀察.

我在有次回答 +ET Blue  有關 SEO 的時候, 有說到一點 SEO 重要依序:

1. 網域名 Domain Name
2. URL
3. 標題 Title
4. Head 的 Tag
5. 其他 Logical Tag 
6. Alt, Desc 等符合 "無障礙" 的 Tag
.....
N. 關鍵字密度 Keyword Density
.....
M+N. Meta Data
....

這篇內容寫在 最重要但也最沒用的 SEO 心法裏面, 大家可以去看, 只是網點站好像沒有針對 URL 下去做, 尤其是在外部連結的 "錨定文字" 下工夫, 雖然這些在 Google 上面都有資料, 但這也是最麻煩的.

記得有一次 +octw chen  問到我說, 為甚麼 Google 能夠在這麼短的時間內算出這個字有出現 12600000 次, 這是多可怕的計算量阿! 但我回答說, 事實上這是個推估, 因此只有 3 個有效位數, 並不是真的去從頭到尾算一次.

但也因為是推估的關係, 所以常常會有數字相當大的跳動, 這跳動不是只有 10%~30% 的跳動, 而是數十倍到百倍的跳動, 例如右表就是逐日去取樣 Google 對 SEO 這關鍵字的推估數字, 而 Google 已經是這樣子了, Bing 更是慘不忍睹阿... 所以說, 在資料探勘中, 要面對的一個大挑戰不是 Crawling 抓取而已, 而是這種二次資料, 須要很大的工夫去做 Data Cleaning and Correcting, 資料乾淨與正確化, 這部份我花了一個月才弄出好的演算法來畫出上次大家看到的網站成長圖, 不然會是個到處跳動的轉折無法判斷的圖.

而 inanchor 與 inurl 為甚麼之前都沒有在計算, 因為這個誤差跟跳動比連結更可怕, 畢竟在這種 Big Data 的資料處理大多是有用 Cache 快取的機制, 若是很少人會查詢或第一次查詢時誤差會相當的大, 相對的若是常用的話就會比較準確, 而這部份的 Data Cleaning 是比可怕還要可怕.

而外部連結與錨定文字之重要性不說大家也知道, 在 Webmaster Tools 中, 不只是對 Crawler 抓到的內容做分析, 其中也把外部連結之錨定文字也列出一個章節, 只是外部連結的錨定文字我們無法去改變, 但網站內部的錨定文字總是可以下工夫努力的吧?

只是這部份 Webmaster Tools 也是沒有 History 歷史分析與成長, 幸好有 "網點" 站, 所以現在可以放心大膽的去來抓資料要驗證計算, 以及幫忙作歷史, 畢竟在做 SEO 的人知道內容是王道, 外部連結是女王, 而網址是無法動搖的基礎, 而我們來檢驗外部連結的 "錨定文字" 吧.

所以, 等過幾個星期累積到足夠的資料我們再來好好評點吧.

備註: 錨定文字指的是 HTML Tag 中 <a href=網址>文字</a> 中的文字, 因為 a 是 Anchor, 所以稱為錨定文字或錨文字.

Post has attachment
我不得不承認 SEO 的人真的很花心力去注意 Google Plus 的一些操作, 因為這不只是 SNS 的一個環節, 更加上這是 Google 的作品, 這兩天就有兩篇不錯的文章值得看:

在 SEO Moz 中, 寫了五點有關在管理社群的要點: http://www.seomoz.org/blog/5-tips-for-managing-community-on-google-plus

1. 檢查你的回應與通知 Check your notifications & respond
2. 搜尋你的品牌, 名字與關鍵字, 並回應 Search for your brand/name/keywords & respond
3. 檢查你上篇文章的漣漪 Check the Ripples for your latest content
4. 直接連接你提到的品牌與人 Mention other brands and people directly (Google 的 +)
5. 開始討論與聊天 Start a chat or Hangout

這五點雖然大家都知道, 但有些是因為這 G+ 強大的工具所貢獻的.

另一篇是在 Search Engine Watch 提到的 SEO 與媒體覆蓋衡量的 7 個新思維, http://searchenginewatch.com/article/2166570/7-New-Ways-to-Think-About-SEO-Converged-Media-Metrics

1. 注意傳統 SEO 的對應價值 Match Value to Traditional SEO Metrics
2. 分辨主動與被動的價值 Distinguish Between Reactive vs. Proactive Metrics
3. 先行放置一個預測有價值的 SEO 衡量 Place a Value & Forecast SEO Metrics – Think Beyond Just Ranking Position
4. 擁抱社群媒體 Embrace Social Media Metrics & Objectives
5. 使用對的工具與科技來獲得對的價值衡量 Utilize the Right Tools & Technologies That Get You The Right Metrics
6. 向對的人提報對判斷 的Report The Right Metrics to The Right Person
7. 對外提出你在這部份是有利基與價值的 Attribute Credit and Admit That You’re a Marketer

事實上這篇有很多不錯的圖例大家一定要去看, 我這邊就不去一一解釋了.

Editor: +Gene Hong

Post has attachment
大概寫出這篇已經沒有回頭路了吧....

"所以這個系統當完成之後, 希望能夠真的發揮到讓黑帽 SEO 現形的目的阿..."

Post has attachment
事實上我在寫這篇文章中是為了自己整理想法寫的, 並作些重定義, 且是要放在系統實作的說明的.

Post has attachment
這個圈圈打算是找一些比較 "白" 的 SEO 工作者可以發表的地方, 就以這篇文章做引子, 而想要在公測前知道有關 "SEO 鑑價系統", 就一定要加入才行.. 呵呵.. (因為這部份只發表給圈內人士看)
Wait while more posts are being loaded