Profile cover photo
Profile photo
食夢黑貘在居家 ?
2,578 followers -
黑貘所有文章, 你敢看就加吧! 從捷運日記到黑貘來說, 還有其他知名與不知名的地方都會導到這邊吧?!
黑貘所有文章, 你敢看就加吧! 從捷運日記到黑貘來說, 還有其他知名與不知名的地方都會導到這邊吧?!

2,578 followers
About
食夢黑貘在居家 ?'s posts

Post has attachment
如何優化網址 (ver 3.0) , Basics of SEO friendly URL (ver 3.0)

前幾天看到有人分享一篇文章, 講到有關網址 URL 的一些觀點, 只是這篇文章的範例是取自於 2009 年前 MOZ 的資料, 以現在的角度多少有點不一樣了, 所以就當作是回應給朋友參與討論.

這五年來說起來變化也是挺多的, 其中包含幾個因素: 

1. Canonical URL: 典範網址的始用, 由於社群分享, 追蹤碼到處林立, 一個相同的網址被夾雜很多參數是必然的, 雖然透過 Webmaster Tools 可以經過設定讓 Search Engine 知道, 還不如直接把每一個獨特內容提供一個 "典範網址", 這樣大家都不會認錯.

2. 網址的 Ranking Factor: 在之前網址是一個很重要的 SEO 排名因素, 而現在已經被調得越來越低了, 當然是因為有些角度這樣對使用者是有利有弊, 有時是很好辨識的方法, 有時又是很煩人 (Annoying), 最後也是因為被某些過於黑帽的 SEOer 過份的操弄, 最後 Google 降低其重要性.

3. RWD (Responsive Web Design): 現在很多網址都也因為使用者的 Browser (Agent) 來調整角度, 甚至有些瀏灠器是不合適使用 URL 的, 所以 URL 的價值也跟以前的角度變得不一樣.

4. Bing 的興起: 因為 MicroSoft 觀點儲存網站, 會把 URL 的路徑真的當成 Folder, 以此 Folder 來做管理, 處理與聚合, 在大部份時候, Folder 類似的路徑的確是可以對應到真實的檔案與路徑, 以這觀點來看是相當合理. 

但當然網址是最重要的 SEO Ranking Factor, 尤其是網域, 但這網域這因子是最難去改變的, 所以在操作上實務並不高, 倒是次網域之後倒是可以去 "操作" 的, 在這邊來看網址與最新 SEO 的角度思維為何?

1. 子網域: 以現在 RWD 的角度, 已經不建議使用 mobile, m 等等用次/子網域來做為 View (視角) 的切換, 子網域要考慮的還是系統面, 尤其是在網站架構的完整性, 也就是說一個具有 "高內聚性", "獨立性/低藕合性" 的內容與功能, 再來切割子網域, 也就是切出子網域會造成內容重覆是盡量避免. 除外還是要保持一個網域有一定足夠的內容, 這數字大概 300~3000 頁, 或 1/10 到 1/3 之間. 

2. 頻道 (分類): 在網域之後的網址第一個 "/" 的 "Folder (檔案夾)" 是最重要的, 通常是指這網站的 "頻道", "分類", 而這個算是大分類的頻道, 因此一定是最高層的分類, 事實上網址的概念都是以這樣去做切割, 通常建議是頻道數不要超過 10 個, 而通常建議這個 Folder 最好是有字意的, 也就是不是用代碼或數字來做切割.

3. 功能/程式: 第二個 Folder 通常是種 "條件" 與 "指向", 通常很多人習慣把這個放在第一個 Folder (目錄), 但通常最好第一個目錄放更上層, 更有意義的頻道與分類來使用, 而功能與程式最好放在第二層, 通常透過 Pattern Match (樣式對應) 的 Rewrite (改寫) 這樣就很夠, 不見得要放在最前面, 雖然是稍微複雜一點. 

4. 概念 (關鍵字, 標籤): 第三層的 Folder 是以概念做聚焦, 通常是關鍵字, 標籤, 分類或次分類, 若是以 SEO 的觀念來看, 就是使用者會搜尋用的關鍵字的聚合, 只是通常不須要一定是此關鍵字 (Keywords), 以現在來看, 只要有用相同概念的, 放在同一個目錄下是很有聚焦的想法.

5. 其他參數: 到這邊就已經有三層目錄了, 基本上應該就很夠了, 其他的參數就當作一般的 GET Parameter 來作傳遞沒甚麼不對, 只是可以在問號 (?), And (&) 等符號做些修飾就更好了, 甚至在某方面這參數也當作是程式的另一層導引也不是不可以.

6. 頁數等 Scope/View (日期, 排序, 條件過濾): 理論上上面五項就可以組出一個完整的網頁, 但往往這樣的條件會有很多頁, 所以有時會須要作日期, 頁數, 排序, 條件等等建立不同觀點的網頁, 因此此時還須要以這觀點做再一層的聚合是對網站結構是相當好的.

從上面這幾項, 該如何實作出該有的網址呢? 這邊以 "新文易數" 來做範例:

http://tag.analysis.tw/news/tag/柯文哲/all/20150101/view=1

Analysis.tw 有很多個網站, tag 是專門分析標籤的系統, 而 news 是指在新聞類這個頻道 (Channel) 下來看, tag 指的是標籤的觀點, 聚焦在後面的柯文哲這個 Folder, 而此 tag 標籤下的都是在這之後做使用, 像 all 指的是全部的新聞, 事實上是會跳到 tag_all.php 這隻程式, 所以程式事實上會呼叫的是:

http://tag.analysis.tw/tag_all.php?type=news&tag=柯文哲&date=20150101&view=1

若是以下面的網址來看, 大部份的使用者是無法知道他在看甚麼, 但上面的網址就很好解讀, 甚至給搜尋引擎來看也是相當合理且有聚焦的, 而從 "/tag/柯文哲/" 這 Folder 目錄為一個聚合點, 這個就是只靠 "參數" 做不到的, 而在 Rewrite Rule 的寫法是:

 ^/(.)/tag/(.)/(.)/(.)/(.*)   =>    /tag_$3.php?type=$1&tag=$2&$4&$5

而這邊只是做個範例, 事實上實作上還是有些許差異....

會這樣做, 不只只是為了 SEO (搜尋引擎優化), 而也包含對使用者, 對社群等等做出一個 "友善/Friendly" 的網址, 而人習慣是由大範圍而慢慢縮小的觀點來看是較為合理的, 因此網址若是這樣做, 就都很直覺, 最後這樣重組網址的思維, 會對於你對網站經營有更完善的思維, 而所謂的 SEO 就只是順便做好而已.

Post has attachment
從 Google Analytics 網站分析元素看電視收視率

網站經營最基礎的就是看網站分析, 而網站分析最常用的就是 Google Analytics, 透過網站分析的使用者行為, 可以做為經營網站很重要的參考, 一個初入門者, 通常至少要了解 GA (Google Analytics) 的 20~30 項元素的意義, 一個較為進階的管理者通常要知道 50~100 個 Dimension (維度) 與 Metics (指標) 所建構出來的報表, 事實上目前 GA 就 Core Report (核心報表) 的維度與指標已經有 424 項以上, 且隨著經營的須求一直在增加.

為甚麼要那麼認真呢? 一個網站每一個點擊都是有意義且可被計價的, 所以必須對使用者的行為錙銖必較, 因為若能對網站使用行為了解越多, 越可以去讓網站更去優化, 透過這樣的進步若能讓使用者更願意使用者使用網站, 收益自然越多.

當然建置一個網站的成本跟電視節目是很難比較的, 有成本很高的網站, 也有成本很高的電視節目, 但扣掉帶狀節目的觀點, 最大的差別就是網站一做出來就是經營的開始, 相對的電視節目做出來, 內容就不會改變, 就很難從優化的角度來看電視節目, 只是這是以單一電視節目來看, 以節目的經營來看, 現在已經很少不是帶狀的節目, 此時若不更去了解使用者的意向, 這種投資很容易是漫無目的, 甚至是瞎子摸象, 所以電視節目就須要 "收視率報告" 來幫忙.

只是我們回頭來看現在的 "收視率報告", 不要說是跟網站分析比起來是 100% 無抽樣全體資料搜集, 收視率的樣本通常是連 0.1% 都不到 (目前約是 0.02~0.03%), 其元素 (維度與指標) 全部不超過 20 個, 相較網站分析超過 400 項幾乎可以說是簡報的大綱, 此時來去套用在廣告價格動輒百萬的觀點來看, 真的是相當粗糙, 當然這是有原因的, 因為電視廣告的賣法就是只看收視率, 這是廣告代理商長年 "教育" 買主的結果.

或許也就是因為網路廣告的計價, 是可以到很精確到每次的 Click (View), 透過機制架構很精確的以算出來, 而電視的廣告主要是透過業務的報價 (或是漫天開價), 最後只要交出一個半分真半分假的結案報告, 其樣本數與題目說不定比收視率更模糊, 最後只要業主願意買單就好, 所以廣告界產生一個有名的笑話:

"我們知道廣告有一大半都是浪費掉, 問題是我們不知道是那一半"

但若真的廣告看的是目前收視率的報告而言, 也只能如此, 但事實上以現在的角度來看, 收視率應該可以更進化, 不只讓經營者 (電視節目製作者) 更了解觀眾的想法, 廣告買主也應該更可以知道使用者是如何看的, 甚至我們可以嘗試著以 "網站分析 (GA)" 的元素來思維電視收視率要如何改善.

網站經營有七大項數字, 在某方面是可以嘗試著去延伸電視收視率的基礎:

1. Sessions (Visits):  訪客數在某方面可以說是使用者有到過這個電視頻道的數目
2. Users: 使用者數可以成為有真實的觀眾總數
3. PageViews: 點閱數大概就是這節目的總時數
4. Pages/Sessions: 平均點閱數幾乎就是目前的收視率
5. Avg Session Duration (Time on Site): 在網站時間可以比喻成每次轉過來看的人會停留多久
6. Bounce Rate: 可以定位成在下次廣告節目結束前就轉台的機會
7. % New Sessions: 有多少個新使用者, 這可以定義成第一次來此節目或是只停留一次的人比例

從這邊來看, 似乎收視率的變化就多很多了, 且都有相當的意義, 再加上既有的 Dimensions, 如性別,  年齡, 收入, 等等的維度, 那變化就可以更多了.

事實上這些最大問題在於收視率不單純只是收視率, 更重要的是收視者的變化, 尤其是轉台, 回訪等等的動作, 甚至以賺取更大的 "覆蓋率 (Coverage Rate)" 或廣告效用 (透過 Turn Over Rate/Bounce Rate) 的方式來去對廣告或電視製作有更好的效果與參考.

以現在的機制與技術, 要做到真的 Realtime 即時分析不是難事, 只是這背後有很多機制與運作, 尤其是目前我們習慣是用 "節目" 做為切割單位, 事實上有時是不夠的, 甚至應該是用其 "Highlight" 也就是某些時間的爆點, 來去看這些數字更有意義, 只時此時就要經過建立 Timestamp (時間點) 的 Meta-Data (後設資料/元資料), 就可以去找出某個節目, 或某個活動 (轉播) 或是脫口秀的精華, 只是這又須要進一步的開發.  

Post has attachment
 Automate This: 演算法已經統治世界了....
有人說, 雖然最終人類可能無法創造出人工智慧, 但是人工智慧還是會被工人給 "運作" 出來, 這邊的工人指的就是人類文明的結晶, 而這個結晶的實作之一就是 "演算法".

演算法說穿了就是把人從眼睛看到的事物, 透過一種想法或感知以及應證其經驗, 然後做出行為與動作的一連串步驟, 只是一個人能夠做到的, 就是有限的眼睛, 有限的經驗, 有限的判斷, 最後也只是做出有限的行動.

若是把這些有限放到非常大, 甚至速度是非常快, 舉個例子來說, 若是有一個醫生, 他擁有上億個醫治的經驗, 且每秒 10 次的測量出你的心跳, 血小板, 等等數字, 然後做出判斷預測, 隨時且即時的對應其可能性做出診治, 當然這個醫生不可能是人, 而是一套透過許許多多演算法所創造出來的系統, 只要其病症不是罕見或從未見過, 你認為這套系統難道不只會讓病情更快康復, 也會更降低醫生所須要的精力與錯誤率.

而能夠做到這件事的, 雖然靠的是電腦, 但說穿了還是背後的人, 背後的智慧結晶, 就是現在最熱門的 "巨量資料 (Big Data)" 這概念, 這概念實作與實現的基礎, 就是 "演算法", 而演算法就是把人的行為與想法變成一種模型, 然後把這模型透過程式去執行, 而執行的內容就是巨量的量化資料, 所以說透過演算法去延伸人的能力與智慧也不為過.

只是說要完成這樣的事情也不是只有演算法而已, 甚至應該說只是一個環節罷了, 要完成這環節, 至少要三個大環節才能做到:

1. 硬體, 網路與系統: 雖然說演算法最早可以追溯到 1680 年代的加法機, 甚至演算法之母是在 1850 年的 Ada, 但真的實用到廣為應用還是因為整個硬體架構, 包含計算能力, 記憶體, 傳輸資料等等的細部環節慢慢的組合起來變成實用的系統, 演算法才有真正的價值, 這本書也花了不少部份著墨這些技術的成長, 在某種觀點, 這才是決勝點.

2. 程式設計, 資料庫與其系統: 有了硬體與作業系統跟架構, 就要有相對應的軟體去寫作與實作出來, 畢竟這些都是靠人去完成的, 不是只有人能夠看到的硬體才是系統架構與實作, 程式設計才是把演算法實現的最本質的事, 當然要去能夠執行與串連運作, 是須要一個很完善的設記, 資料要儲存要有資料庫及相對應的硬體, 這些若沒去完成是不存在的.

3. 數學與演算法: 雖然說演算法是核心的核心, 若沒有前兩項也是無法有價值的, 但或許是因為前兩項的人才以現在的狀況是較多, 會了解數學與演算法的人較少, 所以其稀少性較高造成水漲船高, 只是這些都是整合的要素之一, 缺一不可, 當然最好是有人能夠對這三個項目都能夠了解, 在目前大家對資料演算法不夠了解下, 才能夠帶領真的完成有實用的系統.

最近有一本書叫 "演算法統治世界", 讓你知道這些過程是甚麼.........

雖然說這本書是完全是以說故事的方式帶出整件事, 但畢竟不是技術書, 所以並沒有讓你深入了解演算法, 無論就技術面或數學面都完全沒有提到, 若你是想說透過這本書知道這前因後果, 甚至知道未來的可能性, 但若知道甚麼是演算法, 是不太可能的.

畢竟在大學講甚麼是演算法, 最常用的教科書是一本超過 1000 頁的 Introduction to Algorithm, 這本書還只是個最基礎不過的介紹 (Introduction), 從入門到能夠實作出來, 進一步做出有用的系統, 不可能是只靠看這本書就完成的, 甚至我更擔心的是看過的人會由一些應用結果來猜測甚麼是演算法, 且跟本是錯誤觀念, 因此請大家千萬不要踏上這錯誤路徑.

但這本書只是為了讓完全不了解演算法的人, 有一個演算法對社會性與商業性影響的了解, 可是千萬不要拿著這本書去要求技術人員, 或以為技術人員就可以做出來, 因為這完全是兩回事, 因為從這本書到最後做出來, 還須要超過幾十本書到幾百本書, 但看完至少你對這議題有基礎的了解.

這本書從金融, 音樂創作與市場, 客服系統, 運動等等, 這些透過各式各樣的演算法去預測, 去創造出更高的價值或改善其準確度, 甚至對政治都能夠預測最後人心的走向, 這些不是天方夜譚, 這些都是實例, 只是這些都須要背後有大量的運算, 其中包含數學與程式設計.

當我們能夠把人的行為步驟寫成程式碼, 把事物給數量化之後, 很多事情不只能夠自動化, 此時效率與效能會比人類強很多, 而這本書就是在寫這幾十年來, 各個領域在這方面的努力與挑戰, 甚至是當時認為是天方夜談的, 現在早就已經有人做過了, 只是這個狂想須要付出很大的努力與代價.

所以我們現在也可以開始對未來做夢, 但更重要的是透過學習與實作, 把這個夢實現, ... 在此之前可以從這本書看看別人是怎麼做夢, 以及將之實現的, 無論你是不是在資訊界, 因為還有很多領域等我們去挑戰, 也因為這樣的開始, 這個世界都在改變. 

Editor: +Gene Hong 

Post has attachment
 Tainan Hackathon 2014 台南黑客松後記

這次台南的黑客松, 可以說是在台南市目前最大的 Hackathon, 因為之前大家從沒想過台南辦得出這麼大規模的黑客松, 有超過 100 多人參加這 33 小時的活動.

會辦黑客松是台南市政府想辦個跟文創相關的活動, 剛好台灣數位文化協會問我, 我當時一直在想著 Hackathon, 所以自然而然的脫口說辦黑客松好了, 當時大家還討論了一些如何用文創的角度來看黑客松, 而沒想到過了幾個星期, 就真的要辦了.

當然若只是辦 Hackathon 是不夠好而已, 因此就把焦點放在 Open Data 上面, 尤其是台南市在 Open Government 這塊可以說是做得相當好的, 不得不在這邊讚揚一下台灣數位文化協會幾個在南辦的朋友, 長期在台南經營下有所成果.

既然提到 Open Government 與 Open Data, 我就追加了 Open Civic 開放公民這個議題, 了政府要做 Open Data 開放資料, 推動開放政府 Open Government, 人民除了參與開放政府的運作外, 更要以身做則的做些開放市民該做的事.

而也在 Hackathon 那天也辦了個 Open Civic 講座, 很巧的是找了 g0v 以及沃草的人, 加上我自己與主辦單位 (台南市政府), 剛好是說開放公民要從個人下手, 然後組織運作 (g0v) 以及成立公司 (沃草), 也更須要公家機關 (政府) 的協助, 透過系統的實作, 經營, 然後民意的搜集與呈現, 才能做到 Open Civic 與 Open Government.

而我當天的投影片如下:


Open civic 開放公民 from Gene Hong

只是話說回來, 我那天講的不夠好, 因為知道是 45 分鐘, 想講的東西又很多, 前面就講得急了點, 所以感覺好像在背課文而不夠生動, 而後面放慢腳步後就好一些了, 只是相較前面兩位 Kiang 與雨蒼兩位講者的 Presentation 就遜色很多了, 還虧我提議主題是我最熟的 Open Civic.

在台南辦 Hackathon, 參加的不只是台南人, 而外地的人來參加, 就少不了美食, 第一天的晚餐是永樂燒肉飯, 第二天的中餐是日喜雞腿蒸蛋飯, 我知道有人在詢問是甚麼, 所以很刻意的寫出來.

最後第二天下午重頭戲就是評審了, 35 隊聽 3 分鐘就是個接近 2 小時的轟炸, 要從中取出前三名以及台南特別獎真的是一刻也不得閒, 若下次超過 2 小時, 真的會建議主辦單位給評審有個空檔呼吸一下空氣.

雖然說在一個半小時聽完這麼多參賽隊伍評分很累, 但更累的是參賽者, 所以更要認真做, 而在這邊, 我大概歸納我這次評審的感覺:

1. 我最喜歡的是一個利用 Open311 做開放平台的, 只可惜因為平均分數不夠, 我就放棄獨排眾議幫他們逆轉.

2. 因為三分鐘的 Presentation, 對很多做得豐富的就很吃虧, 又加上 Demo, 三分鐘真的不太夠, 下次可以改為五分鐘, 且給評審一個喘息空間.

3. 也因為沒有足夠的 Demo 與沒有 Code Review, 在某方面只要題目訂好了就決定名次, 幸好最後得獎的我大都認同.

4. 這次評分項目有一項台南在地化, 所以很多 "By the way" 台南產業可以應用的就很吃虧, 即使成熟度很夠, 但最後雖然緊追在五名後, 但最後沒得獎也是很可惜.

5. 原本我很擔心學生組表現不會很好, 畢竟有些職業級的就經驗與能力本來就有差距, 所以有建議前三名至少要有一組學生的, 幸而最後前三名本來就有學生團隊, 且除外的整體水準也不錯, 此時也燃起我對未來的期望.

6. 比較可惜的還是大多人在題目都沒有太多跳脫, 不是在美食, 旅遊, 古蹟, 若題目沒有特色的話成熟度就變得很重要, 而 Hackathon 本來就不太可能足夠成熟, 所以在這部份很吃虧.

但不得不否認的, 最後的成果比我預期好很多, 尤其參賽者的表現讓我發現即使我參賽, 也不見得能夠得名, 而原本擔心的台南地方開放資料使用不多的憂慮, 也隨著看到大家的題目讓我放心, 最後更發現這樣的 Hackathon 對地方的人才, 對地方發展的刺激都是有相當正面的鼓舞, 真的還是蠻希望這種黑客松能夠遍地開花阿...

Post has attachment
服貿東西軍 -- 從大家貼的連結來看民意

在去年, 透過林克傳說, 曾經做個實驗, 就是 "了解你與你的朋友是在支持同志或尊重同志", 透過連結分享的計數來知道大家的想法, 這次在服貿也嘗試這樣做看看, 只是把議題不只是限制在服貿, 還包含對立法院議員諸公的行為以及佔領立法院的行為來看支持率.

這聲量不只只是去算連結, 而是去算轉貼連結的觸及率, 也就是轉貼的次數越多, 越多人轉貼或被追蹤人數越多人的人轉貼, 聲量就會很高, 所以只是看連結的網頁, 往往是種類似 "媒體" 的觀點, 相較聲量就是有點 "社群" 的思維,  所以從下面的表來看, 支持服貿, 支持速過服貿以及反對佔領立法院的訊息並沒有很少, 但社群聲量的觸及率差距就會較大.
 
六項統計見下:

目前 反對服貿 有 51 連結, 聲量 134355, 占比 89.2%
目前 支持服貿 有 16 連結, 聲量 16188, 占比 10.8% 

目前 反對黑箱服貿 有 25 連結, 聲量 81307, 占比 90.4%
目前 支持速過服貿 有 8 連結, 聲量 8657, 占比 9.6% 

目前 支持佔領立法院 有 54 連結, 聲量 94029, 占比 90.6%
目前 反對佔領立法院 有 18 連結, 聲量 9713, 占比 9.4%

這些都可以從服貿東西軍看得到, 且這數字是一直會變動的, 因為隨著文章的增加, 以及轉貼的增加, 這都好像在做某種投票的味道. 只是真實狀況如何, 多少還是有些偏差, 其中有兩個因素最明顯:

1. 社群的意見通常有反威權的傾向.
2. 有時分享連結不見得是支持而已, 也會有可能是批判與反對.

當然這兩個現像的屬性是相反的, 而這兩個到底是那個比較強, 這就要有更多的觀察才會知道.

但事實上做服貿東西軍真正的目的不是為了去做支持率比較, 真正的目的是想透過這樣的系統, 讓大家了解大家各面項的想法, 而不是承現一面倒, 無論是大眾媒體或社群媒體, 只要是單一窗口, 就很明鮮是只有一種觀點居多, 就像是想從一個想法來達到公正客觀是不太可能的, 任何言論都有其方向與立場, 唯有總合所有的觀點與想法, 把這數量極大化, 才有可能 "趨近" 於公正客觀.

所以服貿東西軍是想要讓大家看到各種想法的對應, 對照, 從最新或最多人看到的排序來獲得更多的資訊, 讓我們做出更好的判斷, 透過這樣的決策與判斷, 來去對社會與公眾事務來更了解, 甚至透過這樣的轉貼來表達你的立場, 呈現 "真正的民意", 而不只是靠 "名嘴", "發言人", "意見領袖" 等來做決定.

因此更希望的是, 從這樣的資訊閱讀, 你可以找到你最認同的觀點, 然後推播給你的朋友, 並描述你的立場, 透過這樣的討論, 更強化其聲量, 此時民意又會更彰顯, 這樣才是真正的民主, 才是真正的政治.

Post has attachment
九項如何建立有效商品推薦系統, 所須要知道的進程導引與架構指南 

任何電子商務類型網站, 除了商品上架外, 一定會問的是如何銷售, 當然這些一定是架構在商品的功能與消費者的須求, 雖然有時透過行銷的手法, 來 "創造" 出商品功能與消費者的須求, 這些通常會創造不少業積, 但在很多狀況可能造成 "消費錯誤" 的機會有時會更高, 雖然感覺一時有業積的進來, 但最終也不是一個好的消費體驗.

所以就會有人在問, 以一個電子商務型網站的通路, 到底要如何推薦給消費者對的東西?

不得不否認, 最後賣場主打的一定是高利潤, 高銷售, 或者是跟廠商配合商品, 畢竟就商品操作人員能力有限的情型下, 人力限制是最大的瓶頸, 因為一個好的商品操作人員無論就市場敏感度, 商品本質, 銷售方式與對市場的知識與品味, 往往會決定一個商品最後的銷售狀況, 如何把這能力透過系統去覆制是每一家公司都想追求的事.

但事實上以目前的技術來看, 在面對少量商品與少量客群, 有經驗的商品操作人員還是無敵的, 只是我們面臨到的問題是:

1. 真的有經驗與能力的商品操作人員真的很少
2. 電子商務網站面對的是大量的商品與大量的客群

也就是說, 好的人才的確是最稀少可貴的資源, 而在這前題下, 我們應該設計出甚麼樣的商品推薦系統來輔助銷售呢? 事實上很多人在被 Data Mining (資料探勘) 與 Big Data (巨量資料) 的洗腦下, 想到的大多是這些道聽徒說的方法, 但事實上完成這些系統都不難, 只是任何系統都有很多前題與成本, 以及最後產出的效應, 甚至更應該說, 人有趣的地方在於多元, 每一個人的須求都不一樣, 所以推薦系統也該不一樣才對, 想要追求一個完美系統這樣的邏輯是很危險的.

那我們來分幾個層面來去導引大家去實作推薦系統:

I. 分類系統 (標籤系統):

分類往往是人在搜尋東西最直覺的方式, 由多到少, 由上到下的分層分類法在人類的思維大概是種本性, 當然比較早期的模式因為儲存方式與成本是用階層式的分類系統, 現在主要是用網狀標籤系統或者是單純的 Tag 系統, 這都是行為輔助的聚焦方法, 非常符合人性, 說是沒有用是說不過去, 因此若沒有一個基礎的分類或標籤系統, 就輸了一大半.

2. 排行榜:

當有了瀏覽與購買行為出現之後, 接下來就是排行榜, 畢竟, 人的行為不是具有共通點, 不然就是會有群眾效應, 或者是經過媒體廣告行銷等催化的結果就是排行榜, 越多人買的東西往往代表有一定的趨勢, 這個在不是網路行銷時本來就很有用, 但畢竟在早期資源有限, 無法分群與個人化的前提下, 排行榜多少也是唯的方式, 所以無論是沒有排行榜資訊或只有排行榜資訊, 是件很糟糕的事.

3. 分類排行榜:

當然前面兩個方法都是有用的, 加起來也一定是有用的, 且當分眾之後, 理論上資訊會更正確, 因此若是沒有更好的推薦方式之前, 用這分類與排行這兩個基礎是相當簡單且好開發的, 只是這差別是在分類要多細緻, 或者是說可以用在其他的的方, 例如搜尋結果頁之類.

4. 消費者背景 (因子分析):

分類可以對產品作切割, 消費者也可以從背景資料 (Profile) 來看你的產品是否有對到 Target Audience, 當然這部份可以用先驗的刻板印像來去執行, 也可以用因子分析來做檢驗, 當確定其目標客群後, 就可以用此 TA 來做推薦, 這算是最基本的差異化行銷, 只是這因子的切割再怎麼切也無法切到單一個人 (Individual), 所以是有局限的.

5. 關聯分析:

前四個推薦系統都是不須要做到 Data Mining 的方法, 而關聯分析可以說是第一個基礎, 從距離 (Distance) 到關聯分析 (Relation Analysis), 而在 10 年前之前, 關聯分析所須要的設備與資源是相當龐大的負荷, 但現在的今天, 已經是相當簡單就可以完成的, 所以現在已經是很多有在做電子商務的必備功能了, 這個最大的決策點只是算出 ROI, 理論上技術門檻已經不會像之前那麼高了, 只是前提還是要有開發能力的人或找到對的廠商而已.

6. 關聯系統再應用:

有了最基礎的關聯分析, 能夠發展的應用就很多元了, 關聯只是個基礎, 經過幾次關聯的疊迨與交叉比對, 能夠延伸出更多的關聯, 或者是聚焦到更精確的商品, 當有不只一個商品的記錄, 就可以算出更準的推薦, 或者是找到更多與消費者類似的消費者, 從中也可以算出最新即時的建議, 所以透過這種方式, 就可以在一定時效內找出一定數量的商品推薦, 唯一的問題是如何決定商業邏輯.

7. 語意網路:

上面這些都是不須要有太多的前置作業或外部資源與環境就能開發的系統, 但商品推薦若透過關鍵字或 Tag, 甚至透過語意網路的切割與分析, 可以把推薦的準確度再次提升, 只是這系統要先行建立語意網路, 要建立一套有意義可應用的語意網路資料庫, 往往是須要很多時間的資料累積, 以及一個系統化的流程設計, 加上語意分析, 在關聯系統沒有足夠資料前, 說不定是更準確的

8. 社群資源:

在一個好的 Big Data 設計, 不只是靠 Data Mining, 也不只是靠 Semantic Web, 有時須要的更大的資料庫, 就是更多的社群資源, 透過商品與消費者的社群資料, 往往能夠獲得比電子商務網站現有資料大上百倍萬倍的 Big Data, 若能夠把這些資源串連起來, 不只是更精確的可能性而已, 而是能夠兼具開發新客源的能力, 只是這個不只是要有能夠了解與開發這些系統的人, 更困難的是如何建立起 BI (Business Intelligence) 才是最大的挑戰.

9. 個人單品預測:

有了這些資源, 事實上要去做到單品個人的銷售機率已經不是難事了, 也就是說幫消費者提供最佳的決策參考已經不是夢了, 雖然現在已經可以實作, 甚至準確度都比前面都來得更高, 但在量與規模的資源耗用可能不合 ROI, 除非是在可預期的未來讓成本降低到一定程度, 或是產品本身的價值夠高, 才有實作的價值.

事實上這九點本身有些就是 "組合技" 或是 "基本技", 有些可以再延伸, 例如 "協同過濾與推薦", 就是種應用社群資源以及關聯分析的組合, 大部份背後的技術都並不困難, 或者是說, 做出來並不困難, 困難的是在提升準確度, 只是就實務面是每一項做出來就有 10% 的準確度, 加起來就有 90% 了, 而想靠單一系統做出這樣的準確率是很難的... (事實上不能這樣算, 只是用這樣說明好理解)

所以若是在總營業額或毛利率不高的話, 當然前幾項做出來就好, 但相對的是個很大的市場價值時, 每一項都要花多一點資源做得更好, 更準, 畢竟每一項雖然看起來很單純, 但在參數與適用範圍須要去研究與改善的點還是相當的多, 這些都是須要去開發與驗證, 但我相信投入一定有回報, 為使用者多想一點, 對商品多了解一點, 就可以設計出很好的系統.

希望這份指南對一些還沒經歷過這些事的人有幫助, 實作過的人就當參考吧.

(原標題: 商品推薦系統, 有時並不須要從 Big Data 開始) 

Post has attachment
資料革命: Big Data, Linked Data, Open Data, Data Mining 五講之一 (Data Revolution)

在這幾年, 到處都是在講 "Data/資料", 到處都看得到 Data, 其中最有名的就是 Big Data, Linked Data, Open Data 與 Data Mining, 這四個感覺起來都是獨立的議題, 但某方面都有其共通性, 而這五講要講的不是每一個單一的議題, 而是這些之間的關係, 這些不同與相同點, 以及現在與未來的可能性.

在一開始要講的是, 甚麼是 Data Revolution 資料革命, 也就是說, 資料到底過去與未來有甚麼不一樣, 這不一樣的特色在於那邊, 這邊就讓大家了解一下. 其中為甚麼我們不講 "資訊/Information" 而是講資料 (Data), 當然見人見智, 但在某方面的觀點 "資訊" 這名詞已經在社會有特化的定義了, 這樣反而會模糊真正我們面對 "資料" 的溝通與態度, 用這種最基礎的方式強掉資料的流程與邏輯是對的.

資料革命代表的是我們在革命之前與之後處理資料的差異, 這差異包含幾點:

1. 資料的透明與透通 (Data Transparency): 資料革命最大的差異就是資料不再封閉, 而是具有 Open (開放) 與透明的屬性, 這代表資料不是只有引用, 而是可以串通連結的.

2. 資料的來源, 量, 時間與效率的差異: 在 Big Data 中不只是速度, 多樣格式, 量的差異, 更重要的是在處理資料是更廣泛的, 包含透過機制 (Infrastructure) 來串接即時的資訊, 更重要的透過即時性對未來做決策輔助.

3. 擁有權與使用 (Owenership & Usage): 資料革命代表資訊擁有權不再限制為管理者或政府, 會更為開放到人民皆可使用, 且使用的範圍應該更廣, 在分享與授權的機制會更暢通.

4. 權利與隱私權 (Rights & Privacy): 資料的透明與透通本身就是種權力與隱私, 關係者可以參與跟決定應用範圍, 包含使用者各個環節的權力, 包含生產者, 收集者, 儲存者, 管理者與傳遞者.

在某方面甚至應該可以加上 Social Data Revolution, 也就是說這些資料很多是用在社會的資料, 而且在於使用情境上都會有不同的價值與應用方式, 人在這邊的資料都是息息相關的.

在國外, 早在 2011 年就提出過, 大家可以去參考 Leding Edge Forum 的 DATA rEVOLUTION, 其中下面他把資料革命前後的差別用個表呈現出來, 我覺得很值得參考, 尤於其中比較著重 Big Data 與 Data Mining 的技術, 所以我在原本的 11 點又加了 5 點上去.


1.  Data as a fact of Life vs  Data as a factor of production: 資料原本只是呈現生命與真實的表相用的, 而進成資料本質就是是產生變化的要素.

2.  Collecting vs Connecting: 資料從原本單向的搜集, 變成雙相的連結.

3. Analyzing vs Prediction: 原本資料是用來分析用, 來證明原本的觀察與假設, 但革命後可以做到預測, 甚至可以未來決策使用.

4. Information vs Insight: 資料原本只是資訊而已, 現在更能洞察出一些見識.

5. "One version of the truth" vs Multiple sources and perspectives: 從原本想要靠一個版本的真理, 演化成透過不同觀點的來源來看事情.

6. Structured vs Unstructured: 原本資料只能處理結構化的資料, 現在已經變成非結構化都能處理.

7. Relational vs Non-relational: 資料與資料庫的結構與處理方式原本都必須要有關係來拆組, 現在已經不須要或不是.

8. Centralized processing vs Distributed parallel processing: 原本是中央性的處理中心才能處理資料, 現在已經變成分散且平行的處理.

9. Terabytes vs Petabyes, exabytes, ...: 資料從 10的 12 次方 (TB, 千億位元組) 到 10 的 15 次方 (PB, 百兆位元組) 甚至更多的資料.

10. Analytics as niche vs Analytics for everyone: 從原本狹礙專業專職分析, 到現在每一個人都可以做分析.

11. Limited participation vs An era of experimentation and innovation: 最初能夠參與跟實踐的範圍是相當有限, 現在進一個實驗性與創新性的領域.

12. Closed vs Open: 之前的資料是相當封閉的, 現在則是相當開放.

13. Period of time vs All time: 原本在做分析只能做有定區間的計算, 現在則是所有的歷史資料都能派上用場.

14. Human involve vs Automation system: 之前在處理資料不少都須要經過人主觀的介入, 而現在是一個自動化的客觀系統.

15. Time gap vs Real time: 之前資料的處理是有時間差的, 現在則是即時的資料.

16. Offline or online vs Offline to online: 原本現實的線下資料與線上處理有很大的差距, 現在已經可以整合.

上面說的這 16 點, 是融合了 Big Data, Linked Data, Open Data and Data Mining 四個領域所產生的資料革命, 這些都不完全獨立而都有其關連的, 但從這邊可以大概描括出這四個 Data 觀點的關係.

我相信在網路上已經有不少這四種領域與議題的文章來介紹, 而我這邊不會再多做重覆的工作, 將會以資料革命來串起這四個之間的差異與特色, 以及目前與未來, 也包含很多人目前的盲點.

(按: 圖片取自 http://www.faforever.com/ 透過 http://www.fotor.com/ 編輯而成) 

Post has attachment
民主之推手 vs 運動之流氓

在樂生的時候, 我觀察一個有趣的現像, 就是在社群網路平台處在一個資訊流非常有趣的狀態, 尤其是在於我們對網路的想像是: "網路是自由的(至少在台灣?)", 但在許多人被樂生事件洗版(占據所有社群網路)的時候, 有些人即使是社群網路的熱衷使用者, 但還是可以完全不知道樂生所發生的事, 雖然我應該肯定能看到我這一篇文章的人應該沒有不了解樂生始末的人, 尤其這遠是在選舉前發生的事, 且當選人所說的空話(我們一定會審慎評估).

最近也有一件事悄悄的發生, 不, 在某些人眼中也是大事件, 就是郝伯村受到 "某某團體" 的邀請, 以民主制度的守護者來暢談民主的過程, 當然這在很多年輕人眼中是件非常荒謬的事, 自然就會有不少年輕人到場抗議, 無論是否是有舉大字報或布條的, 或是直接高聲抗議的, 當然這些還是獲得下面的回應:


「下次我們會考慮加入提問時間」

「我知道學生有立場」

「今天場地要關了,我們也還有下個行程,必須要離開。」

這大概是那天最好的註解吧, 無論這個是否跟民主是否有關係, 是否郝伯村到底是否是民主制度的守護者沒有關係, 雖然在我眼中, 郝先生想要透過這樣在台灣民主進程漂白是件一群擁有資源者想要運作的事, 因為身為一個軍人, 他應該洛守的立場本來就是 "守護者", 所以在我眼中, 他已經好不容易擠出這句 "民主制度的守護者", 代表已經是經過沙盤推演且可以自圓其說的台詞了, 因為前面民主這兩個字, 是完全可以亂入(自我宣稱)的, 例如:

威權體制的守護者: 身為蔣氏的軍人, 自然是他們的守護者

戒嚴的守護者: 若沒有軍人, 我相信台灣的戒嚴會更早結束

民主制度的守護者: 沒有他們在守護台灣, 台灣那有現在的成果

台灣獨立的守護者: 說不定過幾年他會宣稱說沒有他們, 台灣早就被共產黨統治了

世界和平的守護者: 至少在他當政的時候, 海峽兩岸沒有發生戰爭, 這功勞也不會說不過去

所以郝先生要被稱為 "民主制度的守護者", 就 "閱讀空氣" 的定義是: "恰到好處", 當然這邊的自稱或宣稱是怎樣, 本來就可以認同, 也可以反對, 雖然真正的問題不是在於是怎去說, 而是怎麼說, 也就是應用甚麼資源的方式去說, 若郝先生他最後跑馬燈時認定自己是如此的偉人, 你也不可能說: "不, 你是惡魔, 該下十八層地獄", 除非你想化身死神之類, 但若有 "某某組織" 想要透過活動與演講, 來去做漂白, 你想站出來說話, 這對不對呢? 事實上也是我想寫的.

因為至少在我眼中, 郝先生真的可以說得過去他是 "民主之推手":
事實上郝先生當然可以談民主, 我們經過職場都知道, 很多事情的功勞都在最後一個有決策權的反對者最後放棄, 他變成 "讓這件事得已進行" 的功勞者... 他在台灣民主過程身為最後一個反對者也是很接近答案阿....
上面這句話是我一看到這活動時的第一想法, 因為在職場久了, 很多光怪陸離的事也都看過, 尤其是有些人已經完全無法生產了 (自我產生價值) , 此時他就要想辦法自己的價值時, 就是成為別人生產的獲利者, 而如何獲利呢? 比較好的方式是幫助有能力的人, 最後做出來再分一杯羹, 但對於那些沒有能力的人, 連幫助的能力也沒有的時候, 最簡單的方式就是 "阻止有能力的 人", 畢竟做這樣有好處, 除了讓對方無法出頭去威脅自己外, 最重要的是當你有這掌握關卡的能力的時候, 別人想做事也不得不跟你稱臣, 最後可以用這樣的權力獲得利益, 即使對方成功了, 你還可以成為 "xxxx的守護者/推手" 也不為過說.

雖然我們不少人都知道這件事, 這也是一直存在的, 但我們即使已經接受, 不代表我們有權力去要求剛出社會的人接受, 畢竟這不是件好事, 因此我是接受學生在這樣的場合做一些事, 但這邊就衍生出一件我為甚麼要寫這篇文章的事, 因為這件事在我眼中早就是這樣的定案了, 沒必要太多置喙, 但當我看到 Peter Hsiao 回 老貓 的一串文章時, 我原本是的確認同這是老貓說的矛盾, 但後來想想不是那麼一回事.

我們來假設兩個場景好了:

A. 當某高中校長在做全校廣播, 希望學生要好好唸書, 聽長輩的話, 成為堂堂正正的中國人, 但有一群學生聽了之後鼓噪, 此時老師叫大家安靜, 說我們要尊重校長發言的權利.

B. 某間大學有個海報牆是很多人經過, 有人張貼了一張大字報, 說現在教官還是留在學校是不妥的事, 後來教官跑來說, 因為他這張大字報沒有經過審核, 為了要尊重其他人發言的權利, 就把他撕下來了.

C. 這場景應該在台灣不會出現, 在某個公園, 有兩個人拿著肥皂箱在講兩個爭峰相對的事, 某一個人相當生氣就叫支持者去把另一個人趕走, 而另一群支持者就說: "我們要悍衛發言的自由".

這三個場景最大的差異是甚麼呢(不小心多出一個)? 這三個場景你會支持誰的說法呢? 這的確看起來都是相當合理的, 因為理論上真正的言論自由是在:

1. 若這是大眾的事, 不應該責難任何一個提出此眾多人想法的單獨個體
2. 不應該因為那個人的身份地位去提高或降低態度, 而必須公平的對話
3. 不應該用言論去區分人既定身份與自身的事, 或去保持不既定的區分
4. 言論自由不包括不存在之事實, 會危害生命與生存的事.

第一件事當然是最單純的文字獄與言論自由要保護的, 第二件事是我們要保持該有的對話態度, 第三件事情是指我們不能用言論去迫害不平等, 而前面三個場景, 是否都符合這三個理論呢?

嗯, 我們不用想太多, 我們直接拉回來 "郝先生" 的演講好了, 我們或許先不管第四點, 前三點是否是在上面適用呢? 應該明眼的人就看得出來, 問題是在第二點, 因為言論自由是保障公平與平等的對話, 而不是保障在 "訓話(洗腦)", 或是任何單方面的宣傳, 而那個場合的問題不在郝先生, 也不在郝先生的言論, 或是任何單方面的宣傳或洗腦, 而是在那種場合到底適不適用 "言論自由".

事實上, 很多事情都是有其意義的, 就像是政令宣導, 就像是商業廣告, 但這個是否是該用言論自由去保障呢? 答案應該很單純, 一個單方面有資本與權力的宣傳, 而另一方面是受眾的弱勢, 並不存在單方面的言論自由, 真正的言論自由很單純的就是 "雙方溝通與討論", 當主辦單位認為: "我們不須要發問與討論, 更不須要考慮受眾的立場", 我不認為主辦單位是認為這是個雙方面的對談, 說穿了就是 "洗腦", 用這種演講來做宣傳, 並去建立自己不存在的形象廣告, 甚至動用不該用的權利去在校園資源, 說要用 "言論自由" 去保障單方面的言論誠實說真的很怪.

相較的, 想要提問的發言, 希望對等對話的學生, 或許才應該是受到言論自由的保障, 但我相信主辦單位可能是這樣想的: "你們這群學運流氓, 跟我這樣的民主守護者跟本是不同階級, 只有我有言論自由, 你們是不配擁有的".

+Peter Hsiao +octw chen 
Editor: +Gene Hong 

Post has attachment
在 SEO 圈的人, 看到我前一篇 "從連結的生與死來談網站連結準則" 知道是為了要回應嚴先生對於之前的連結做探討, 而前幾天有人說他也寫了 "從 Nofollow 看 SEO 的未來" 這篇來做回應, 我當下跟朋友說: "他寫的很好阿", 等等的話, 覺得這篇文章有其論點與方向, 甚至我回頭想一下我寫的那一篇的標題, 還有不少地方沒寫到.

的確, 我會把 "黑帽 SEO" 定義為:

1. 創作沒有人會去看的內容, 沒有意義的內容
2. 建立不受歡迎的連結, 建立不會有人點的連結

這些歸納起來, 就是 Spammer 的問題, 記得我在 "如何用網頁到網頁的延伸閱讀, 取代網站的交互連結" 提到這些 Spammers 讓 Blog 部落格的 "Ping" 從立意良善到沒有人在用了, 也就是說 Jesse 在那篇文章所寫的兩大重點之一:

1. Anti-Spam
2. 自清

Anti-Spam 這件事我已經不太想說了, 因為我早就在那些人眼中是大壞人了, 也因此我也從來不做 SEO 的任何專案, 只有在幫做顧問的公司協助 SEO 以及在 SEO 公司當顧問的主要原因, 因為去跟一般沒概念的公司爭辨甚麼是白帽與黑帽, 不是我能力所及的.

但其中最有趣的 "自清" 這一點, 我看了之後真的讓我覺得自形慚愧阿, 相較作者而言, 我只是一個喜歡從資訊理論與圖書館學去看 SEO 的人, 雖然唸過幾十本 SEO 的書, 也做過十幾個 SEO 系統, 但說實在的, 我自己卻完全不去做 SEO.

當有人問我甚麼是 SEO, 我都會說, "不好意思, 我不是能夠深入淺出的人", 所以都會叫他去唸個至少一兩本有關 SEO 的書, 但我都會說: "書上面所說的方法, 無論是黑的或是白的, 我都不會去做", 也就是說, 我從來不會在我製作的網站去加甚麼 meta-data, 也不會去加 description, 所以, 我真的不是好的 SEOer 阿.

因為我一直相信, "只要做出好的內容對大家有幫助, 且做出好的系統更好去便利使用", 以這樣的觀點去開發, 這是比任何 SEO tricks 更好的 trick, 而這也是我個人最大的實作方式, 這也是我唯一個人在使用的 SEO 技巧, 利用 "Semantic Web/語意網路", 透過 "UX/UI 的改善", 建立 "不同觀點的 View", 實作好的 "技術行銷", 因此大部份 SEO 書上面所說的東西, 我都不會去使用.

因此當 Google 在說 "No-Follow" 的這件事, 我在想說, 我做的系統中, 有那些連結是 "只提及而不背書", 我還在想這到底是在對使用者 "宣示" 還是對 Google "效忠"? 而事實上使用者在看這些文章與內容, 在應用這系統, 早就知道這連結的意義與價值, 何來的 "自清" 阿?

但我也知道不可能要求大家去唸所謂 "幾本 SEO" 的書, 然後消化與實作, 我會花時間在上面, 純脆是我對搜尋引擎的興趣以及對使用者資訊行為有興趣, 而想要透過這種系統實作出對大家有幫助的使用者行為決策資源系統, 跟本跟做 SEO 沒甚麼關係, 我會覺得 SEO 有趣, 是因為 SEO 是種 "內容" 與 "行為" 的一種中介, 這也是我想研究與實作, 因此才會有 "網點", "網智", 等等的系統阿.

也就是說, 我更希望大家在做 SEO 時, 一定要從 "讀者/使用者" 角度出發, 而不是以 "搜尋引擎" 的觀點來切入, 但這個若是做得到, 比任何 SEO 還要困難, 因此就像是在 "台灣搜尋引擎優化與行銷研究院" 所說的, 透過 Nofollow 要來做自清, 尤其是你目前還是照著 SEO 的書來實作, 或者是聽從 SEO 公司的意見, 原作者的文章還是很有價值的.

所以, 說起來, 我的確不是 SEOer 阿....

Editor: +Gene Hong 

Post has attachment
 從連結的生與死來談網站連結準則

曾幾何時, 連結是種尊重與尊敬, 甚至是種榮耀, 但現在, 連結已經在買與賣失去意義了嗎?

基本上在論文的寫作中, 很多人知道教授最喜歡去挑 "參考文獻 (Reference)" 的問題, 因為這樣的宣示往往代表那些是你論文的原創, 那些不是, 但我們也都知道, 絕大部份的碩士論文, 那有甚麼 "原創" 的可能, 而標註參考文獻最大的價值, 是因為你曾做過這樣的努力, 透過這樣的 "連結" 來幫助你看這篇的人, 找到更多的資訊.

因為資訊要成為智慧, 是須要一些過程的, 甚至單一的資訊不太能夠創造智慧, 而是要很多很多的資訊才有智慧的可能, 就像是 "維基", 就像是 "懶人包", 都是種資訊的匯集與發散, 讓資訊成為了解事實的方法, 當了解事實之後, 才能夠進一步的產生價值判斷與行為.

也就是說, 連結代表的是種資訊的傳承與傳遞, 甚至有人說, 文明不是在於人類所產生的智慧, 而是在於傳承, 沒有傳承的知識會隨風飄逝, 即使再偉大也不會被人提及, ....

但把連結說成這麼偉大, 又過於誇張了, 但也曾經有一家公司, 去發現與強調連結的價值, 將之實證與實作, 成為現在大家耳熟能詳的 G 社, 而現在這家公司, 提出 "有人操弄連結的價值", 而去叫大家在使用連結時, 加註 "這不是連結", 來去區分廣告與連結, 我一直在思索這樣是對的方式嗎?

只是與其說這家目前的確是很偉大的公司, 會不會因為做了這樣的事讓原本質疑過他的人更認定 "Do No Evil" 只是個晃子, 但我更相信的有太多人是在做事時, 心中是不存在 "Do No Evil" 的思考, 而以更大的 "正義", "利益" 的招牌做他自己認為可以做的事, 尤其是那些真的讓 "連結" 失去意義的人.

但這意義說起來也沒那麼偉大, 就是這樣的連結與其內容會有沒有人去看, 去使用, 這價值不在於你是不是在連結中註記 "不要連(追蹤)", 而是在於是否以讀者的心態與使用方式去創造與使用連結與產生內容, 也就是在建立這連結時, 你的用心與心態為何?

可是 "心態" 與 "用心" 是最不能衡量的, 就像是想要輕易證明靈魂一樣, 畢竟很多事情雖然本質是最重要的, 但當論及方法論時就不見得實用了, 必須要轉化成準則來實作才是最好的方法, 只是我們必須知道, 任何行為有時看起來一樣, 有時看起來是完全相反, 但其隱藏的心是不能絕對類比的.

我們在做網站連結時那些是對的呢?

1. 連結是內容相關的: 連結在於種將兩件事物做聯繫, 這聯繫的價值在於 "距離", 也就是相關性, 大多是透過關鍵字與語意網路將之串連, 讓原本不在相同空間的資訊透過這樣的連結做延伸, 讓我們可以有更廣的視野.
 
2. 連結是種宣告: 連結在於種所有權的宣告, 包含在製作的目的與精神, 所從屬的組織, 製作的方法與架構等等, 透過這樣的宣告連結, 讓讀者更了解這內容所在的價值與空間角色, 雖然這種連結有時是使用者最少點的, 但也是不可或缺的.
 
3. 連結是針對性的導引: 連結有時候只是種純導引, 可能是購物網站的運費計算方式, 也有可能是種延伸消費與討論, 若能產生意義而導引使用者去看不同的資訊, 這連結就是有價值的.
 
0. 連結是使用者會點的: 無論是前三點說得再冠冕堂皇, 最重要的一個判斷是這個連結是否使用者會去點擊, 若是使用者會點擊, 這連結就有價值, 若是沒有人會去點擊, 則是代表這資訊是沒有連結的價值, 反之一個網站一直有一堆這樣的連結, 就代表不是製作者不用心, 不然就是別有用心.

當然大家會問一個最大的問題, 連結最常會是種有金錢交易的不是 SEO 的連結, 而是 "廣告" 等軟連結 (Soft Link), 這是相當有趣的問題, 但我們知道, 廣告的連結是種具有導引性且使用者會點的連結, 本身並不會有太多的抵觸.

基本上 Google 原本是宣示 "想企圖去操弄連結" 的事, 但最近產生對 SEO 界很大的風暴, 其中甚至延伸成 "廣告是不對的", "付費連結都是黑的", 等等的討論, 而許多人在製作 SEO "一眛" 的去 "假借" G 設的 SEO Guideline, 雖然這指導手冊在我眼中是有問題的, 但理論上已經是可以打擊 80% 以上做黑的人.

但不代表做白的是沒有問題, 畢竟這世界沒有 "非黑即白", 很多事情若是有絕對的 "正義" 那就失去我們生為人的價值, 尤其以前被稱為黑帽 SEO 的是指 Spammer, 也就是用不被歡迎的連結去盜用別人網站的價值, 產生許多沒有意義的內容, 複製重覆的資訊等等的事是被稱為黑帽, 而現在 Google 更直接稱 "買賣連結" 的為 "企圖影響計算" 的黑帽, 甚至是 "交換連結" 的人也算是.

這樣說起來, 可能全世界有 99.99% 的網站都是黑帽了, 尤其是像教育部, 國家機構等最會以 "資訊串連" 去交換連結, 而非 "連結買賣", 而現在透過 G 社的 Guide Line 要他們加上 "nofollow", 在我眼中是本末倒置, 更讓連結的價值加速死亡.

會寫這篇並不是要去對 G 社抗議, 因為他已經大到很難抗衡了, 這篇文章對他們而言只是種 "呢喃", 而是希望透過這篇文章讓大家更正視連結的價值, 包含 "連結買賣", 就像是有人已經說, 不再做連結買賣, 而是把有用的資訊去串連的 "媒合", 而這件事若能做好, 對讀者才最好的.

而我們是否也能夠過這樣的反省, 讓網站製作除了內容外, 透過連結與 UI 來去創作對讀者有更好的閱讀空間? 

+Gene Hong 
Wait while more posts are being loaded