2015年2月11日 星期三

facebook, FaceBook, FACEBOOK!!! 很令人玩味的幾幅畫, 你喜歡那幅? by Pawel Kuczynski

這篇不是內容農場, 但也是我難得非原創的作品, 雖然這個部落格原本只是定義為: "不想重覆講相同的話就寫篇文章", 只是現在好像越來越重了.... 這篇稍微輕一點吧...

前幾天看到有內容農場 (?) 講到這位 Pawel Kuczynski 的畫作, 想到之前也看過他幾幅對臉書的描述相當有趣, 所以我在這邊舉出來給大家一起看....


PawelKuczynski58 , Pawel Kuczynski ,
Diving in Social (原作無題)
Facebook check , Pawel Kuczynski ,
Facebook Check

Ark for the singles , Pawel Kuczynski ,
Ask for the Singles

Love , Pawel Kuczynski ,
Love
Modern Hunter , Pawel Kuczynski , facebook, cat, hunter
Modern Hunter
Confessional , Pawel Kuczynski , facebook
Confessional
Something in your eye , Pawel Kuczynski ,
Something in your eye
PawelKuczynski54 , Pawel Kuczynski ,
Facebook Smell (原作無題)
PawelKuczynski52 , Pawel Kuczynski ,
Weapon (原作無題)




Facebook , Pawel Kuczynski ,
Facebook
Watcher , Pawel Kuczynski ,
Watcher


原作可以在 Pictorem 買畫, 很可惜的只能在美國及加拿大才能送貨, 但有幾幅畫真的很合適放大成畫作擺在相關公司的走廊, 會相當有趣....

而我是喜歡最後三幅畫, 你呢?

2015年2月9日 星期一

如何優化網址 (ver 3.0) , Basics of SEO friendly URL (ver 3.0)

前幾天看到有人分享一篇文章, 講到有關網址 URL 的一些觀點, 只是這篇文章的範例是取自於 2009 年前 MOZ 的資料, 以現在的角度多少有點不一樣了, 所以就當作是回應給朋友參與討論.

這五年來說起來變化也是挺多的, 其中包含幾個因素:

1. Canonical URL: 典範網址的始用, 由於社群分享, 追蹤碼到處林立, 一個相同的網址被夾雜很多參數是必然的, 雖然透過 Webmaster Tools 可以經過設定讓 Search Engine 知道, 還不如直接把每一個獨特內容提供一個 "典範網址", 這樣大家都不會認錯.

2. 網址的 Ranking Factor: 在之前網址是一個很重要的 SEO 排名因素, 而現在已經被調得越來越低了, 當然是因為有些角度這樣對使用者是有利有弊, 有時是很好辨識的方法, 有時又是很煩人 (Annoying), 最後也是因為被某些過於黑帽的 SEOer 過份的操弄, 最後 Google 降低其重要性.

3. RWD (Responsive Web Design): 現在很多網址都也因為使用者的 Browser (Agent) 來調整角度, 甚至有些瀏灠器是不合適使用 URL 來傳遞輸入與分別, 所以 URL 的價值也跟以前的角度變得不一樣.

4. Bing 的興起: 因為 MicroSoft 觀點儲存網站, 會把 URL 的路徑真的當成 Folder, 以此 Folder 來做管理, 處理與聚合, 在大部份時候, Folder 類似的路徑的確是可以對應到真實的檔案與路徑, 以這觀點來看是相當合理.

但當然網址是最重要的 SEO Ranking Factor, 尤其是網域, 但這網域這因子是最難去改變的, 所以在操作上實務並不高, 倒是次網域之後倒是可以去 "操作" 的, 在這邊來看網址與最新 SEO 的角度思維為何?

1. 子網域: 以現在 RWD 的角度, 已經不建議使用 mobile, m 等等用次/子網域來做為 View (視角) 的切換, 子網域要考慮的還是系統面, 尤其是在網站架構的完整性, 也就是說一個具有 "高內聚性", "獨立性/低藕合性" 的內容與功能, 再來切割子網域, 也就是切出子網域會造成內容重覆是盡量避免. 除外還是要保持一個網域有一定足夠的內容, 這數字大概 300~3000 頁, 或 1/10 到 1/3 之間.

2. 頻道 (分類): 在網域之後的網址第一個 "/" 的 "Folder (檔案夾)" 是最重要的, 通常是指這網站的 "頻道", "分類", 而這個算是大分類的頻道, 因此一定是最高層的分類, 事實上網址的概念都是以這樣去做切割, 通常建議是頻道數不要超過 10 個, 而通常建議這個 Folder 最好是有字意的, 也就是不是用代碼或數字來做切割.

3. 功能/程式: 第二個 Folder 通常是種 "條件" 與 "指向", 通常很多人習慣把這個放在第一個 Folder (目錄), 但通常最好第一個目錄放更上層, 更有意義的頻道與分類來使用, 而功能與程式最好放在第二層, 通常透過 Pattern Match (樣式對應) 的 Rewrite (改寫) 這樣就很夠, 不見得要放在最前面, 雖然是稍微複雜一點.

4. 概念 (關鍵字, 標籤): 第三層的 Folder 是以概念做聚焦, 通常是關鍵字, 標籤, 分類或次分類, 若是以 SEO 的觀念來看, 就是使用者會搜尋用的關鍵字的聚合, 只是通常不須要一定是此關鍵字 (Keywords), 以現在來看, 只要有用相同概念的, 放在同一個目錄下是很有聚焦的想法.

5. 其他參數: 到這邊就已經有三層目錄了, 基本上應該就很夠了, 其他的參數就當作一般的 GET Parameter 來作傳遞沒甚麼不對, 只是可以在問號 (?), And (&) 等符號做些修飾就更好了, 甚至在某方面這參數也當作是程式的另一層導引也不是不可以.

6. 頁數等 Scope/View (日期, 排序, 條件過濾): 理論上上面五項就可以組出一個完整的網頁, 但往往這樣的條件會有很多頁, 所以有時會須要作日期, 頁數, 排序, 條件等等建立不同觀點的網頁, 因此此時還須要以這觀點做再一層的聚合是對網站結構是相當好的.

從上面這幾項, 該如何實作出該有的網址呢? 這邊以 "新文易數" 來做範例:
http://tag.analysis.tw/news/tag/柯文哲/all/20150101/view=1
Analysis.tw 有很多個網站, tag 是專門分析標籤的系統, 而 news 是指在新聞類這個頻道 (Channel) 下來看, tag 指的是標籤的觀點, 聚焦在後面的柯文哲這個 Folder, 而此 tag 標籤下的都是在這之後做使用, 像 all 指的是全部的新聞, 事實上是會跳到 tag_all.php 這隻程式, 所以程式事實上會呼叫的是:
http://tag.analysis.tw/tag_all.php?type=news&tag=柯文哲&date=20150101&view=1
若是以下面的網址來看, 大部份的使用者是無法知道他在看甚麼, 但上面的網址就很好解讀, 甚至給搜尋引擎來看也是相當合理且有聚焦的, 而從 "/tag/柯文哲/" 這 Folder 目錄為一個聚合點, 這個就是只靠 "參數" 做不到的, 而在 Rewrite Rule 的寫法是:

         ^/(.*)/tag/(.*)/(.*)/(.*)/(.*)   =>    /tag_$3.php?type=$1&tag=$2&$4&$5

而這邊只是做個範例, 事實上實作上還是有些許差異....

會這樣做, 不只只是為了 SEO (搜尋引擎優化), 而也包含對使用者, 對社群等等做出一個 "友善/Friendly" 的網址, 而人習慣是由大範圍而慢慢縮小的觀點來看是較為合理的, 因此網址若是這樣做, 就都很直覺, 最後這樣重組網址的思維, 會對於你對網站經營有更完善的思維, 而所謂的 SEO 就只是順便做好而已.

2015年1月26日 星期一

從 Big Data 來解盤六都市長的未來與困境....

有了 Tag (標籤), 此時我們就可以進一步的去 "求籤卜易", 尤其是看標籤的延伸, 此時就要 "祭出" 最常用的 Data Mining 方法之一 -- Relation Analysis 關聯分析, 來看這個標籤是與那些標籤 (關鍵字) 去做組合.

事實上在一開始寫的時候, "ACATTAG" (現在叫 "新文易數") 就已經有 "主要標籤" 與 "新近標籤" 的計算結果了, 但這個是很粗糙的, 因為在某方面是完全沒有 "Normalization" (正規化), 畢竟這是一個很吃資源的計算.

若沒有做正規化的話, 說實在也不會怎樣, 只是會讓 "大者恆大", 也就是越熱門的關鍵字越容易出現在前面, 雖然這在某方面觀點也不算是種錯誤, 畢竟在最近幾次的經驗, 這種大數字 (Big Data) 中, 有發生 "關係" (Relation) 是相當不容易了, 這在某種角度也是種在做 "自行正規化" 的一種動作.

這種正規化的 "動作" 在這種 Big Data 代表的是種 "集體意念" 的行為, 而在這個系統代表的是 "記者" 或 "編輯" 的角度, 而透過這樣的關聯分析算出跟這標籤的距離, 會看到很有趣的現像, 而在做出來時, 隨手看看目前六都市長目前面臨的難題是甚麼:

1. 柯文哲: 現在就是坐好台北市長這位子, 說不定在所謂的 "政治" 成熟度要更高一點, 而大巨蛋背後的議題是最麻煩的事, 相較三創就真的是 "尛" 事了....

2. 朱立倫: 沒有人管他是不是新北市長, 國民黨黨主席要接受的挑戰更多一些, 尤其是跟王金平與馬英久的關係, 只是除外一直被拿來跟柯文哲比較也是該注意的事.

3. 鄭文燦: 一開始雖然最大的問題是航空城的問題, 但當新屋保齡球館火警後, 這很明顯是個指標性事件.

4. 林佳龍: 台中市的問題從來沒少過, 從 BRT 到台灣塔, 這些都是胡志強弄出來的麻煩事, 但在某種概念的觀點他總是其他市長的附屬品, 很少人會單獨提到他.

5. 賴清德: 賴神似乎問題是最小的, 但也是最大的, 尤其是面對李全教的議會關係, 若沒搞好說不定會大崩盤.

6. 陳菊: 或許也是媒體的北大南小, 陳菊若沒好好跟中央有關係, 大概也不會有甚麼大作為, 現在唯一要處理的還是石化管線吧..

大家可以從名字點進去看, 其中可以到幾個數字, 一個是他與這標籤的數量與距離, 數量越大不代表距離越近, 因為也有可能是另一個標籤本身的 "基數" 是很大, 所以還是要經過某種程度的正規化, 如此一來就很好可以解讀了.








在這邊不只大家可以在 Tag 標籤頁點 "標籤距離" 可以看到, 更開放 API 讓大家來抓, 而且現在不須要 Authentication (因為還沒寫好),  目前是用 HTTP Get 透過 tag 參數來抓, 輸出是 json, 其中 Distance 就是距離, have fun~~~

API 範例: http://tag.analysis.tw/api/distance.php?tag=柯文哲

2015年1月12日 星期一

風傳媒是新聞媒體中下標籤最高明的嗎? 從標籤來媒體大解析....

[Quote] 標籤在媒體中的使用可以看到其議題的方向與設定, 所以一個媒體的屬性或標籤下得好不好, 都可以定義一些指數來去做分析與觀察, 這又是可以算是大數據的粹取方法之一.

[網址] http://tag.analysis.tw/media.php

在這邊已經不須要太去強調標籤 "Tag" 的重要性, 雖然現在還是不少媒體不了解標籤的價值, 甚至把標籤當作是 "分類" 來看, 雖然這個也不須要在這邊講, 但說要去判別那個媒體的標籤下得好沒那麼簡單, 甚至我們應該很確定的是要依媒體的屬性來去區分才能比較, 但每一個媒體都有自己的特色, 真的要集合在一起比較是沒那麼容易.

但嘗試著以新聞媒體網站來做分析, 或許是比較容易一些, 但到現在, 蘋果日報, 自由時報與聯合新聞網還是沒有 Tag 標籤系統來看, 這樣的比較多少有點缺撼, 只是這也是不得已的.

而要如何定義好不好, 本來就是見人見智, 而這邊嘗試著用三種操作型定義來看標籤的使用:
1. 重合度: 這媒體所使用的標籤的重要度 (數目次序) 是否跟人一樣?
2. 導引潮流度: 若這標籤已經被大家認定是有價值, 那第一個使用的人是那個媒體?
3. 跟上潮流度: 這媒體用的標籤是不是大家都在用, 還是只有一兩個媒體有在用的?
因此嘗試著用這三個角度來看媒體在標籤的使用狀況, 當然這邊有嘗試著做操作型定義, 並嘗試指數化或正規化, 下面就是這三個量度的演算法, 若沒興趣可以跳過.

1. 重合度: 將此類媒體的標籤總合排序, 然後跟單一媒體標籤排序作比較, 算出單一標籤在這兩個排序的比例差距, 然後乘上這標籤是排序超過多少百分比 (越前面的越重要), 然後加總後除以標籤總數的正規化因子 (目前是除於總數與總數的對數).

2. 導風率 (導引潮流度) : 當這標籤已經超過一定的重要度 (有三個媒體使用, 且兩個媒體用超過兩次, 及一個媒體用超過三次), 算出此標籤是誰開始使用 (最近一次的一個媒體使用後, 在後 12 小時內有人接續使用, 且前 24 小時內沒有媒體使用), 將此次數加總後除標籤數.

3. 跟風率 (跟上潮流度) : 這個媒體所使用的標籤是否是至少有三個媒體都有在使用的比率.

這三個數字當然以合理的觀點當然是越高越好, 在這邊嘗試著算出來做成下表:

 (此表格的特殊標籤指的是這媒體常用但別人少用的標籤)

 在這邊我們可以看到, 若是以重合度的角度來看, 表現最突出的是風傳媒, 而一直排名在前幾名的有三立, 關鍵評論, 中央社與工商時報, 表現較差的是華時, NowNews, 新頭殼, 台視與 TVBS, 而東森新聞雲一直有自己的風格.

在導風率而言, 表現最好還是風傳媒, 但跟中時, 工商時報與中央社並沒有很大差距, 而其中相反的是關鍵評論網幾乎是沒有創造話題的能力, 但這也是跟其記者數最少有關吧, 除外表現較差的是東森新聞雲, 三立與 Nowews.

從跟風率來看, 中央社, 新頭殼是在前面, 風傳媒與旺報次之, 表現較差的是關鍵評論, 東森新聞雲, Nownews 與華視.

從這邊甚至可以分析每個媒體的屬性:

1. 風傳媒: 文章與標籤都很少, 但跟整體時事很重合, 無論是導引潮流或跟上潮流都是沒問題.

2. 三立: 雖然說相當跟得上潮流與時事, 但相對的導引風向的力量相當弱.

3. 中時: 重合度與跟風率幾乎可以說是表現平平的媒體, 但很明顯的有帶動潮流的能力.

4. 東森新聞雲: 重合度平平, 但跟風率與導風率表現算較差的, 簡而言之是雖然跟上潮流, 但有自己風
格, 只是也沒甚麼其他媒體想跟上.

5. 關鍵評論: 重合度分數算是相當好的媒體, 但能夠引導其他媒體跟上的獨家的能力幾乎是沒有, 只是也常有自己不一樣的方向.

6. 中央社: 跟大家想的一模一樣, 相當中規中矩的媒體, 但有能力呼風喚雨.

這邊就分析上面六個媒體, 主要是我鄉愿的個性只習慣說人好話, 壞話就不公開說了, 我不會講得高興, 當事者 (媒體) 也不會覺得中聽, 若是你是有能力改善或真的想聽, 再來說也不遲, 不然就只是純放砲而已.

雖然標題說風傳媒應該是下得最好的媒體, 但事實上每一個媒體都有自己的特色與方向, 這也是必然的, 因為每一個媒體都有自己的風格與立場, 想要靠單一媒體追求公正客觀, 就跟緣木求魚沒甚麼兩樣 (彈塗魚例外), 但從系統的建立, 導引, 指標與分析, 能否幫助大家在了解議題, 深入議題更多, 無論是對編輯或是讀者而言都有意義, 這才是這系統的目的.

2015年1月2日 星期五

不知如何找議題與下標籤才是對的嗎? 來試試看即時標籤系統

[原標題] 標籤建議系統的雛型, 即時熱門標籤的價值與實作

[網址] http://tag.analysis.tw/diff.php

事實上標籤不是個很新的東西, 無論就圖書館學, 或地質學, 都有用類似的技術來做資訊的搜尋與分類, 雖然在約 10 年前 Web 2.0 爆發時代, 就已經很強調 Tag (標籤) 的重要性多於分類, 但那只是在類似 UGC (User Generated Content) 使用者產生的內容比較常用, 主流媒體真的跟上 Tag 的腳步還是沒那麼快, 即使到現在, 還是有很多新聞網站或內容網站不習慣使用 Tag, 包括台灣很主流的蘋果日報, 自由時報與聯合報.

但不代表已經開始使用標籤的媒體是跟得上的時代, 還是有很多媒體的記者或編輯, 在下標籤 Tag 的時候, 還是以 "分類" 的管理角度來下標籤, 雖然這並不是不對, 因為現在而言, 分類與標籤的界線已經越來越模糊, 甚至有很多網站已經放棄分類的概念, 慢慢的轉向標籤的使用, 至少在較為 "先進" 的分類標籤已經沒有階層的上下架構, 開始以網路狀關係去連結 "分類", 此時分類的觀念就已經不一樣了.

只是在下標籤 Tag 還是有些訣竅的, 雖然圖書館學已經有很多分類的技巧, 但真的要應用到去下標籤還是要做一些轉化才行, 很可惜大部份的人還是在摸索階段, 甚至不少還沒了解標籤的真正價值.

身為一個唸過圖書館的網路工作者, 身為一個 SEO 的玩家, 身為一個喜歡數字的二流數學家, 身為一個會自己做系統來了解事物的工程師, 身為一個大量資料的愛好者, 一直說要開發一個系統能夠幫助編輯, 或是部落客來去協助建立作者與讀者的連結, 之前透過關鍵字的延伸已經做過很多工具, 只是以現在的角度是相當不夠的, 主要因為:

1. 這些關鍵字必須是使用者進來才會知道.
2. 經營搜尋引擎知道關鍵字的比例已經越來越低了.
3. 你只能知道自己的角度, 沒辦法透過別人的角度來看標籤.
4. 這社會的脈動有時是很難抓到的.

因此這想法與須求已經想很久了, 且慢慢的構思與想出較為可行性的方法, 然後拖了一年多後, 終於開始動工與做出雛型, 果然對我而言就又是 "想了三年, 構思兩年, 拖了一年, 花了三天" 的作品之一.

要做出這系統的步驟與架構是:

1. 要能夠知道新聞與內容網站的新文章列表, 有時靠 RSS 就可以做到.
2. 有些文章是有設 Tag 與標籤的, 將之確認.
3. 判斷與建立每個時間點與歷史的標籤資料庫.
4. 以現在或一個時間點去做比對. 

如此一來, 就可以去產生一個正在成長的標籤列表, 這代表的是說這概念的新聞與文章越來越多到一定的數量, 就很合適做為新聞網站或內容網站的參考, 來了解自己文章下的標籤是否有價值, 或是做為下標籤與尋找內容創作的參考.

這三天已經寫完超過 20 個網站, 可以把最新文章的 Tag 標籤自動匯入到資料庫, 目前因為顧問與興趣, 這些網站主要分成三類, 新聞, 科技與3C, 女性網站, 如此就可以做為網站的編輯經營者很好用的 "標籤" 參考系統.

只是這系統從做出來到大家看到, 又是經過 N 次演算法的調整, 前前後後嘗試了幾十種算法來做微調, 在一開始我在臉書是這樣發言的:
看排行榜最無趣的是若是每天看一次, 可以知道不少新的資訊, 但對於從業人員是每小時都要跟上最新的時事, 因此不可能只看排行榜..

所以這次是以正在上升發酵的新關鍵字, 也就是在一定時間t1內出現在一定的次數與媒體cond, 且這關鍵字在一定時間t2內是沒出現過, ...

上面的 t1, t2, cond (條件) 目前還在調整, 且資料不夠完整須要更多的累積, 我想過不久應該會更有意義, 但現在已經可以在一定時間內跟上時事了....
目前的 t1 是 24 小時, t2 是 48小時, 而 cond 條件有兩種, 一種較為寬鬆的是至少要有兩個媒體有出現此標籤兩次以上, 而較為嚴儘的是要有一個媒體有三次以上, 兩個媒體有兩次以上, 三個媒體有一次以上, 且比較的方式有時間與非時間, 因此大家可以看到這標籤會有兩個屬性:

跳升 (紅色) : 指的是上一個時間即使是寬鬆的條件也沒有出現.
新 (New): 在目前的系統還沒有此關鍵字.

也就是說雖然 "跳升" 是不須要時間累積的, 但 "新標籤" 須要時間去累積的, 就經驗往往須要三個星期到三個月才能收斂到一定實用的結果, 但在目前做為參考用已經不是太大問題了.

當然這系統理論上要能夠真的實用, 還是要跟網站既有的編輯系統做整合, 也就是說要做出一個合用的 API 來串接, 這樣才能夠開始創造出這系統真的價值, 只是最後還是要人去解讀去 "創作", 這就是不是這篇文章講的, 請等下一篇吧.

2014年12月30日 星期二

從大眾媒體與社群媒體熱度比較來看後面那隻手?

有人知道我算是野百合學運的那一代, 在那場洗禮, 讓我深刻感受到三件事情:

第一件事就是電視新聞報的跟事實差很遠
第二件事就是報紙所說的千萬不要相信
第三件事就是雜誌文章多是胡說八道
而我在那時之前也一直跟很多人一樣, 認為會有一個 "中立", "客觀" 的媒體, 但後來慢慢體認到, 任何媒體都有 "立場" 與 "觀點", 因此想在一個媒體追求中立客觀是不太可能的, 我們只能透過很多很多不同立場與觀點的媒體, 綜合起來才能嘗試著接近 "中立" 與 "客觀".

所以在 "樂生事件" 之後, 我一直在思索能否透過社群媒體來跟大眾媒體, 而在嘗試很多次之後, 終於在 2008 年利用部落格觀察做出 "部落格好好讀", 透過部落格來看社群媒體的熱度, 也做了幾次有趣的觀察, 如: "台灣媒體的對立現像", "好好讀的藍綠對決? 看馬英九與陳水扁".

只是很不幸的那時候主流大眾媒體對網路還是不理不睬, 不要說是看扁網路媒體, 更是敝藪自珍的保護自己, 而接下來幾年, 發生甚麼事大家都知道, 不只是傳統媒體紛紛上網, 甚至還有原生的網路媒體及內容慢慢掘起, 相對於傳統媒體紛紛落馬, 到現在很少傳媒不會不在網路做露出了.

而一直到做林克傳說時, 也嘗試很很多次去用系統計算與監督衡量傳媒的計劃, 也做過很多次社群媒體的採集, 例如噗浪, G+, 但最後台灣目前最大宗的是臉書 Facebook, 因此林克傳說也是透過臉書去看社群如何看媒體這件事.

經過一兩年的調校, 透過林克傳說已經可以解讀不少社群媒體的資訊, 若是能夠把大眾媒體這塊給連結起來, 當時的計劃就有初步的實現, 只是抓資料並不難, 真正困難的是訂定 "議題", 而這部份真的只靠語意分析是困難度很高, 而當時部落格好好讀用的是 "搜尋關鍵字" 做種子, 而大眾媒體要用甚麼做為基礎也想了很久, 一直到最近, 認為採用各家媒體 Tag (標籤) 的使用, 就是很好訂定議題的方式.

標籤是一個很具有記者面對採訪對像的出發點意義, 加上分類觀點的整理, 跟使用者導灠與搜尋的情境等等的功能, 就是一個很好的議題定義方式, 透過這樣的延伸, 此時就可以做出一個知道這個議題在大眾媒體的熱度, 加上與林克傳說社群媒體熱度的串接, 就可以一目了然這議題的屬性, 是否在大眾媒體或社群媒體過熱或過冷.

最後做出像下面這樣的表格系統, 目前暫名 "雲標籤":

從這些就可以看到這個議題在大眾媒體與社群媒體冷熱的比較, 而也嘗試著做了一些數字的正規化, 來保持一致性來做比較, 因此也是以接近覆蓋率的熱度來做基準, 因此也是種百分比, 但相對的大眾媒體相較社群媒體是比較少樣本數, 變異度不像社群那麼高, 甚至在議題的分布都是相當平均, 不像社群媒體高低落差是相當大的.

當然接下來能做的還很多, 例如跟 Google 新聞做比較, 或者是直接對所有新聞內容做搜尋, 定義出熱度都是很不錯的參考值, 但至少透過這個 "新聞標籤雲" 的系統, 可以很輕易的知道這議題是那家媒體在炒作, 但倒底這差距是因為記者的專業與道德, 還是因為業配或是被收買, 這還是要靠大家自己的解讀, 畢竟這只是種輔助工具, 答案還是要靠大家去尋找, 只是更希望大家透過這系統認知, 閱讀新聞並不是照單全收, 還是須要我們讀者去做判斷才不會誤讀.

2014年12月17日 星期三

如何提升網站 CTR 的思考架構學

在 Search Rank (SEO) 納入 Users Signal (使用者訊號) 之後, Click Through Rate (CTR) 變成了一個不在只是 UI/UX 的最愛, 更是 SEOers 不得不提的事了.

當然 CTR 不是只有注重 SEO 的人才須要注意, 而是每一個網站經營者都須要認真思考的一件事, 記得在很久以前有一個我認為很重要的準則:
在每一頁都須要有一個你最希望, 或你認為使用者最有可能會點的一個連結, 然後給明確標示出來讓使用者清楚的看到去點擊.
只是在大多數的情形下, 若不是透過個人化的資料探勘或行為預測, 真的很難算出或知道使用者真的想要的, 所以最後只有設定一個最顯眼的圖示, 就是經營者想要的, 通常就是 "發表/回應文章", "放入購物車/結帳", 這些事情, 但就真的是這樣嗎?

當然也不是不可能真的幫使用者算出他最有可能要的東西, 就像是在之前一篇文張提到, "九項如何建立有效商品推薦系統, 所須要知道的進程導引與架構指南", 裏面就說了: 分類系統(標籤系統), 排行榜, 分類排行榜, 消費者背景 (因子分析), 關聯分析, 多次關聯分析, 語意網路, 社群訊號, 個人單品預測都可以做為使用者最有可能會點擊的選項.

但說了這麼多, 還不如請大家去看 "Ambient Findability 隨意搜尋" 做為基本常識, 雖然這本書是寫於 2007 年, 裏面不少已經過時, 但是很多精神都還是可以學習的, 只是現在或許若是追求 CTR, 又是一種不一樣的境界與出發點的不同, 但最後很多是大同小異.

而在這邊用一個簡單的思考模式讓大家在做網站時, 如何提高 CTR 的思維心法, 也就是一個思考的架構, 讓你去找到使用者想要的線索, 而網站要提升 CTR, 就是隨時隨地把這線索提供給使用者就對了.

我們可以想像使用者到網站之中探索, 一定會有其方向, 我們把方向定義成八維, 就是上下左右前後內外的四軸, 這四軸的八維代表的行為是甚麼呢?

1. : 當使用者發現這頁的資訊是他要的, 但只是所想要的一部份, 所以會嘗試著提高視野, 也就是更巨觀一點的角度, 此時用麵包屑就可以讓使用者知道這網頁的層級, 往上一層就可以找到他要的資訊.

2. : 相反的使用者發現這頁的資訊雖然方向對了, 但不夠精確, 此時就可以透過次分類或結構化條件, 或此類別下的搜尋找到往下層的 "Refinement", 通常也可以用 Tag Cloud (標籤雲) 或關聯分析做到, 雖然這個往下跟上不一樣, 上通常只有一條, 但下有很多種可能性, 當然若是 Network Relation (網路關係) 而非階層式又是不同, 只是前題是要有這樣的既有資訊, 或者是去建立.

3. : 左右的意思是指同一層級的相似性, 在這邊區分成一種是整體的, 一種是個人的, 整體就是可以參考大家的共同行為, 例如像排行榜就是一種共同行為下聚合 (聚焦) 的結果, 當然很多關聯式分析 (Relation Analysis) 也是種精過專化的結果, 像所謂的關聯購買 (Also Buy) 也是很好的提升 CTR 的想法.

4. : 若是能夠預測出一個人偏好, 或者是算出一個人的行為機率來做其參考, 甚至真的用個人的行為專化出推薦, 這往往是最 "好/Right" 的 CTR, 甚至在看到此內容頁或商品時, 會讓使用者更願意在向前點擊時能夠看更多的東西, 勸敗更多, 若這是種 "專屬" 性, 甚至是會 "結束" 的話是更好, 最近我看過中做得最好的大概就是像 Steam 的 "探索佇列".

5. : 當然下一步往往是經營者最想要做的, 無論是放入購物車或是發表文章, 但也可能只是漫無目的瀏灠下一篇或下一個品項, 重點是不要讓使用者一口氣看到 50 個以上的連結, 且都沒有優先與重要性, 這是最糟糕的.

6. : 但最常見的是使用者想要回頭看的機會是相當高, 且有時只是靠 "上一頁" 或 "回首頁" 是不夠的, 因此有些網站會加入 "最近瀏灠" 的清單, 這都是不錯的主意, 至少要讓使用者對自己過去的行為有跡可循, 甚至透過這樣的回溯找出新的叉路, 又提升 CTR 了.

7: : 通常這邊可以定義成 "More/更多", 如何讓這頁的資訊更多, 變成一種類似 Aggregation (聚合), 甚至是 Portal (入口), 創造出很多跟此頁的相關資訊, 或是能夠讓使用者把這邊是種內部的中心, 去探索, 做出好的決策, 通常不用太擔心負面資訊, 因為嫌貨總是買貨人, 就怕他不再去想要知道更多.

8. : 網站最怕的當然就是 Exit Rate (離開率) 太高, 或者是直接的 Bounce Rate (跳出率) 不再回頭, 所以若使用者真的不知道自己要甚麼, 就想辦法讓他去 "Search/搜尋", 無論是有建議的, 或結構化的搜尋或是全文搜詢甚至同性質網站的建議, 如何讓使用者有好的 User Experience (UX), 這是讓使用者繼續留下或再來的重要因素.

寫到這邊, 就直接乾脆把這方法稱為有點俗套的網站八卦陣 (感覺是在賣膏藥), 但在某方面也是如此, 透過這種思考, 能夠更包覆使用者的須求, 就能夠讓使用者更願意留下來, 就能夠增加 CTR 與 TOS (不是 The Original Series).

只是這八點看起來很簡單, 事實上有幾點要實作不是那麼簡單, 可以去看看你經營的網站已經有那些維度或者是還缺那些維度呢? 但透過這樣的思維, 會不會覺得更貼近使用者一些了呢?

LinkWithin

Related Posts Plugin for WordPress, Blogger...

熱門文章