2014年11月28日星期五

從官網的比較來看柯文哲與連勝文的使用者分析

這次的選戰跟以往不一樣的是網路味特別濃, 上一篇講到社群的反應, 事實上除了社群網站的使用者之外, 還可以從官網的使用狀況來做比較, 也是相當有趣的.

雖然 Alexa 的資料不多, 因為這兩個網站流量本來就無法跟一般網站去比較, 但從 SimilarWeb 中倒是可以看到不少端倪, 我們就來慢慢發現有趣的事吧.

1. 流量, 柯文哲官網以 60% 小勝:

網站的流量有時是沒甚麼好比的, 但這也是網站的重點, 就 Similar Web 說, 柯文哲是 490K, 連勝文是 310K, 也就是柯文哲官網占這兩個網站的 60% 強, 事實上就最下面的導流來看, 柯文哲在網路上最有趣的是靠 "網站群", 例如 "柯P新政" 等, 所以理論上應該還會更多才對.


2. 使用者行為, 柯文哲官網的停留時間, 瀏灠頁數與跳出率都較好:

事實上比流量某些觀點是較無趣的, 較有趣的應該是看網站的幾個價值就是 "停留時間, 瀏灠頁數與跳出率", 很明鮮的是柯文哲官網在這邊有很大的差異, 也就是停留時間 3:01 比 1:55, 每次瀏灠頁數是 3.16 vs 2.95, 而跳出率 (只看一頁就走人) 是 51% vs 61%.

這代表的是柯文哲官網的內容, UI/UX 比較受其使用者接受, 雖然這邊有兩個原因, 在很多地方這兩個官網的架構雖然差不多, 但內容本身是有差異, 族群是有差異, 最後造成這現像說不定只能證明這兩個族群的差距, 也就是會看連勝文官網的人對網路的依賴度較低, 說不定這才是重點之一.


3. 來源的比較, 連勝文官網在直接流量與導流都較高:

雖然這樣說似乎理論上連勝文官網在搜尋與社群導流較弱才對, 但事實上差距不大, 因為這數字有幾個代表意義:
會來看連勝文官網的人來源不是透過網路, 所以造成直接流量很高, 也就是說靠文宣等非網路來的人是偏多的
上面這句話似乎更能證明連勝文官網的族群不是網路使用者, 至少不是網路重度使用者.

4. 搜尋字詞, 搜尋到連勝文官網的關鍵字, 實體連結的較多:

大家都會搜尋政見, 行程與活動, 這也是自然的, 當然柯文哲推出一系列的活動, 商品都有很不錯的效果, 自然在 Search Term 就很明鮮, 這是跟連勝文官網不一樣的地方, 相較之下由於一些 "選戰疑雲" 的關係, 這些字在柯文哲官網也是很明鮮.


但連勝文的使用者會搜尋地址與電話, 這在柯文哲官網是較看不到的, 這代表連勝文的支持者透過網路最後還是要用電話, 地址來做實體接觸, 這也是更可以發現族群差異的地方.

5. 新使用者比例, 柯文哲官網不少回流:

網站有趣的除了覆蓋率能夠讓更多人知道外, 另一個是使用者是否能夠回流, 柯文哲官網有 4 成的回訪客, 相對的連勝文官網只有 2 成, 這也可能跟網路使用者習性有關.

6. 導流網站, 連勝文官網多是新聞網站, 柯文哲多是討論區:

從這邊兩張表來看, 左邊是柯文哲, 右邊是連勝文:


可以看得出來右邊很多是新聞網站, 例如 UDN, 中時不可能出現在偏向柯文哲的媒體, 在這邊變成連勝文的主力, 而關鍵評論是兩邊都有, 但應該說連勝文導流的 10 大來源有 6 個是新聞媒體, 而柯文折只有 2 個, 這才是最大差異.

btw, 在 UDN 的討論居然在柯文哲官網站不少, 這也相當有趣.

7. 曝光式廣告, 很不幸的, 只有連勝文有:

柯文哲官網從 Similar Web 來看, 是出現一隻小狗: "NO DISPLAY ADVERTISING", 也就是說算不到有買曝光式廣告, 相對的連勝文是:
但我們知道連勝文官網買的廣告還包含酷比等系統, 而其他非聯播網廣告的是無法從這邊看得出來的.

從上面幾點大概可以看到這兩個官網本身並沒有勝敗優劣, 唯一差別的對像與經營方向的不同, 一個對像多是網路族群, 多是社群自發性, 另一個則是不少非網路族群, 多是靠廣告與媒體趨動, 這是原因還是結果, 就讓大家自己去想吧.

SimilarWeb 網址:
http://www.similarweb.com/website/kptaipei.tw?competitors=taipeihope.tw
http://www.similarweb.com/website/taipeihope.tw?competitors=kptaipei.tw

勝文被霸凌了嗎? 來看媒體光譜圖與變化

最近連勝文一直說他處於一個被霸凌的狀態, 事實上如何我們來看看...

這份資料是從林克傳說的工人智慧加人工智慧系統所算出來的, 系統是透過臉書使用者的分享, 計算其覆蓋率, 然後透過人工判讀此連結的傾向所算出來的結果.

請大家記住, 這數字是有其特殊性的, 是一個持續性計算與搜集資料的系統, 跟所謂的市調與民調是不一樣的, 所以只能代表那段時間, 網路上討論與關心的方向:

1. 必須要有媒體寫出文章
2. 透過使用者的分享覆蓋率超過 2%
3. 一個議題可能有同時存在六種意見
4. 代表言論的覆蓋率而非投票的傾向

雖然這是分析媒體的效應, 而不是候選人, 但從這邊可以整理出很多很有趣的數字, 我們一項項來看:

I. 總聲量

在這些時間來, 反對連勝文之類的言論被散播 286737%, 也就是說平均一個人會聽到 接近 3000 次在網路上講柯文哲好話, 相對的反對柯文哲之類的數字是 80909%, 此時我們定義一個值叫 P 值, 也就是這兩種言論的相對率, 這邊後面都會用到, 而在網路上的整個 P 值是 78.0, 也就所有的言論對柯文哲有利是 78%, 相較連勝文只有 22% 而已.

II. 媒體 P 值的傾向

這邊要分成兩部份來講, 一個是大眾媒體, 一個是非大眾媒體, 就非大眾媒體而言, 除了柯P自己的柯P新政外, 大概影響力都不太夠, 但可以肯定的柯P官網的 P 值當然是 100 分, 是無庸置疑的, 而剩下的四個就是社群媒體, P 值最高的是 WeTalk, P 值為 97 分, 且總影響力也最高, PTT 第二名, P 值為 93 分, 事實上 disp.cc 的 P 值也是 93 分都差不多, 其中 P 值最低的是 Youtube, 剛好是過 75 分.

而大眾媒體又完全不一樣, P 值最高的是關鍵評論網, 剛好過 75 分, 但幾個影響力較大的媒體如蘋果日報 (68分), 自由時報 (70分), 新頭殼 (69分), 風傳媒 (55分), ETToday (55分), 可以看得出來大家的分佈都差不多, 甚至是分成 7 成與 5成5 的兩個族群, 真的相當有趣, 偏離度最大的是 UDN, P 值只有 46 分, 可以說是在臉書使用者散播中 P 值最低的, 也就是跟其他的媒體的立場與讀者比較起來, 說不定是最 "特殊" 的.

所以從這邊可以得出一個結論: 媒體雖然是對柯文哲有利的新聞較受歡迎, 但並不會超過 75%, 但社群媒體是沒有低於 75%, 也就是較為一面倒.

這數字不是代表這媒體的言論比例, 而是經過覆蓋率轉化的,  跟則數無關.

III. 這 200 天的趨勢圖

隨著選戰的接近, 幾乎是所有的最高點都是發生在最近, 下面是單日覆蓋率最高的那一天與比率:

11-18 反對柯文哲言論覆蓋率 53%
11-24 支持柯文哲言論覆蓋率 79%
11-27 支持連勝文言論覆蓋率 57%
11-27 反對連勝文言論覆蓋率 84%

所以這選戰還真的是在最後面越受大家討論.

IV. 媒體的轉變

有些人很關心在這段期間, 各個媒體的偏向 KP 的比例有沒有變化, 事實上從下表看到幾個有趣的事:

1. 幾個有較大影響力的媒體在 11 月是新低: 如蘋果, 自由, 尤其是 ETToday 居然創下 20 分的新低, 對連勝文有利的言論此時在新聞傳媒被大量散播.
2. 但總聲量較低的媒體, 幾乎只剩下偏向柯 P 的新聞被散播: 如 UDN, nownews, 但數量都不多.
3. UGC(使用者產生)的網站, 除了 Youtube 外, P 值都是 100 分, 這代表在社群已經完全沒有人支持連勝文嗎?

所以就上面的四點來看, 你認為勝文被媒體霸凌了嗎? 只能說, 網路中的社群媒體是沒錯, 但大眾媒體倒是不會的, 甚至要說這個月, 有股力量在操作大眾媒體, 這句話也不完全是補風捉影喔....

2014年11月26日星期三

深入了解 Google 放棄 Page 的真正原因

這幾天的 SEO 界, 最大也最沒有意義的是, Google 已經宣稱不再更新 Page Rank, 雖然說這不是新聞, 而是去年 12 月時, 谷歌已經委婉的說, 請大家不要看 Page Rank, 甚至在 Tool Bar 等直接閹割掉了, 但這次還是官方直接指出 "沒有計劃更新 Page Rank"...

記得在幾年前, Google 最有名的就是 Google Dance (跳舞) 這儀式, 指的就是在 Page Rank 更新時排名大伏度的上上下下, 而現在這儀式已經不再有時, 而當時架構出 Google 的基礎, Page Rank 就如此的被割捨了, 這原因是甚麼呢? 這邊做幾個深入分析:

1. PageRank 值是往往被黑帽 SEO 玩弄的指標, 甚至是某些問題點, 此時 Google 把這點直接給丟掉, 可以說是讓很多黑帽 SEO 少了可以操弄客戶的可能性與機制, 讓大家回歸到網站與使用者的經營, 這才是最重要的.

2. PageRank 的精度越來越低, 也是因為前面的狀況, PageRank 變得很難去較準確的算出網路的狀況, 變成最後只能靠其他方法與技術去修正, 導至最後其他的演算法比 PageRank 更有價值的因素.

3. PageRank 是個很難維護的演算法, 因為這不只是個會回饋, 會遞迴的演算法, 我一直認為這演算法不是甚麼, 但能夠設計出一套真的算出來的系統才是 Google 當時的基礎, 只是這個隨著網路的發展, 計算 PageRank 成本已經越來越高, 使得更新週期越來越長, 此時放棄這種高維護成本且低精度的事, 也沒甚麼好意外的了.

4. PageRank 已經只是超過 200 種因素的其中之一, 且意義越來越小: Google 透過 Chrome, Android, Analytics 等機制, 已經可以有更多, 更直接, 更準確可以算出網站價值的方法, PageRank 在 SERP 的意義已經是九牛一毛了.

5. 反正 PageRank 已經壞掉很久, 且沒人可以維護或有影響, 甚至 Google 沒人有興趣修護, 畢竟若是有人做出新的專案, 對公司是個 Credit 貢獻, 但去維護舊的架構, 即使做了也不會有人把你當成對公司有貢獻, 所以也是種政治下的因素, 就這樣沒了, 這似乎在商場也是很常見的...

因此這時候放棄被操弄, 精確度存疑, 成本高的 PageRank, 不只是時候, 而是應該更早才對, 但或許 Google 真的要去把 Page 切割掉, 在歷史上, 在政治上, 都是很難去做決定的, 而最後壓垮駱駝的, 就是成本太不划算了, 畢竟商場是沒必要把資源花在一個用不太上的東西, 即使再有情感, 尤其是 Google 已經是跟著 Microsoft, Yahoo 等公司練就一樣的次元刀切割技術, 越切越快, 越切越多, 此時切掉 PageRank, 也沒甚麼好意外.

SEO Ranking Factor, 影響 SEO 排名因子初探 (2014), CTR 變成最重點 這篇文章說, 我有提到 Search Engine 的四個時期:

1. 架構時期: 內容, 引用, 標籤, 關鍵字...
2. 點擊時期: SERP, RSS, GA, Chrome, ...
3. 社群時期: +1, SNS, Meta Data, Semantic Web, ...
4. 個人時期: Authority, Device, User, Relationship, ....

在某方面, 架構時期已經快到一個極限了, 此時把以 "引用" 為概念的 PageRank 放掉, 也代表其他三個因素也越來越重要了, 尤其是那邊說到的 CTR (Click Through Rate), 就是一個很重要的使用者信號, 且這信號是來自於對內容,  UI/UX 各種因素的綜合因素所建構出來的, 因此此時把重心重回到個人, 使用者, 與社群是相當對的.

所以, 讓我們開始見證沒有 Larry Page 的 Google 時代吧, .... 阿, 只是沒有 Page Rank 而已啦....

ps: 圖取自 https://www.seroundtable.com/google-pagerank-dead-again-19482.html

2014年11月22日星期六

從令人震驚的 Techcrunch 的改版來看 Tag 在 SEO 價值


這故事大概是在兩三個星期前, 因為在跟某人(團體)講一些 SEO 的事, 提到我每次都十分強調的 Tag (標籤), 說不定很多人都聽到耳朵長繭了, 而我在那次就隨手拿 Techcrunch 來做介紹, 但一時從文前到文後都找不到, 我在想 Techcrunch 一定是瘋了, 怎會把 Tag 拿掉呢?

但仔細一看我震驚了, 原來 Tag 不是被拿掉, 而是被放在比 "Popular Post (熱門文章)", 的左邊側欄最上面的地方, 也就是所謂網頁的 "Hot Zone (熱區)", 且更是緊臨著文章標題 (Title) 的地方, 也就是大部份人眼球落點最開始的地方.



這件事代表著甚麼呢?

資訊要能夠有用, 代表許多問題的解法都是可以參考之前的作法, 若是每次問題都 "不一樣", 那資訊的價值就很低了, 而這 "一樣" 指的就是資訊的 "聚焦".

只有很少數的人上過我 SEO 的課, 就知道我開宗明義就是講 "聚焦", 而這聚焦在搜尋引擎最佳化的精神就是落在 "關鍵字", 而這關鍵字不是單純以 "分類" 的觀點, 但應該說, 現在的分類已經很難追求:

1. 獨立互斥
2. 階層式
3. 客觀

因此原本關鍵字 (Keyword) 的搜尋行為觀點, 慢慢的從 "分類 (Catalog)" 變成 "Tag (標籤)", 這標籤變成資訊 "聚焦" 的主要方式.

但會是把標籤 (Tag) 變成 SEO 重要的精神不是如此, 而是:

1. 時間: 最早寫出這概念的文章往往是最權威的, 所以 SERP 應該放在最前面, 但相對的最新的文章代表更有即時性價值, 因此也該放在 SERP 前面, 但一篇文章不太可能同時是最早 (舊), 卻又是最新 (剛更新), 而相對的標籤頁 (Tag Page) 卻是有這種特性的網頁, 很早就產生, 但持續因為有新文章有此標籤在更新.

2. 內容的聚焦: 要一篇文章一直重覆講相同的東西是沒有意義的, 刻意去做就會讓讀者相當辛苦, 就變成是黑帽 SEO, 但相對的標籤頁卻是必須這樣做的, 因為這些文章列表本來就是因為這個相同的概念所集中在一起, 重覆出現是相當合理的.

3. 連結: 我們知道連結在 SEO 是相當重要的, 但也不太可能讓一篇文章一直被連結到, 即使是靠相關文章所能創造的連結就是那幾個或是相當有限的, 但 Tag Page 擁有的連結不是一般文章能夠比擬的, 幾乎是每個 Tag 都會有連結到這頁, 所以即使在外部連結如此難賺的情型下, 內部連結至少是要有好的結構.

4. CTR: 有了內容的聚焦, Click Through Rate (CTR) 自然就會起來, 而 CTR 起來代表點擊數與曝光數夠高, 使用者使用的機會高, 若再能推 Share (Social Signal) 一把, 標籤頁幾乎是一般內容頁不能夠比較的.

事實上已經有人發現了, 若是網站架構正常, 一篇新的文章的確可以很快的在搜尋結果頁 (SERP) 在前幾名, 但沒多久就被洗到後面了, 而最後留下的幾乎是 Tag 頁面, 因為這標籤頁就是擁有上面幾項特質在 SEO 佔盡便宜.

但我都可以開玩笑的自稱 Tag 傳教士, 但我還真的不敢做出像 Techcrunch 一樣的事, 既然 Tag 有這樣的 "高價值", Tag 可以做為對使用者的閱讀導引, 甚至做為搜尋與分類的導引, 這麼重要的事為甚麼要拘泥於我們習慣放在文章的最後面呢?

這次 Techcrunch 做出這樣的事, 我是認為相當合理的事, 因為通常左上角的 Hot Zone, 往往是放 "麵包屑" 或是 "分類導引" 的地方,  而 Tag 本來就具有這兩種屬性的事, 而在麵包屑與分類往往不夠聚焦, 也就是太過廣泛, 相對於 Tag 是對文章的關聯有相當大的地方, 為甚麼那邊不放 Tag List?

Techcrunch 除此之外一些細節也做得很不錯, 進到 Tag 的頁面, 不只是跟大家樣樣就顯示有這 Tag 的文章, 也列出這篇文章有那些其他的 Tag 做為下一步 Refinement 得導引, 雖然做這件事的人相當多, 也沒甚麼好意外的, 但最有趣的是下面.

TC 也對這個 Tag 做了簡單的介紹, 甚至是以自身角度做出發, 例如是 Gadgets 就會加段描述: "The hardware that’s bringing computing everywhere", 用很輕鬆的角度來定義 Gadgets, 而 Asia 就會以自身角度出發的寫: "The latest innovative tech coming out of Asia", 不是寫亞洲的定義, 而是以 TC 地角度來寫, 最後把這段字放進 Titile (標題), 此時 SERP 就很漂亮了.

除此之外, 也把分類與 Tag 打破, 已經不存在分類, 也就是 Tag 在某些地位上已經跟分類差不多了, 說真的要我也因此放棄分類我也做不到, 雖然這是合理的, 但也是有些可以討論的.

當然還是有做不夠好的地方, 例如在 meta-data 的 description 並沒有放進去的許多小暇疵, 但暇不掩瑜, 這次讓我震驚的地方著實讓我自省很多, 因為就理論面與技術面, 這完全是對的事, 但我們往往因為不想改變或積非成是(?)的習慣, 讓我們沒有進步與做好, 這才是重點, 而不是只有 Tag 這件事.

2014年11月14日星期五

我潛意識中心裏真正支持的台北市長

"人類的政治會那麼紛亂, 不是有太多人參與政治或是參與政治過深, 反而是因為大多數的人對政治漠不關心甚至厭惡紛亂的政治, 尤其是那些掌權的人更不希望有更多的人來參與政治, 這樣他們才可以用政治之名為所欲為, 政治才因此這樣紛亂~~~"

雖然說民主政治的架構是在於 "選舉", 但不代表人須要參與 "眾人之事" 只須要 "投票" 而已, 而是要去更多的參與社會與政治, 其中投票更是須要更認真與關心而已, 這次選舉大家要更認真的面對, 因為每次選舉影響是四年, 尤其這次是僅次總統大學的大規模的投票.

其中最重要的就是 "台北市市長" 的選舉, 是這次九合一大選最被重視的, 因此就更延伸的以 "彼得塔之鏡" 為出發, 做了這個 "我潛意識中心裏真正支持的台北市長", 事實上也不只做台北市, 包含新北, 桃園, 台中, 台南, 高雄的六都都有計算.

這系統是架構在下面兩個基本假設:
1. 要了解一個人先了解他的朋友
2. 很少人會表達自己的想法, 但可以從他的 "看法(閱讀資訊的方法)" 得知.
也就是這系統是算你與你的好友中, 有參加 "足以宣傳" 某候選人的粉絲團的數目, 因為只要這個粉絲團是經過判斷出來是跟這候選人相關, 就可以知道這個人透過朋友獲得這資訊的多寡與密度, 然後經過幾次正規化:

0. 你與你好友有多少人加入這幾個粉絲團
1. 正規化一個人有多少好友得知一個數字 (分數)
2. 這個頃向占全體使用者的比例 (比例)
3. 將前兩個數字相乘 (正規化)
4. 這數字跟其他數字的比率就是 (機率)

而這最大機率的選項就是你的傾向, 而這機率就是這預測的準確度, 所以有人的準確度說不定不到 50%, 但也有人超過 90%, 最後還幫你的頭像套你 "該表態" 的立場.

但這圖用的機器與授權是在 "我的想法我做主" 上面, 所以必須要在那邊有登入才能抓到.

這次系統是由闇月鏡所設計, 包含組圖也是,  最後有興趣大家可以去 http://ele.que.tw/ 做做看...

2014年11月10日星期一

四種工具讓你對台北市長選舉做出更好的選擇

這次九合一選舉已經不到 20 天了, 這次選舉跟以往不一樣的地方, 就是網路成份比起以往特別的濃厚, 雖然在四年前蘇貞昌的選戰可以說是網路選舉的初體驗, 但成熟度以現在的觀點還是不足的, 而現在的今天, 網路對一半以上的選民是不可或缺的管道.

其中最大的原因主要有兩點:

1. 已經沒有甚麼傳統主流媒體, 不在網路上看不到了
2. 社群媒體變成導讀的最大工具

但從 318 之後, 媒體人對網路工具的應用有更深刻的體認, 甚至有越來越多人投入這行列也是很重要的原因.

只是網路不該只是媒體而已, 網路是一種更可以有互動, 個人化,  實用的系統, 分析的工具才對, 這次的選戰也已經開始有這樣的味道了.

這次選舉已經有不少粉絲團, 部落格, 網站出現來參與這次的 "盛會", 這邊列出不同的四種工具 (網站) 讓你在這次台北市長選舉時, 做為決策的輔助系統:


這個是利用一些問答, 定義出你的想法跟那個候選人的政見較合, 這系統最大的特色就是找出候選人議題的分歧點, 透過你的選擇來做對應. 

這系統用九個項目的九宮格來呈現, 在之前還讓你選出可以加權與加重的選項, 這系統無論就 UI/UX 都是很不錯的設計, 當然唯一的問題是問題太少, 所以產出來的結果解空間只有 2^18 個, 但做為最後只有三個選項的決策支援已經很夠了.




市長給問嗎是一個由沃草做的系統, 可以說是用問答的方式由選民對候選人提出問題, 然後我們可以看到他們的回答後, 來做為決策的參考.

除了問答的內容外, 能夠參考的就是回覆率, 回覆率越高或許可以當作對選民是否較為正面的態度, 雖然說這系統的踴躍度不夠, 不然會更有意義.




這是一個以臉書朋友為基礎的表態系統, 透過表態的選擇可以讓你知道你的朋友與全部人的想法為何, 然後可以知道這之間的差距.

這系統重點在於你跟你朋友的互動, 讓你知道你的族群是甚麼, 或者是你有那些朋友可以討論或辯論, 可以用這系統做為去改變自己或改變別人的線索工具.




人會很習慣的去選擇跟自己想法類似意見的訊息, 或是去排除掉不同想法的來源, 透過這樣的機制, 若是你的朋友大多人有參與一個特定方向的粉絲團, 代表你就是有這屬性.

利用自己與朋友參加的粉絲團數目, 跟大家做比較, 就可以知道你的傾向是甚麼, 若這粉絲團是候選人的粉絲團, 就可以判斷出你閱讀資訊的取向, 有時就接近你所支持的候選人.


除此之外, UDN 也做了一個互動性相當高的選舉專題, 透過資訊圖表讓你用較為主動, 較為平衡的方式來看這選舉與候選人, 其中包含 "話題", "熱度", "行程", "民調" 等等的資訊, 也是另一種做為決策參可的系統.


但話說到現在, 還剩多少人還沒決定呢? 這才是比較有趣的問題吧... 但若能夠過這樣的系統,讓大家改變想法做出 "更正確的抉擇", 也是好事阿.

2014年10月30日星期四

成為資料工程師所須要學習的 28 堂課

雖然說 Big Data (大數據) 是一個很夯的話題, 但就像一個笑話:
Big Data is like teenage sex:Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it so everyone else claims they are doing it too.
雖然說就大部份而言, 這笑話是真的, 只是誇張了點, 因為 Big Data 目前遇到的問題還是相當的多, 就像是前幾天有一個朋友問我, 為甚麼電子商務網站都宣稱想做或要做資料探勘或大數據, 但為甚麼沒人去做呢? 我回答了幾個問題點:

  1. 沒有真正了解資料價值的專案負責人: 大部份的專案負責人或產品經理, 都是從業務, 商品, 行銷出身, 對他們而言無論是在學校的學習, 執行的經驗, 進修的內容都沒有相關的知識, 在沒有對這種背景知識有足夠了解的人, 如何去產生與企劃, 既使大部份都是別人在做的, 但若沒有概念是不行的.
  2. 要有人對做出來的業績與成果去承擔: 而若是沒有行銷與業務或產品去推, 那由資訊的人去推或許是合理的, 但最大的問題是資訊在電子商務是屬於後勤人員, 本身是不扛業績的, 而這種專案做出來會排擠其他的 Quota, 在沒有人須要的情型下最後只好無疾而終.
  3. 外包的成本太高, 但內部的人又沒經驗: 上面兩個問題若是遇到有心的老版就不是問題, 但真的要開始做時面臨到到底要 In-House 還是 Out-Sourcing, 雖然內部做是外部的三分之一到五分之一, 且對 BI (企業智慧) 比較能夠切中目標, 但人才與經驗是個很大的問題, 所以不是大好就是徒勞無功.
  4. 比 Big Data / Data Mining 更重要的事還很多: 大部份的電子商務公司最大的問題是資源不足, 而大家可以看 "九項如何建立有效商品推薦系統, 所須要知道的進程導引與架構指南" 這邊就可以知道能做的還很多, 在人力與資源不足得情形下被放棄或延後是合理的.
當然大家知道最大的問題還是台灣的市場與老版的企圖心都不太夠, 但拉回來, 身為工程師的我們, 真的有足夠的能力去擔當這責任嗎?

台灣的價值應該是在於人才, 而要去實作出這樣的系統須要:
  • 資料工程師: Data Engineer
  • 資料科學家: Data Scientist, Data Mathematician 
  • 資料專家/經理人: Data Expert, Data Manager
有人把這三個角色畫成下面的圖我覺得蠻有實務感的:
這邊大概畫出這三個角色的可能關係, 但在實務界更多的是一個人當三個人用, 也就是你甚麼都要會, 最後大概變成一個人要會的東西是成為下面這樣:
雖然說大部份的人能夠做好一項就很了不起了, 但真的最好須要這三項領域的專才的人, 通常不是一個人做到, 而是至少三五個人去架構與協調出來, 只是在台灣是不用太期待.

而在這次鐵人賽的緣故, 我大概規劃了一個 "成為資料工程師最初的 28 堂課", 因為有太多人對成 Big Data / Data Mining 有興趣, 而不知道如何下手, 花了 30 天 (包含導言與結論) 列出了 28 堂課給大家參考, 雖然說是 28 堂課還不如說是 28 個科目, 只是最後發現 28 真的太少了, 所以有些科目還合併在一起.

這 28 堂課除了最後一堂外, 也是把課程分程三部份:
  • 電腦相關 (Hacker)
  • 數學與統計相關 (Mathematician)
  • 社會人文相關 (Domain Expert)
每一類別有 9 科, 下面就是列表:

電腦相關


把這些知識打下基礎, 真的有實作的能力, 才是這社會最缺的, 也才是這社會推進的原動力來源, 每一個人都想個當管理者, 每一個人都想當個出嘴不動手的專家, 最後沒有人動手, 只是真正的價值應該是實作出成果為前提阿, 雖然之後的管理, 行銷是讓價值更高, 可以把成果的價值乘上好幾倍, 但若沒有這基礎做出東西的話, 永遠不會有第一個 1 出現, 因為若沒有了 1,  0 乘上 100 還是 0 阿.

所以我們就應該先當那個 1 (The One) 吧.

* 圖一來源: http://www.slideshare.net/ckliu/z-b-38495724
* 圖二來源: http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

2014年10月25日星期六

如何找到你網站/部落格最可以賺 CPA 的網頁

雖然說 CPM (曝光式廣告) 還是有存在的價值, 但已經慢慢失去其角色, 而在這系統完成的同一天, BlogAD 也宣告停止營運, 雖然不是說部落格廣告已經沒落, 但至少肯定的是部落格部份的 CPM 廣告已經快沒市場了, 其中有幾個很重要因素.
  • 部落格的流量本來通常就不大
  • 部落格的價值在於影響力, 只是看流量跟本是踐踏部落格的價值
  • 許多廣告系統透過 Re-marketing, RTB 等等技術提升 CTR, 此時再只講 CPM 就失去意義
只是部落格不賺 CPM, 還能做甚麼嗎? 自然大家會想到的就是 CPC 與 CPA.

在 Adsense/Adword 的進步下, 可以從內容方向判斷出那些廣告是合適的, 因此 CPC 已經達到一種境界, 但網站最有價值的不應該只是如此, 應該是更有人性的 CPA 才對.

一個網站由於有不錯的文章, 帶來不少的流量與效應, 此時應該可以肯定 CPA > CPC > CPM 才對, 只是 CPA 不是那麼簡單的事, CPC/CPM 可以靠聯播網來達成, 但 CPA 真的要做的好, 還是要有人下去操作才對.

而昨天在跟某兩位朋友聊天聊到, 的確這是很好的出路, 但這邊有幾個問題存在:
  1. 如何找到自己網站最受到讀者注意的網頁
  2. 找到合適這內容的商品
  3. 如何串接起商業模式
我那位朋友慢慢的把第二點與第三點串起來, 這部份須要有足夠的 Sense 及執行力與經驗, 對我那朋友不是問題, 只是第一點是很麻煩的事, 此時我就想到網事 (web.mas.ter.tw) 可以用其架構解決其問題.

而網事是一個透過 GA 來去做網站 SEO 建議的平台工具, 而一個有價值的網頁, 至少是合乎一點:
有足夠的吸引力讓使用者進到這個網頁
此時就可以用 GA 的 API 來做計算, 從開站的開始每一週每一週計算出能夠讓使用者搜尋進來的落點頁的訪客數, 來定義那些網址有足夠的價值去尋找更高的 CPA.

這邊還須要討論的地方, 就是 SEOKPI 是以月為單位, 而網事是以天為單位, 通常以天為單位容易受到極端失準或看不出來, 但若是用月為計算單位又不夠即時, 所以這是我第一次用週為單位計算的系統.

這個系統目前是在網事的子系統, 自然要先設定才能執行網事, 不了解的可以看 "網事知多少, web.mas.ter.tw 啟動" 這篇, 然後按下 "有價搜尋" 之後, 第二天才能看到資料, 當然若是之前沒有使用過的, 就可能要等到第二天才能夠按下去, 但之後就是每週隨時可以來檢查上一週進度, 如下圖:


接下跑出來的就會像下圖:


從上圖來看, 大概就是若去年我應該直接去跟 PQI 談 CPA, 且當時好像他們有看了我文章做了些改善, 但是最須要的功能並沒有完成, 所以我本來想要寫篇文章褒揚最後作罷.

但大家應該透過這工具, 就可以很即時且自動化的幫你找到你的網站是那篇作品是最合適去賺 CPA, 只是這只有幫助大家第一點, 而接下來的兩點: 找到合適內容的商品及串接商業模式, 須要的話我可以幫你介紹, 這樣讓大家寫部落格或做網站能夠多一點收益, 而能夠持續有好的處作, 這才是我最希望看到的結果.

LinkWithin

Related Posts Plugin for WordPress, Blogger...

熱門文章