2015年8月24日 星期一

從宋楚瑜粉絲團關聯分析的謬誤, 來看網路行銷的價值

我知道有不少人很關心粉絲團的經營, 只是這粉絲團經營的 KPI, 你認為那個比較重要?

1. 粉絲數
2. 觸及數
3. 互動數
4. 轉換數* (若是沒有網站就是點擊數)

當然每一種粉絲團追求的多少不太一樣, 除外還是有不少數字是很重要的, 只是那些數字很難拿到別人的資料去做競品分析, 所以就上面 3 個 (或 4 個) 而言, 你認為在你的粉絲團經營是最重要的?

這說起來真的相當複雜, 基本上我對粉絲團經營相較很多人真的是沒甚麼經驗, 畢竟我認為比粉絲團還有更多更重要的資料可以分析, 但對很多人, 粉絲團是個開始與入門是真的.

只是無論怎麼經營, 最重要的還是有一個不變的, 就是 TA (Target Audience) 的思考是最重要的, 這也是在做行銷廣告第一步要去思索的事, 只是網路行銷跟傳統行銷最不一樣的就是 "網路可以知道所有事情".

我常聽到賣廣告的人常說, 他們最討厭賣網路廣告,因為網路廣告從曝光數, 轉換率, 對象, 到價格都可以很透明, 所以很難去賺超額利潤, 相對的其他的廣告基本上往往是由 "關係" 來決定價格, 甚至背後有甚麼回扣折讓都可以很黑箱的去操作, 網路廣告就不行.

前幾天有人談到 "宋神掌" 的粉絲團是買 "僵屍粉絲", 而我提出那個證據是錯的, 但不代表我證明宋楚瑜這兩個粉絲團沒有買粉絲, 但我們都知道, 這兩個粉絲團都一直有在下廣告是真的, 只是廣告真的下對了嗎?

基本臉書提供了幾種定義 TA (受眾) 的方式:

1. 地點
2. 統計資料
3. 興趣
4. 行為
5. 關係鍊

而這幾個都過於糢糊, 有時最好用的方式是直接自訂廣告受眾或設定類似廣告受眾, 當然像這次總統選舉最簡單的方式就直接用 "地點", 就選 "台灣" 就好了, 這方法是沒有錯的, 但換句話說只是證明你: "有錢花不完", ...

若是用 Social Baker 來看目前這三組總統候選人粉絲團, 再加上 "公道伯" 與 "宋楚瑜找朋友", 我們來看這五個粉絲談透過關聯分析, 來看目前粉絲團的 TA 為何?

蔡英文:
洪秀柱:

宋楚瑜:

公道伯王金平:
宋楚瑜找朋友:

你可以發現一個有趣的事情, 這樣的關聯分析很難看到政黨與支持對像的屬性差異, 但幾乎可以肯定是這些對象都是對關心社會, 政治有興趣的人, 而就上面這五個, 就我所知目前只有公道伯可能還沒有做廣告, 其他四個都有廣告的使用與露出, ....

等一下, 有一個奇怪的粉絲團在其中, 為甚麼 "宋楚瑜" 的粉絲團的粉絲組成或 TA 怪怪的, 居然跑出 "最囧搞笑貼圖", 是因為他很冏或很搞笑嗎? 還是他本身就是 "黃色小鴉"?

我想這應該沒甚麼好意外的, 從宋楚瑜的行銷宣傳, 我們看到了一個超專業的行銷, 廣告, 包裝的人, 但好像離網路很遠, 甚至可以合理的懷疑這個團隊對於網路行銷實務經驗相當不夠, 他們不知道網路的廣告設定受眾很重要, 不然就是 "花錢如流水", ...

雖然不可否認的, 只要是在台灣, 就是總統選舉的受眾, 但就目前透過廣告所吸引到的人, 可能要到真正投票的 "轉換率" 還有很多關要突破, 理論上真正要去宣傳的應該或許是有影響力的 "意見領袖", 但或許這個團隊擁有 "無預算上限" 的資源, 想要直攻所有受眾也不是不可能, 只是讓其他人羨慕本錢很多罷了.

但最有可能的是他們對網路行銷知識太薄弱了, 相較我最近跟某個黨討論, 整個黨的網路行銷預算每個月只有兩萬塊就在嫌太貴, 真的是貧富差距相當大阿, 雖然我知道他們也對 TA 的概念還不夠, 所以在這邊想要徵求對臉書粉絲團廣告有經驗的人, 能夠讓大家好好了解網路的本質, 除了順便賺取微薄的講師費, 也對社會工作使點力吧.....

-----
圖源: https://www.facebook.com/business/products/ads/ad-targeting/
蔡英文:  http://www.socialbakers.com/statistics/facebook/pages/detail/46251501064-tsai-ing-wen
宋楚瑜: http://www.socialbakers.com/statistics/facebook/pages/detail/781585891901624
洪秀柱: http://www.socialbakers.com/statistics/facebook/pages/detail/796255990463702
王金平: http://www.socialbakers.com/statistics/facebook/pages/detail/680355452090976
宋楚瑜找朋友: http://www.socialbakers.com/statistics/facebook/pages/detail/491399324358361

2015年8月11日 星期二

從 "送神漲" 事件來看政治人物的網路素養

前幾天台灣土石流泗虐, 有一個總統候選人從泥巴竄出, 被人說: "傳說中的送神掌即將再現江湖。", 但此時有一個亂扎人的本文跳出來指控, 這種 1995*31 的粉絲數成長, 跟本是 "送神漲" 不是 "送神掌", 懷疑這跟本是造假, 這比傳說中的 "周XX恆等式" 還要神奇 N 倍的數字雖然悄悄的發生, 卻也給選情投下一個震撼彈.

或許這跟本沒甚麼, 但此時就有很多人跳出來講解甚麼是 "僵屍帳號", 這也是 "無限期支持方 XX" 給我們最大的學習, 很多政治公關人物都知道粉絲是可以買的, 結果就是在討論這樣買粉絲的價值與意義為何?

但真的沒有人發現這數字跟本不可能嗎? 甚至認真的點的查證就可以阿, 畢竟要買出 1995*31 這數字, 跟本是不太可能發生的, 因為一個 17 萬的粉絲團, 再怎麼沒動作, 每天都會好幾到幾十的上下, 無論是加入或退出, 說要固定成一個數字, 甚至是被買的, 除非是買粉絲團的系統算出那一天會有多少粉絲數的改變, 然後去硬買或退出成為 1995 這個數字.

我承認有這種經驗與 Sense 的人或許不多, 但至少可以多方求證一下吧, 例如我們去 Social Bakers 來看, 這才是最多人使用的, 雖然資料沒有像 Fanpage Karma 可以下載, 但我們隨便看一下這數字:




上面數字取自於 宋楚瑜  在 Social Baker 的資料所做成的 Spread Sheet, 大家可以驗算看看, 再怎樣取樣有誤差, 也不可能會有 1995*31 的可能性, 那為甚麼會這樣呢? 我在昨天也寫了:

很明顯的這是 Bug, 或者是因為資料密度不夠而做內插法出來的, 通常會造成這問題是:

1. 系統很聰明的做排程, 對於之前增加不多的粉絲團取樣降低
2. 或者是因為沒人查詢或觀察, 所以 flag 沒啟動, 就不會去抓
3. 這跟本是 Bug, 寫程式的人失誤
4. 說不定是系統資料遺失後, 所做的修正

畢竟一個系統要維護是相當不簡單, 要一個人計算 10 個粉絲團, 任何人可以做到, 但要持續做 100 個粉絲團的觀察, 就要有一定毅力, 而若是要算 1000 個, 還是要寫程式或借助工具, 只是要做出一個每天可以數十萬個粉絲團系統, 是要有一定的功力, 而要能夠記錄數百萬個粉絲團, 就不是那麼簡單的, 一個閃失就很容易出問題.

而一個說要自稱為 "網路觀察家" 的人, 應該要了解這數字來源的流程, 不要以為這些數字都沒有錯, 畢竟 GIGO (Garbage In Garbage Out), 分析一堆錯的數字怎樣都不可能有對的答案, 一個分析師要了解數字流程的問題, 從抓取 (Collecting) , 清理 (Cleaning) 與除錯 (Correcting), 到計算, 而到後期的呈現 (Presentation), 若你只了解一兩個環節, 此時就容易出問題.

事實上包含前幾天, 有一個某新黨的政治人物出來呼諭警察要出來查出誰是攻擊教育部的人, 以及誰是 Anonymous 並且抓出來判刑, 結果不只新黨的網站瞬間倒地, 連台北市刑事警察局網站也被牽連, 幸好警察局的人處理的好, 立刻暫時把國外的連線給阻絕, 至少讓市民可以使用, 這也算是處理得宜?

雖然有人說這只是國民黨或泛藍系統對網路的不了解, 但事實上就我們接觸, 一些新興政黨是從社會工作或社會運動出身, 對網路的了解還是停留在 "宣傳" 與 "發布" 的概念, 普遍對網路的認知與知識相當不足, 而另外一個民進黨的主導人, 多數也對網路是屬於想要操控而非頃聽, 因為現在大多數的政治人物還是停留在單向的大眾媒體時代, 對於雙向到多向的媒體, 不是不願了解, 有些更是面臨時代的轉變無法接受.

當然拉回來, 粉絲團經營真的不是看粉絲數, 那些以粉絲數為 KPI 的人, 你可以直接認定他的網路素養不好, 即使是網路公關公司的頭頭, 雖然我認為他們是了解真實, 只是面對這樣的客戶, 你會選擇做對的事, 還是聽從對方的想法?

而此時的我們該怎做呢? 或許大家先來這第三勢力網路工作小組社團看看吧? (置入一下, 阿, 這本來就是我在推的阿)

圖片取自 超越柱柱姊!宋楚瑜粉絲數飆增 遭疑灑錢動員「疆屍帳號」

2015年7月30日 星期四

號召第三勢力網路工作小組, 讓社會不再如此二元對立,

這起源是某一天我跟知名不具的野貓 (Wildcat) 在聊天, 提到 2016 選戰我們還能做甚麼事, 他蹦出一個說法 (或者是我腦補曲解他的想法), 他認為現在最討厭的不是藍綠惡鬥, 因為大家都知道國民黨的人整個是屬於自殺 (或自嗨) 狀態, 已經把選民當作敵人無誤, 而民進黨雖然知道他們現在有問題, 但跟本不知道人民在那邊, 雖然很緊張但還是找不到真正的民意, 只是很不幸的是綠軍在藍軍自爆後將會獲得太多他們不應該獲得的席次與選票, 畢竟現在藍綠還是掌握較大的社會資源.

因此我就跟他說, 或許我們應該幫第三勢力, 透過我們對網路的專長好好的讓他們知道甚麼是民意, 甚麼是未來政治, 畢竟我們知道現在國民黨自以為獲得教訓, 知道甚麼是網路, 但事實上是完全曲解網路, 而民進黨雖然慢慢了解網路, 但事實上了解網路的不是黨中央的人, 或者是臺面上的政治人物, 而是那些還在外圍的支持者, 而第三勢力的人則是不了解網路, 但他們也知道如此, 只是他們也沒有更多的資源去了解網路.

所以在想說, 若是能夠在網路上號召一個工作小組 (Task Force), 從提供網路概念, 如網路輿情的了解, 使用與解讀, 到網路在選舉能做甚麼事, 以及網路會對未來政治有甚麼影響與應用, 甚至從經營粉絲團與選民的互動訣竅, 網站的架設, 等等... 畢竟這些事情, 有時不只是會做不會做而以, 而是有更多的專業, 但事實上如何透過網路讓大家參與社會, 無論是候選人或是公民, 這才是真正的精神.

那一天是在五月的事了, 一下子就過了兩三個月, 問了幾個朋友, 發現這的確是個困難的事, 因為有太多朋友嘗試過, 而也因為失望慢慢離去, 畢竟這也是不簡單的事, 而我的個性不是那種會挑戰做太多麻煩事的人, 但今天看到前面說的野貓都出來哀嚎了, 我們大家就一起來做吧...

[目標] 號召想要幫助國民黨與民進黨以外的候選人的網路人, 無論是專業的顧問, 職業的接案, 或是義工, 想透過個系統來作媒合.

[精神] 讓候選人透過認識網路, 知道可以透過網路知道真正的民意, 了解網路可以與選民做互動, 募款, 以及選後的公民參與可能性.

因此須要大家協助的事:

1. 一起來建立這媒合系統
2. 把我們已經做的輿情系統更簡易讓候選人使用
3. 介紹候選人過來
4. 號召希望這社會不要只有藍綠可以選擇, 而願意透過網路工作幫助候選人的人.

我們會成力一個粉絲團與社團讓大家一起來參與, 有興趣的請加入, 我們就在那邊進行吧.

[粉絲團網址] https://www.facebook.com/thirdnoc

2015年6月25日 星期四

從次級資料在大數據的應用來看正負面聲量的新算法

感覺又是落落長的標題, 很像是論文, 一點都不是內容農場的下標方式, 但這樣才是真正的主題, 雖然我說不定是研究內容農場最深入的人, 或者是看過最多的人, 但代表真的下去做內容農場一定是另一個故事了...

在上一篇 "從新聞在臉書的按讚, 分享, 評論就可以知道是甚麼類型的文章..." 的文章中, 我們可以得到從一些使用者在臉書的行為去觀察出一些跡徵, 尤其是使用者對文章的感受, 這聽起來很簡單, 但又有幾個問題要克服:

1. 要知道這議題的相關新聞
2. 要知道這些數字的在當天的比例

幸好這個都在新文易數已經完成了, 所以接下來只要做分析就好.

我們可以從這個議題的所有新聞的按讚, 分享, 評論的數字與軌跡, 就可以知道大家對這新聞的看法, 只是這邊有一個較大的問題:

使用者對這新聞的贊同與異議, 指的是對新聞的主張, 而不是議題本身

這個套用在當時 "林克傳說" 的製作經驗時, 當時只能針對 "正負面新聞" 的聲量做比較, 現在更可以對單則新聞的 "正負面聲量" 做比較, 也就是說, 透過這樣的機制, 正面的新聞的負面聲量, 以及負面新聞的正面聲量就可以更精確的做分析.



舉個例子來說, 我們來看 "洪秀柱" 的社群歷史時, 讚同與爭議的是對 "洪秀柱的新聞" 去反應, 不完全是對議題 (人物) 本身去做評價, 但通常新聞大多是持平的報導, 所以有時也可以直接反應出對這議題/人物本身的正負面評價.

這種系統有甚麼好處呢?

1. 即時性相當夠: 當新聞出來, 每一小時民意的變化都很清楚, 這在做危機處理或選戰就相當有用.
2. 非侵入式: 很多問卷調查都是必須設定問題, 且主動去問民眾, 透過這樣民眾對新聞的想法是不會有主客觀的偏差.
3. 樣本性是全使用者: 雖然這個全使用者是指 "臉書的使用者", 不完全是 2300 萬的民眾, 但往往已經是 800~1200 萬的人的想法, 這跟抽樣調查層級是差很多.
4. 時間覆蓋率: 電話或問卷無法常常執行, 但這種方式是 24 小時隨時都在採樣, 就可以對變化與風向很有判讀性.

有時這資料會受到很多因子影響還是會偏差, 但由於這是個連續的時間序列, 且採樣是全面與全樣本, 即使在絕對值的轉換須要質疑外, 比較值與相對值就有很好的參考價值, 所以若是畫出時間軸的比較圖就會變成下面這樣:


像這樣的圖表就可以輕易的分析出目前這些人在民眾心中的想法, 只是這個較難轉化成絕對的民眾比例, 但若是要了解網路族群的想法倒是輕而易舉.

這系統目前還在研究介面, 等到做出來後會讓大家使用, 請期待.., 請大家可以給我知道你的想法與須求, 但不要問我那時完成, 哈.....

2015年6月8日 星期一

從新聞在臉書的按讚, 分享, 評論就可以知道是甚麼類型的文章...

這幾個月一直看各個媒體在臉書的表現, 可以發現各個媒體的使用者介面與政策, 都會影響新聞在臉書的行為, 雖然有時是讀者的屬性做決定.

而一則新聞有時不用從內容, 甚至不用人去 "刻意投票", 我們就可以從臉書使用者的 "讚享評" 就可以知道大家對這個新聞的認知與想法, 來回推這則新聞的方向.

經過這段時間的觀察, 大概已經可以得知一些分析方式, 從讚享評的比例, 可比劃分出 2^3 共八種象限, 而三個數值都很低代表沒人關心, 或三個數值都很高代表相當熱門外, 另外六個象限大概可以劃分成這樣的分析:
按讚數較高: 通常是娛樂新聞居多, 較為有趣的事, 但不少是業配文, 如: "恭喜粉紅豬!鍾欣凌42歲又有了, 親口羞認:3個月了", 或 "12年招牌長髮掰掰!張鈞甯剪俏麗新短髮".  
分享數較高: 跟自身與生活有相關, 以民生消費健康類居多, 如: "開車門沒禮讓來車 交通部擬開罰", 或 "你不年輕了!35歲後的職場路,沒有「打掉重練」的選項".   
評論數較高: 非常具有衝突的議題, 有很強的正反兩極化, 如: "槍決6死囚, 苗博雅:法務部什麼都不會,只會執行死刑", 或 "提升軍人地位, 藍委提案軍人節全國放假".  
按讚數較低: 震驚的事情, 大部份都是很糟糕的政策, 如: "立院三讀, 大專畢業生可至企業服替代役", 或 "中華民國萬萬稅, 「寵物稅」蠢蠢欲動".  
分享數較低: 悲傷的事情, 尤其是社會案件居多, 很多人不會想散播, 如: "好難過!劉小妹遇害時, 已驚嚇到胃痙攣", 或 "竹東河濱橋下, 驚見國二少女裸屍".  
評論數較低: 好文, 但較不具社會影響力, 且很有可能是內容農場類的文章, 如: "老師在聯絡簿上的插畫, 竟讓網友羨慕學生", 或 "陪你到最後!新婚老婆癌逝 老公思念文章讓網友淚崩"
其中這三個數值不是直接拿來做比較, 而是要經過轉換, 也就是這三個數值除上 40, 2, 3 後來做比較, 若是有一個數值超過 2 或低於 0.5 就代表較低或較高, 舉個例來說, 讚享評若都是 6000, 6000, 6000 的話, 除調 40, 2, 3 的數值後是 150, 3000, 2000, 也就是說是按讚數過低, 也就是代表大家覺得震驚, 而擁有較多的分享與討論, 而按讚, 分享與討論數而若是 12000, 300, 300 的話代表 300, 150, 100, 代表是按讚數過高, 也就可以猜這是娛樂新聞或業配文機會較高.

而大家想要找出自己的想法與觀察, 可以從 臉書社群排行榜 (24小時內新聞的讚享評), 以及 臉書金榜 (歷史較高讚享評的新聞), 而目前臉書金榜的要求就是 40000, 2000, 3000 個讚享評, 大家可以試試看....

2015年5月14日 星期四

你知道 "李倩蓉" 相關新聞曾占當天所有新聞分享數的 8 成嗎?

原標題: 從新聞的寡占性, 來看未來電視新聞的可能性...

完整標題: 你知道 "李倩蓉" 相關新聞曾占了當天所有新聞分享數的 8 成嗎? 這不是罷凌, 只是我們的視野被新聞, 被社群, 被自己受限罷了.

你知道嗎? 在 4/23 當天, 楊又穎的新聞占了所有新聞量的 5.4%, 而這些新聞按讚的數量, 又是占了全部新聞按讚數的 24.9%, 再隔天, 楊又穎的新聞分享數又占了所有新聞分享數的 29.0%.
=> 也就是說, 有 3 成的人都在那時分享楊又穎的新聞

你知道嗎? 在 4/26 當天, 尼泊爾的新聞占了所有新聞量的 16.0%, 而這些新聞按讚的數量, 又是占了全部新聞按讚數的 16.4%, 同時的評論數也超過 20.0%.
=> 也就是說, 那時有 1/6 的新聞都是在講尼泊爾大地震.

你知道嗎? 在 4/4 當天, 李倩蓉的新聞占了所有新聞量的 4.3%, 而這些新聞按讚的數量, 又是占了全部新聞按讚數的 24.0%, 當天的評論數也占了 33.2%, 再隔天, 楊又穎的新聞數超過 5.3%, 分享數又占了所有新聞分享數的 80.1%...
=> 也就是說, 曾經有過台灣人 8 成的新聞焦點都放在阿帕契案或是李倩蓉身上.

台灣主要新聞媒體, 每天可以產出 6000~8000 篇新聞, 而這些至少可以分成 20 個主要事件及 50 個次要事件, 這些事件若能平均分布的話, 每個事件應該可以獲得大家目光 2%~5% 的注意力, 但事實上透過 "某種機制", 一到兩則的頭條新聞幾乎占掉 2 成的新聞版面, 而透過社群的散播, 這一兩則頭條新聞甚至是可以占到一半的瀏灠量.

但這也不能說是天天有的, 因為上面舉的例子都是較大事件, 像大巨蛋最高也只占過一天總量 4% 的新聞版面, 40% 的總分享數, 英國藍最高也是 4% 的新聞數, 17.5% 的討論數, 且其他時間也不超過 10%, 但當是有大事件發生的時候, 會覺得全台灣的新聞只剩下這個事件, 其他就消失了.

不得不否認的新聞記者有新聞記者的難處, 但很明鮮的很少有超過 10% 的新聞都是在講同一件事, 甚至 5% 的也並不多, 但相對的在社群的集中度而言, 超過 5% 是幾乎每天都有, 10% 以上跟本不希奇, 而 20% 更是正常, 這代表社群有時比新聞記者更容易聚焦在一兩件事.

但這也是無可厚非, 平常人不是不看新聞, 若能知道個 3~5 件事就不算脫節, 而能夠每天跟上十個以上事件的人幾乎是媒體工作者才能做得到的, 一般人無論是透過電視或是社群, 能夠接受到的事件跟本是被框住受限的, 所以要求民眾大家具有全面觀, 國際觀是不太可能的, 因為這超過一般人看新聞的習慣, 甚至連這種管道與工具都沒有.

而在上一篇 [新文易數] 用自己角度來看新聞, 新聞事件簿的背後意義, 提出了一個可能性, 若是能夠透過眾人智慧的標籤, 的確可以算出每天這 20~50 個事件, 若大家在閱讀新聞時, 可以知道有那些事件沒有讀到 (閱讀標記), 或是這事件有那些新的新文, 也就是說讓大家選擇自己有興趣的事件做深入閱讀, 且又能廣泛的看完重要的新聞不是很好嗎?

事實上左邊的圖是從 Starship Trooper (1997) 年截下來的, 很多新聞工作者也是很想把這選材交到使用者身上, 只是在資料與操作界面上真的要做到也沒那麼簡單, 尤其是要在電視上用滑鼠這當然是不可行的, 所以有時不只是資料而已, 介面的優化也是相當重要的議題.

而最前面的圖是種若是新聞可以讓大家來選擇的話會如何, 當你有興趣就可以進去看, 看過就不會再播出, 就能夠很輕易的完整看完所有的事件, 不會受限於特定的事件, 甚至若是可以像下面的介面新增你有興趣的議題的新聞, 那不是更好嗎?


但這些目前都只是種未來的可行性, 若是能夠做到的話, 或許大家在看新聞的視野就能夠更廣, 而不是受限於被新聞媒體, 被社群媒體 "框住" 的那幾個事件, 若是能夠做出一個夠便利, 更發自於人性 (墮性) 的介面與工具, 讓值得關新的議題不會被幾個炒作的議題所淹沒, 說不定想靠媒體操控人民的困難度就會提高, 這社會說不定會更好一些, 只是, 這些都是說不定... 但也是我們要努力的目標, 不是嗎?

2015年4月22日 星期三

[新文易數] 用自己角度來看新聞, 新聞事件簿的背後意義

網址: http://tag.analysis.tw/events/

[QOTD] 透過重組新聞讓選擇事件與議題交在讀者手上, 而不再是被記者或編輯決定, 或是被 "媒體財團老版" 指引.

從標籤的計數, 分數到計算被注目的爆發度, 進一步的透過等價標籤組成事件, 最後從時間的前後關係組成事件簿, 這路程走過來是相當有趣.

所謂的事件就是透過一群有關聯的標籤所組成, 目前每個時間點能夠切出有意義的事件約是在 30~40 件左右, 這可以在 "事件表" 看到.

但每個時間點 30~40 件事件跟下一小時(時刻) 的 30~40 件其事件與標籤的組合都是有或多或少的差異, 若是用標籤關聯來計算, 每次計算永遠是不一樣的, 也就是說每天若算 96 次, 就會產生 3000 個事件, 這是沒有意義的, 所以要把這每次所產生的組合, 依時間性再做一次組合才行.

在計算之前, 我當時猜測每天會有 20~30 個事件發生, 而其中有 10~15 件會持續到第二天, 也就是一半會結束, 用這數字來看的話, 會面聯到幾種參數可以調整:

1. 時間的連續性: 要多久當這事件關聯性消失才是下一個事件?
2. 關聯性的高低: 要多少比例的重合度才是相同的事件?
3. 標籤的集合: 要多少個標籤當作母體來計算重合度?
4. 事件要怎樣情型下才會組合與分裂?

最後自己想做了 N 年, 經過 N 個月的思索, 以及 N 個星期的規劃, 以及花了 N 小時做出第一個版本, 然後再花 N 天, 大改了 N 次, 以及小改了 N! 次, 總算是做出有意義的東西了.... (註: N 介於 5~10).

這樣就可以把每天有 10000(兩萬) 篇 的新聞組合出 30~40 個事件, 而我們在閱讀新聞的時候, 就可以選擇想要多看那不同的, 或者是多深入看些有意義的新聞, 以及跳過沒意義的新聞.

為甚麼會這樣說呢, 事實上台灣的新聞若是一天會報導 100 則新聞, 其中花了 50% 的版面與資源在報導約 2 則記者認為的重點新聞, 然後 25% 報導約 10 則的其他新聞, 最後的 25% 留給剩下的 88 則, 若是那 2 則, 或是  10 則是有意義的新聞就好了, 但通常這些都是假公義的新聞居多, 或者多是只須要很少的資源, 就可以聚集到很多目光的新聞, 甚麼深度與廣度就不是那麼重要了.

像現在英國藍今天就有超過 200 則以上的新聞,  估計一整天應該有 300~500 篇新聞講英國藍, 這數量就占了所有新聞的 5%, 而相同的大巨蛋也是有相同的數量, 也就是說有 1/10 的新聞在講兩件事, 這數字看起來不可怕, 但事實上有 9 成的新聞是搏不到焦點的, 也就是說在社群上一天能夠有 10 次以上的讚享評還不到 1000 則, 雖然說這兩則新聞也不是都能夠有 10 次以上的讚享評, 但有 500 則來爭取這 1000 則的名額就知道新聞的炒作是多嚴重了.

但我們知道記者不是故意炒作, 而是人本來就是健忘, 也容易被焦點給吸引, 記者也是人, 加上編輯也是人外, 更有其他因素的考量, 即使不是須要操作, 也會把目前的新聞變成不到幾件搏版面的事, 記得我在上個月的臉書寫到:

在 30 年前三台的時代, 因為政治氛圍的關係, 所以大部份的資訊都被屏壁, 能夠被三台說出來的觀點, 可能是 30% 還不到, 但相對的大家資訊來源也很貧乏, 一個人一天可以吸收 300 則新聞也佔這些新聞的六成了, 也就是一個人可能只接觸到約兩成的資訊與觀點, 八成的資訊都不知道.... 很慘....
但你以為 30 年後的今天, 大家能夠透過資訊看到更多觀點嗎? 事實上則不然....

由於現在有很多太多的媒體與太多的資訊, 雖然可以說已經有 90% 觀點的資訊都被寫出來與傳播, 只是這散佈在 100 倍的資訊, 也就是 5萬則訊息, 而人雖然吸收資訊的能力也成長了 10 倍以上, 就這數字來看反而人能夠看到的觀點只剩下 5% 而已, ....

你以為是這樣嗎? 事實上是更糟, 因為社交泡沫的關係, 你只看得到跟你思維較為接近的事情, 因此這效用讓本來就不平均的資訊傳播得更狹隘, 你只剩下能接觸到所有觀點的 60%, 最後你只看得到社會 3% 的觀點...

這些指的還是一般人, 若是你不幸的是在慈濟, 法輪功, 清海無上師這些團體, 這些團體所創造的資訊量, 早就超過一個人每天能夠吸收的好幾倍, 所以你接收到的資訊很可能只剩下這 0.5%, 甚至更低比例的人與團體所創造的訊息, 且因為你接觸的同儕都是這樣想, 所以你會認為這 0.5% 是這社會的 100%....

所以重組新聞是有必要的, 透過重組新聞讓選擇事件與議題交在讀者手上, 而不再是被記者或編輯決定, 或是被 "媒體財團老版" 指引, 只是這想法很簡單, 但做起來沒那麼簡單, 甚至我在去年以前認為這是難以達成的想法.


在這邊稍微說一下閱讀方法:

1. 初次時間: 這議題事件第一次記錄的時間
2. 最近時間: 目前記錄到最後一次的時間
3. 總時數: 上面兩個時間的差距
4. 最重要的標籤: 在這個時間的主要標籤, 其中爆發力分數最高的標籤與分數
5. 最後標籤: 當結束時產生關連的標籤
6. 小時 (過濾): 總時數超過一定時間
7. 分 (過濾): 依最重要標籤的爆發分數過濾
8. 代表新聞: 會選出一則代表這事件的新聞, 也就是標籤密度最高的新聞

其中最後標籤以後應該會用 "主要標籤" 來取代, 因為發現用最後標籤來算代表新聞似乎不夠準確, 但這就放進 Todo 了.

當做完這系統, 就可以做為新聞的導引了, 也就是真的我們接下來可以做出自己新聞閱讀與觀看的 "可控制與學習的搖控器", 所以說這只是個副產品, 或是必要關鍵一點也不為過, 只是做出這個副產品也太辛苦了點.

P.S. 有了事件簿, 我們可以套用在標籤上, 變成標籤的事件簿, 例如看 "賴清德標籤事件簿", 可以從時間軸來看有關賴清德的議題及重要新聞, 但相對的在對應標籤與重要新聞還是有再調整的空間.

LinkWithin

Related Posts Plugin for WordPress, Blogger...

熱門文章