文 / 杜易寰 資料收集 / 林辰駿 繪圖 / Re-Lab 從 12 月開始,QSearch 在撈資料時使用了新的方法。 過去的媒體洞察報告,QSearch 團隊會特別將當時能夠抓取到的所有媒體文章在全部爬過一遍,所以得到的資料都是「抓取資料當時所能看到的數據」,例如我在 3/28 日抓取二月資料的話,那呈現出來的就會是 3/28 當天所能看到的二月份文章,若在此前已將文章刪除,就會撈取不到。 而新的做法,則是不再重新抓取資料,而直接取用我們資料庫中原先存下來的資料,以節省時間。資料庫中的 資料是「文章發出後48小時內的所有互動資料」。這個方法的缺點則是若在 48 小時候才新增的互動就會計算不到,但只要文章發出過,就會有紀錄,即使後來刪除,資料也仍然保留在我們的資料庫。 「資料撈取範圍的改變」是其後媒體洞察報告與此前報告的最主要差別,接下來就交給大家自行閱讀了。
媒體研究
-
-
文 / 杜易寰 資料收集 / 林辰駿 繪圖 / Re-Lab
-
文 / 杜易寰、劉書彧 資料收集 / 林辰駿 互動圖表 / 楊晴 在上次的「2016 年 10 月份媒體洞察報告」後,我們有預告到,之後將會改變鐵粉率的計算方式,在經過一段時間後,我們現在終於可以公佈數據了。 過去的鐵粉定義是:互動次數超過粉絲頁發文篇數2%以上者,佔所有不重複互動者的比例。 而新的鐵粉定義則是:在粉絲頁過去有發文的 30 天中,與粉絲頁文章有互動的天數 10 天以上的使用者,佔所有不重複互動者的比例(註一、註二)。 簡單的說,我們不再看使用者到底互動了幾次,而是看使用者互動了多少天。 改變鐵粉計算的原因有兩個。第一個原因很簡單,我們認為相比互動次數而言,長期且持續的互動行為,更像是鐵粉會有的樣子。 廢話不多說,我們就先以「11 月的媒體鐵粉率」作為示範。(題外話,在本月底之前,一定會將媒體洞察報告更新到 2017 年 1 月,並且之後每月更新,不然的話 Data Team 就一起剁 …
-
文 / 劉書彧 這次天下雜誌和 QSearch 的共同研究專題:「立委臉書洩漏的祕密:誰跟蔡英文最親近?」一文中,所採用的研究方法主要是參照,美國學者Robert Bond與Solomon Messing前年發表於美國政治科學期刊上的論文。Bond & Messing蒐集了 1,223 個經過臉書官方認證的美國政治人物粉絲頁。 透過臉書內部的資料庫,作者將追蹤(follow)這些粉絲頁的粉絲全部抓出來,並僅保留 18 歲以上(具有投票權)以及至少追蹤兩個以上政治人物粉絲頁的樣本(共 620 萬人)。最後,根據觀察各個政治人物粉絲頁間彼此重疊的粉絲數,作者使用了奇異質分解法(singular value decomposition),保留最足以解釋這些政治人物兼彼此重疊度的變因,用此代表各政治人物在粉絲心目中的相對「位置」。而最終的研究成果顯示,用此一方法得到的各政治人物相對位置,正好反映了選民心目中各民主黨和共和黨政治人物的「左右」立場。
-
文 / 杜易寰 、 資料收集 / 斷水流大師兄 繪圖 / Re-Lab 這次發文距離上次的媒體洞察報告出刊又過了一個多月,不過這次不單純是因為 Data Team 沒時間做,而是因為未來的媒體洞察報告將會有些變動,而特別研究了好一陣子。 眼尖的讀者會注意到,這次的圖表中,我們已經移除了「鐵粉率」這個指標。鐵粉率因為會受到「發文篇數」、「不重複互動人數」兩項指標影響,且 Facebook 的文章推播機制仍然是個黑盒子,因此鐵粉率只能在不同的時間點,針對同一家媒體比較才有意義,而不能在同一時間跨媒體比較,但這樣的比較機制限制過多。 我們將會在近期內創造出新的「鐵粉率」定義,文章預計在月底刊出(希望這次不會又打臉自己),屆時還請各位讀者不吝指教。