閱讀進度0%

【PM筆記】沒有這個計畫,我大概不會想和 Google spreadsheet 有那麼多牽絆

【PM筆記】沒有這個計畫,我大概不會想和 Google spreadsheet 有那麼多牽絆

閱讀時間 7 分鐘

2020 總統候選人事實查核計畫為 READr 所發起的候選人言談檢視平台。希望可以查核總統候選人的所有(理想上啦)公開談話,讓選民在投票前可以有較客觀的資料評斷候選人的言行。
候選人資料的蒐集則是透過群眾協作(影音轉成逐字稿的工人智慧)達成。所以除了讀者以外,還得串起協作的鄉民、查核的媒體。而我們使用 Google spreadsheet 串起整個流程,這篇筆記是獻給沒有時間自己架資料庫、希望開放使用者進行協作網頁內容的人們,
undefined
網頁上主要提供使用者兩大功能:
  1. 協作:謄打逐字稿、驗證逐字稿
  1. 觀看資料庫:謄打後媒體驗證的資料
本篇文章主要會介紹第一個功能「協作」我們是如何透過第三方服務(youtube、google sheet、google form)來進行架設我們的協作區與資料儲存地。

實際製作細節說明

網頁上公開的為四步驟:影片轉為逐字稿 → 逐字稿驗證 → 逐字稿分段標籤 → 媒體查證,可以再細分為 7 個需求,實際上則有15 個步驟左右,可參考下表:
在此我們使用 7 步驟做簡單的介紹與說明。以下為本人不專業不斷試錯產生的結果,相信一定有更好的作法,如果有錯誤之處,還請大家不吝指教!

步驟一:將影片切成 20 秒為一單位

  • 需求說明:因為我們希望能降低計劃參與的門檻,讓盡可能更多使用者參與此計畫。過長的投入時間,可能會降低使用者的參與意願。為什麼是 20秒?
  • 使用工具:youtube 內建指定影片開始與結束的參數
  • 製作方式:有在使用 youtube 的人,應該都知道 youtube 在分享功能上,可以選擇從哪裡開始播放。作法為在網址後面加上 &start=開始播放的秒數,而上網一查發現,youtube 其實也有指定結束秒數的參數,很直覺的就是再加上 &end=結束播放的秒數,也就是說,我們只要將 youtube網址後面加上 &start=開始播放的秒數 &end=結束播放的秒數,就完成啦
undefined

步驟二:自動產生含有影片資訊的表單

  • 需求說明:需要一個使用者熟悉且方便製作的協作頁,最後我們決定採用 google form。我們希望 google form 表格的資料,可以一個影片片段生成一個,且自動產生。
  • 使用工具:google form 的 pre-fill 功能 + google sheet 算式 &
  • 製作方式:google form 的左上角設定鈕有說明 pre-fill 的功能,點入後會看到一個 pre-fill 表單,接著填入預想要抓的資料,按確認,就會產生一個幫你填寫好的問卷了。接著,再到 google sheet 調整參數
undefined
undefined

步驟三:當有人完成逐字稿謄打,自動產生逐字稿驗證表單

  • 需求說明:需要判斷逐字稿已經有人填打了,去撈有表單回應資料(逐字稿)的驗證表單
  • 使用工具:google sheet 算式 vlookup 以及 prefill
  • 製作方式:使用 vlookup 這個公式,透過 key 值到指定範圍去搜尋是否有符合 key 值如果有就回覆,特定欄位。我們使用 vlookup 去使用者回應的表單去找出相同 key 的逐字稿,並再次使用 prefill 將逐字稿的資料填入設定好的逐字稿驗證表單內

步驟四:當逐字稿資料驗證正確,合併成完整的影片逐字稿,再重新根據語意分段

  • 需求說明:需建立驗證正確的條件,再根據這個條件去做合併
  • 使用工具:google sheet 算式 if、filter、join 
  • 製作方式:首先確認驗證條件是什麼,使用 if 根據條件,填入不同的「驗證狀態」,再用 filter 篩選出特定的「驗證狀態」值,最後使用 join,將所有 filter 出來的值合併
undefined

步驟五:將完整影片進行分段

  • 需求說明:影片完整的逐字稿,將依據「。」為切段,方便志工標示上類別以及驗證狀態
  • 使用工具:google sheet 算式 split
  • 製作方式:合併後的逐字稿,會再透過 split 以「。」為切成數個段落

步驟六:提供志工將分段後的逐字稿進行標籤的協作區

  • 需求說明:建立選項,以供志工可以進行選擇,填入固定值
  • 使用工具:google sheet data validation 
  • 製作方式:在 data validation 建立下拉選單,建立選項「含有可查證內容」、「不屬於查證範圍」、「一般敘述性文字或個人意見」
undefined
undefined

步驟七:篩選出「含有可查核內容」的內容,提供給媒體進行查核

  • 需求說明:篩選出「含有可查證內容」的段落,提供給各家查證媒體進行查證
  • 使用工具:google sheet 算式 filter 
  • 製作方式:使用 filter 篩選「含有可查證內容」的段落,匯入到媒體專用工作表

算式清單

以下列出本次的所有算式供參考:
實際上 google sheet 上資料的公式會依據個別的需求不同,而有不同的組合應用。如果有興趣的話,也可點入 google 官方 google sheet 算式看。

寫在最後的心得

起因是初步的協作可以使用 google 表單直接製作完成,便提議可以自己來做,想要減少工程師的工作量(他們可以去做其他事情哈哈)。殊不知,這完全是個不自量力的提議。
實際做了才知道,10 秒工程師可以完成的事情,我可能會需要 1 小時去思考怎麼做。上線後會隨時擔心是否有 bug,如果有 bug 的話,我找得到嗎?萬一資料漏記怎麼辦?當平常可以請工程師協助確認的事項,變成自己實作時,壓力山之大啊。
不過不得不說,做完真的是蠻有成就感的,現在在工作上也變得越來越懶,什麼都想用算式、script 來解決。 很謝謝在這過程中,給予我大力鼓勵與協助的工程師學勇與凱文、在旁邊一直叫我長工程師腦的又如、一起與資料奮鬥看我崩潰的昭妟、在我寫不出算式給我鼓勵的子維,還有促成本次學習的幕後推手 HC,沒有你們,我此生大概不會想和 google sheet 有那麼多牽絆。
如果還有下一篇的話,會與大家分享懶人的好幫手 app script,以及頁面上統計的簡單計算方式。 
贊助 READr 一起媒體實驗改革
相關報導
最新報導