Google Data Analytics 課程心得:數據分析入門的最佳途徑
我的證書
正式開始文章之前,先放上我的Google Data Analytics課程證書~
資料分析是什麼
資料分析近年來逐漸成為熱門的學問,資料分析師(Data Analyst)也是越來越多人會去追求的職業。根據網站salaryexployer.com的資料顯示,資料分析師在美國的平均年薪約為87,200美元,依照經歷與年資,年薪範圍為41,800(最低)~137,000(最高)美元。2022年,美國人年薪的中位數為$54,132,不難看出資料分析師熱門的原因。
不同於傳統職業容易受限於產業類別的特性,基本上,每家大企業都需要一定數量的資料分析師。資料分析師的工作簡略而言是從收集到的數據中提煉出對公司有益的發現與趨勢,進而為公司提出建議與方針。資料分析師可說是一家公司的國師,因此企業願意付高薪聘請也是情有可原。
課程安排
Google Data Analytics課程分為8大課程,分別是
- Foundations
- Ask
- Prepare
- Process
- Analyze
- Share
- R Programming
- Capstone Case Study
每個課程(course)皆有3~6個模組(module),每個模組皆有多個區塊(section),Google的課程安排是每周完成一個section,但實際操作下來,大概半個小時~一個小時便可以完成一個section。完成每個區塊後,便完成該模組;完成所有模組後,就可以完成該課程;而完成這八個課程後,就可以順利拿到結業證書了~
每個區塊的最後,都會有一個practice quiz,用來測驗你對該區塊知識的理解,全選擇題,會有單選和複選。而且因為是practice quiz,所以你想做多少次都可以。而每個模組的最後都會有一個Weekly Graded Quiz,這個測驗的分數會計算到每個課程的最終成績,不同於practice quiz, graded quiz會有時間限制,也會有填答限制(24小時內只能填寫3次),且每次填寫的題目與選項會更動。
Course 1: Foundations: Data, Data, Everywhere
在第一個課程中,講者會先介紹這個系列課程的目的、規劃以及最重要的,資料分析的流程。這個流程也是之後課程系列的名稱,
Ask -> Prepare -> Process -> Analyze -> Share -> Act
一個完整的資料分析,需要先從定義問題開始,你的資料分析結果,最多只會跟你所定義的問題一樣好,所以定義問題是至關重要的。
這堂課程也會介紹一些資料分析相關的專有名詞,像是Data Driven Decision Making等等,這些專有名詞的定義建議可以寫下來,後面的Practice Quiz常常考專有名詞解釋。
第一堂課也有提到資料工程師的工作內容,也會請Google內部的資料工程師來分享他們的心路歷程,可以讓初入資料分析的初學者們衡量自己是否對該課程與領域有興趣。
第一堂課程因為是入門概論,內容相對簡單,也可以對數據分析有基本認識。但建議不要因為是基礎中的基礎,打穩這些基礎以及資料分析SOP對於後面的學習和case study會有許多幫助。
Course 2: Ask Questions to Make Data-Driven Decisions
這門課開始,就進入到正式的資料分析SOP過程了。
第二堂課會先介紹一些資料分析師常用的工具,包含:Spreadsheet、Query Language與 Data Visualization工具。初步介紹上述3種工具的用途與範例。也會教你如何問出有效的問題,像是SMART技巧就很實用,也會告訴你問問題要問開放式問題、不能有偏頗或試圖引導特定答案等。
這堂課程使用到的試算表都是Google Sheet,因此建議如果沒有Google帳號的話,可以申請一個來使用。
Course 3: Prepare Data for Exploration
邁入第三堂課,這堂課中將會教你如何收集資料,也會介紹資料型態、資料格式等。這堂課也特別強調數據倫理(Ethics)、及數據的可信度評估。
第三堂課,終於可以用到SQL語法了。這堂課使用的工具是Google自身的BigQuery,會練習基本的SQL語法,但由於免費版帳戶的限制,BigQuery上的資料不允許新增、修改、刪除等,也就是說,只能使用基本的SELECT FROM WHERE語法。
Course 4: Process Data from Dirty to Clean
課程進行到一半了!在第四堂課中,會教你如何預處理你所收集到的資料。
在上一階段收集的資料並不能保證一定是乾淨的。其中可能會有一些常見的錯誤需要排除,常見的錯誤有
- 不該出現的null值
- Outlier
- 重複數據
- 打字錯誤
這些都是衡量Data Integrity 數據完整性的一部分,要排除這些,就必須用到Data Cleaning 資料清理的技術,也會教你 Data Validation。這堂課中,會介紹如何用SQL與Spreadsheet清理你的資料,當然Spreadsheet只適用清理小型資料庫,一旦資料庫內容大起來,光瀏覽資料就足以讓你的電腦當機,這時候還是乖乖用SQL好了。
對於初入這領域的初學者而言,這堂課可能會出現許多沒看過的Spreadsheet和SQL語法,建議每個語法都可以自行嘗試操作看看,可以增加印象。
Course 5: Analyze Data to Answer Questions
進到第五堂課,重頭戲終於來了!
你會開始學習分析資料的技巧與流程,也會學到如何用Spreadsheet與SQL讓你的數據便於分析(像是排序、統整格式、篩選等語法),也會教你SQL的Join語法以及Spreadsheet的Vlookup函數。分析部分,會提到Pivot Table的應用與範例。
可能有些學生會覺得這堂課的深度不夠,不用擔心,在第七堂課會教你R語言,將前面提到的過程再全部用R語言走過一次。
Course 6: Share Data Through the Art of Visualization
分析完數據,我們找到了有助於解決問題的規律和發現,我們要想辦法讓這些發現變得讓人容易理解,這時就會用到數據視覺化(data visualization)技巧。這堂課會用到Tableau,一個數據視覺化的軟體,也會教你如何用數據說故事、如何完成有效的簡報以及如何準備及回答報告後的 Q&A 環節。
不得不說,這堂課提出的一些報告小技巧十分實用,無論什麼主題的報告,都可以應用這些技巧,讓你的報告軟實力更上一層樓。
Course 7: Data Analysis with R Programming
這堂課算是我覺得裡面8堂課中,最專業的一堂。資訊量有點多,課程會教你一個程式語言 - R,並且從資料預處理、資料清理開始,一直到資料視覺化。簡言之,你會學到一大多語法,對於沒有學過程式語言的同學可能會有點之力,但就像影片中講師提到的,慢慢來,這些影片都可以重複觀看,也有Discussion Prompt論壇可以讓同學提問,也可以上網找R語言的CheatSheet。
Course 8: Google Data Analytics Capstone: Complete a Case Study
學習完資料分析的基礎知識及流程後,就該你上場啦!
這堂課中會給你三個選擇:從2個課程提供的主題中擇一研究或自行尋找主題研究。我選擇的是使用課程提供的,關於較踏車租借公司的主題研究。
其實,這個case study並不是強制一定要做的,如果你不想做,也可以選擇跳過,直接完成課程拿到認證。但既然都已經花時間上課了,最後給自己一個驗證所學的機會不是很棒嗎?完成自己的case study後,課程會教你如何製作履歷(portfolio),提供一些tips,以及如何把你的case study放進你的履歷。
課程的最後,也會提供一些面試的技巧,以及模擬面試的影片。和報告技巧一樣,我覺得這個部分超級有幫助的!
對我來說,這門課是最花時間的一門。開始實際動手做後,才發現深入探討問題並找出解決方案並不是像上課般那麼容易。有時我會想得太複雜,難以找出下一步;又或者某一段程式碼因為缺少一個括號,變數寫錯一直無法通過。但不得不說,用心完成最終的case study真的可以獲得莫大的成就感。
課程優缺點
先來說說這堂課的優點好了~~
課程優點
- 課程安排充實且豐富:上課內容多是實作導向,不會過度著墨在理論知識。
- 課程易入門且資源多:課程的定位原本就是給初學者,所以所有知識都會假設上課學生沒學過,從0開始,而且又有論壇可以提出問題,過程中遇到的阻礙都可以很輕易地解決。
- 上課時間、地點彈性:Google將課程的影片分為多個小片段,每個片段月3~10分鐘不等,加上因為是線上課程,且沒有嚴格的deadline,而且Coursera也有app,隨時都能在電腦、手機、平板上觀看。
課程缺點
- 上課時間、地點彈性:這部分我覺得可以是優點、也可以是缺點。對於那些想認真上課的學生而言,這無疑是一大方便,但對於自制力不佳、容易虎頭蛇尾的學生,很有可能無法按時完成這些課程。
- 按月收費:Coursera每個月會收取39美元的訂閱費,也就是說,你上多久,平台就收你多久的費用。但這可能會讓部分學生上得很有壓力,或是為了盡快完成課程、拿到證書而草草了事,反而得不償失。
- 資源過多:上課資源豐富固然是好事,但由於上課學生很多,測驗的題目基本上整題複製到Google上查詢,十之八九可以找到正確解答。部分投機的學生可能會用這種方式來完成所有測驗可能會讓這張證照的公信力下降。
課程適合對象
如果你是以下其中一位,那這門Google Data Analytics課程就很適合你
- 想試試看資料分析的初學者
- 無意間得知Coursera平台,還沒上過課的人
- 想拿到一張證照,但又不知從何準備的人
- 希望可以多多學習的人
- 想要增加學習經驗與side project的人
- 自認為英文能力不錯,想體驗全英授課的人
但如果你是以下幾種人,就不太推薦你上這門課
- 平常已經很忙,沒有額外時間的人
- 對於資料分析已經很進階的人
- 經濟不允許每月多1200台幣開銷的人
- 只想拿證照,不想學習的人
總結
這堂課是我在Coursera平台上的第一堂課。老實說,我對這堂課的評價很高!雖然是入門課,但隨著課程進展,內容也會隨著加深,像是SQL語法,甚至教了一些學校沒教過的語法。這堂課中,你可以學到許多Spreadsheet函數、SQL語法、R語法及資料視覺化的工具。總言之,如果你對資料分析有興趣,想試試看的話,這系列的課程絕對是值得你一試的敲門磚。加油~~