美國資料科學領域學校申請與工作經驗分享  


美國Amazon劉明語 先生  |   2023-11-10

       我決定往資料科學 (Data Science) 領域發展主要還是機緣,就讀台科大工業管理/工程學系期間,因緣際會選修一門資料庫 (SQL) 課程,並參與資料挖掘 (Data Mining) 相關的專案。執行專案的內容及經驗,引發我的興趣並想往這方面發展,便決定申請美國碩士班,專攻資料科學的相關領域。

        申請美國碩士班,除要準備一般耳熟能詳資料外,申請此領域通常必備微積分、統計、線性代數及程式語言等方面知識,例如:康乃爾大學要我前往就讀前,提供在台灣有修習高等微積分課程證明。另外具有實習、工作、專題相關經驗或個人相關比賽如Kaggle及Github上作品集都有加分的作用。而具知名度學校,通常會要求英文寫和說的兩項基本門檻分數才能申請。如未具有相關知識背景而很幸運錄取,有很大的機率在課堂上會感到吃力或難以跟上進度。在此特別感謝郭人介、楊朝龍及林希偉以上三位老師對我申請學校時推薦信的鼎力幫忙,讓我獲得哥倫比亞、西北、康乃爾及伊利諾香檳分校等四所大學錄取信。思慮再三,最後選擇西北大學 (Northwestern University) 的Master of Science in Analytics  (目前更名為Master of Science in Machine Learning and Data Science)。主要原因是系所安排必須做兩個業界合作專案加上三個月的暑期實習,考慮個人沒工作經驗及未來想留在美國求職較有幫助。資料分析或資料科學是一個廣泛使用但有時被濫用的術語,每所學校對於申請者所看重的方面和教學內容都可能截然不同,對有興趣想往此領域發展學弟妹,我建議聯繫近年的校友或台灣學生可獲得第一手信息。

西北求學期間

        系上課程規劃非常全面、亦有實習、及與企業產學合作的專題。課程包含資料視覺、編程、機器學習、大數據和管理課程等。因我選擇的碩士班屬於工業工程領域,因此還包括線性規劃相關課程。個人認為,這種全面性課程規劃是一個雙面刃,優勢是培養了解資料科學技術的管理專業人士,缺點則是對於那些希望深入學習機器學習技術的人來說,課程可能顯得不夠深入。個人當時感覺西北課程設計與台灣最大的不同是美國課程在善用工具方面確實做的比較完善。以線性規劃作為例子,在台灣考試內容多半是靠手算在小問題上求得最佳解,但美國課程會強調設計問題目標函數後,使用軟體輔助求解。

西北聖誕節交換禮物

求職過程

        跟申請學校其實並沒有太大的差異,相關領域的經驗、個人作品集都是企業評量的地方。科技業公司面試通常分為三個階段:第一關人資審核資歷,第二關一小時視訊技術面試,第三關則是一整天技術面試 (通常5輪)。技術面試包含機器學習基礎知識,大公司常常會要求萬惡的演算法問題 (Leetcode),呈現過去參加過的專案及主管人格評估等。

        雖然近兩年(2022, 2023) 由於景氣不是特別理想,新聞普遍會傳出裁員等負面消息,但資料科學相關的工作在美國並沒有呈現飽和狀態。整體而言,科技產業還是對這個專業的需求大宗,但各個領域都仍非常需要相關優秀及資深的人才。由於我並沒有在台灣從事相關的正職工作,無法提供美國與台灣兩邊工作上的具體比較。

西北碩士畢業班

職場方面

       畢業後我一直在電子商務領域中的廣告領域,從事與機器學習相關的工作。eBay近四年七個月職業生涯,主要在做廣告商方面的關鍵字(Keyword)推薦、競價(Bidding)和全自動廣告 (Automated Campaign)等項目,在這個過程應用到工業工程作業研究的約束優化 (Constraint Optimization),是應用如何讓廣告者在一定預算範圍內最大化所獲得的價值。之後轉職到 Amazon ,近一年專注於深度學習大模型在廣告及搜索引擎上的應用,例如召回和排序 (Retrieval, Ranking)。

eBay 廣告小組

日常工作:主要包含數據收集分析、實現模型及訓練、實驗結果分享、找出可改善地方及與工程師將模型嵌入產品當中,這是一個不斷重複循環的過程。目前工作上使用相對成熟的開源技術包含:Python、Scala、Spark、Airflow、AWS EMR、AWS S3、AWS Batch、Kubernetes、ONNX、XGBoost、FastText、Sklearn、OrTools、PyTorch、Huggingface Transformer、Deepspeed等。

eBay 廣告小組

梁啟超先生曾說過:「學問之功,貴乎循序漸進,經久不輟,故一日不必要多時。」,有想朝資料科學發展的學弟妹,除了不斷學習外,分享資源及所學也是成長的動力和方法。

以上內容純屬個人經驗分享,不代表任何官方立場。