資料科學入門 [線上課程]

資料科學入門 [線上課程]





案例1:最近天氣好熱,今年是不是會比往年還熱?我可以用歷史溫度來預測今年的氣溫嗎?還是說可以用賣冰的量、歷史的用電量、甚至利用北/南極冰帽的面積?但,我如何建立模型?簡單線性回歸?還是現在最夯的機器學習?那,模型的預測效果如何?能解釋觀察到的現象嗎?甚至,我能相信模型預測結果嗎?
案例2:生育率這麼低,到底是什麼樣的因素造成的?是因為家計所得影響生育的意願嗎?是不是教育程度越高越不願意生呢?
案例3:工時越長,國家的經濟成長就越高嗎? link
案例4:唸書的時間越多,考試就考得越高分嗎?有研究指出台灣的課堂時數這麼高,但是成績不是成正比,到底是怎麼樣得到這個結論的呢?

我們有很多疑問需要被解答,但是我們缺乏嚴謹的統計訓練和程式基礎。本課程將結合統計資訊的跨領域課程,嘗試讓學員們可以開始自問自答,而且也能夠這資料爆炸的時代裡辨識出有意義的資訊,從而踏入資料科學的新世界。讓數據與程式幫你說故事!

# 預備知識
-- 四則運算、代數運算
-- 日常生活經驗與公民道德

# 學習目標
(1) 統計學 (70%)
-- 了解統計工具與計算
-- 正確解釋統計結果
-- 合理預測未來的趨勢
-- 排除統計謬誤
(2) 程式能力 (30%)
-- 掌握資料處理流程
-- 學習創造自己的工具

註0:本課程可作為機器學習、資料科學或者金融資料分析的入門課程。機率與統計是分析資料的基礎,本課程嘗試讓學員能掌握這些應用學科的理論基石。
註1:本課程著重於將統計學的理論跟程式結合,程式碼的部分會提供給學員使用,透過解釋程式碼對應的數學,讓學員可以從程式去理解 (進而喜歡) 數學,而不再是只會下指令的碼農。

【本課程為線上課程,上課方式為「觀看課程錄影」。學員可以透過精心剪輯設計的課程影片不停地複習實作的步驟,確保可以順利完成所有的操作。也可以隨時在線上討論區或作業的討論獲得必要的協助或提示來一起學習怎麼解決實際的問題。結業標準為完成五次作業,每次作業都有影片解說,希望可以幫助學員在期末時可以順利取得證書。若對於課程有需要直接對談的方式解惑,可以與老師預約時間討論!】

※線上課程上課時間:可自行安排時間上課
影片上架進度,請參考備註欄位第(三)點線上課程常見QA連結網址

課程大綱

0. Python程式基礎
1. 資料擷取與視覺化
2. 機率論導論與常見的機率模型
3. 統計檢定
4. 點估計與區間估計
5. 大數法則與中央極限定理
6. 回歸模型
7. 時間序列分析
8. 貝氏機率
9. 機器學習簡介

-----

0. Crash course for Python
1. Data acquistion and visualization
2. Probability theory and common models
3. Hypothsis testing
4. Point estimation and interval estimation
5. Regression
6. Law of large numbers and central limit theorem
7. Time series analysis
8. Bayesian theorem
9. Introduction to Machine Learning

註0:更新於2021/8/26。
註1:課程內容仍會按照講師的偏好與學員的需要而更動。
註2:本課程非 Python 程式語言課,也允許學員使用自己擅長的程式語言,故僅用第一堂課的時間替對 Python 語言不熟的學員快速掌握課程中需要的語法。

適合對象

1. 欲學習使用統計方法量化研究的大專院校生、研究生或者是數據分析相關之研究人員。
2. 國高中生可,已學習過基礎統計學者佳 (108課綱的高二的機率與統計I與高三的機率與統計II)。
3. 準備轉進資料科學領域之初學者。

開發環境

主要開發環境為 Python 3.6 on Google Colab;MATLAB、R的使用者或者 Excel 的使用者亦可,課程會提供範例程式碼供學員使用。

近期班次

  • 第350期 確定開課

    課程類別:線上課程

    開課日期:2021.11.02 ~

    學費:新生新台幣4500元整

    備註:

    線上課程影片無字幕輔助

    因應疫情,期初、期末實體課程取消,採全線上上課。

    (一)轉班或退費期限:開課日後⅓時數內,詳情連結

    (二)結業狀況:查詢是否合格及證書製作進度,結業名單連結

    (三)線上課程上課時間:請參考官網最新消息「線上課程常見QA」,詳情連結

    (四)學員若有問題請不要打在報名時的備註欄裡,請直接寄EMAIL向我們聯繫

    我們才能及時回覆

    注意事項

    • 上課教材、影片:開課當天會發送註冊信至信箱,註冊完畢後即可開始上課。
    • 結業狀況:請上官網”結業名單”查閱是否合格及證書製作進度。
    • 轉班或退費期限:開課日後三週內。
    • 繳交作業期限:結束日後一週內,通過課程標準才會製作證書。
    • 課程影片下架日:結束日後六個月。

  • 講師介紹

    • 國立臺灣大學資訊工程學 博士候選人

    • 交通大學電信工程研究所 碩士

    • 中央大學電機工程學系 學士

    (一) 服務經驗

    • 國立臺灣大學 腦與心智科學研究所 兼任研究助理 (2014.8--present)
    • 中國信託商業銀行 全球金融商品交易處 期貨自營部 實習研究員 (2014.1--present)
    • 國立臺灣大學 資訊工程學系 資訊系統訓練班 講師 (2014.1--present)
    • 國立臺灣大學 資訊工程學系 課程助教:計算理論、離散數學、財務演算法 (2012.9--present)

    (二) 研究興趣

    • Financial computing
    • Analysis and design of algorithms
    • Quantitative finance, econometrics, and algorithmic trading
    • Statistics and machine learning
    • Computing theory and programming language design

    (三) 程式語言

    • MATLAB, Java, C, C++, Python, C#

    (四) 教學特色

    • 中文授課,課程教材以英文為主。適合規劃出國求學或對科學/技術理論有興趣的學員。
    • 授課時數:於本訓練班教學時數累計至2021年6月30日為6,880小時。