資料科學入門

資料科學入門

原課程名為"當統計學遇到程式"。





案例1:最近天氣好熱,今年是不是會比往年還熱?我可以用歷史溫度來預測今年的氣溫嗎?還是說可以用賣冰的量、歷史的用電量、甚至利用北/南極冰帽的面積?但,我如何建立模型?簡單線性回歸?還是現在最夯的機器學習?那,模型的預測效果如何?能解釋觀察到的現象嗎?甚至,我能相信模型預測結果嗎?
案例2:生育率這麼低,到底是什麼樣的因素造成的?是因為家計所得影響生育的意願嗎?是不是教育程度越高越不願意生呢?
案例3:工時越長,國家的經濟成長就越高嗎? link
案例4:唸書的時間越多,考試就考得越高分嗎?有研究指出台灣的課堂時數這麼高,但是成績不是成正比,到底是怎麼樣得到這個結論的呢?

我們有很多疑問需要被解答,但是我們缺乏嚴謹的統計訓練和程式基礎。本課程將結合統計資訊的跨領域課程,嘗試讓學員們可以開始自問自答,而且也能夠這資料爆炸的時代裡辨識出有意義的資訊,從而踏入資料科學的新世界。讓數據與程式幫你說故事!

# 預備知識
-- 四則運算、代數運算
-- 日常生活經驗與公民道德

# 學習目標
(1) 統計學 (70%)
-- 了解統計工具與計算
-- 正確解釋統計結果
-- 合理預測未來的趨勢
-- 排除統計謬誤
(2) 程式能力 (30%)
-- 掌握資料處理流程
-- 學習創造自己的工具

課程大綱

0. Python程式基礎
1. 資料擷取與視覺化
2. 機率論導論與常見的機率模型
3. 統計檢定
4. 點估計與區間估計
5. 大數法則與中央極限定理
6. 回歸模型
7. 時間序列分析
8. 貝氏機率
9. 機器學習簡介
10. 統計實務

註0:更新於2021/6/15。
註1:課程內容仍會按照講師的偏好與學員的需要而更動。

適合對象

1. 欲學習使用統計方法量化研究的大專院校生、研究生或者是數據分析相關之研究人員。
2. 國高中生可,已學習過基礎統計學者佳 (108課綱的高二的機率與統計I與高三的機率與統計II)。
3. 準備轉進資料科學領域之初學者。

開發環境

主要開發環境為Python 3.6 on Google Colab;MATLAB、R的使用者或者Excel的使用者亦可,課程會提供範例程式碼供學員使用。

近期班次

  • 第344期

    開課日期:2021.06.28 ~

    確定開課

    學費:新生新台幣4500元整

    注意事項

    • 上課教材、影片:開課當天會發送註冊信至信箱,註冊完畢後即可開始上課。
    • 結業狀況:請上官網”結業名單”查閱是否合格及證書製作進度。
    • 轉班或退費期限:開課日後三週內。
    • 繳交作業期限:結束日後一週內,通過課程標準才會製作證書。
    • 課程影片下架日:結束日後六個月。

  • 講師介紹

    • 國立臺灣大學資訊工程學 博士候選人

    • 交通大學電信工程研究所 碩士

    • 中央大學電機工程學系 學士

    (一) 服務經驗

    • 國立臺灣大學 腦與心智科學研究所 兼任研究助理 (2014.8--present)
    • 中國信託商業銀行 全球金融商品交易處 期貨自營部 實習研究員 (2014.1--present)
    • 國立臺灣大學 資訊工程學系 資訊系統訓練班 講師 (2014.1--present)
    • 國立臺灣大學 資訊工程學系 課程助教:計算理論、離散數學、財務演算法 (2012.9--present)

    (二) 研究興趣

    • Financial computing
    • Analysis and design of algorithms
    • Quantitative finance, econometrics, and algorithmic trading
    • Statistics and machine learning
    • Computing theory and programming language design

    (三) 程式語言

    • MATLAB, Java, C, C++, Python, C#

    (四) 教學特色

    • 中文授課,課程教材以英文為主。適合規劃出國求學或對科學/技術理論有興趣的學員。
    • 授課時數:於本訓練班教學時數累計至2020年3月10日為4950小時。