資料科學初步 - R與Python

資料科學初步 - R與Python

Python和R皆為資料科學家流行的程式語言。雖然R強大的功能由統計學家的努
力下所驅動,但Python卻因其易於理解的語法、模型生態系完整與機器學習領
域的盛行而受到密切關注。
身為資料科學家,您的工作是選擇適合的開發工具。但兩者皆有各自的優劣勢
:R 有著原生統計特性的優勢,結合學界的力量擁有較新穎的模型計算能力;
但 Python的通用性,結合適當套件提供強大而完整的資料分析生態系統,尤其
更適用於產品端的設計與結合。
從R與Python出發,本課程除了介紹資料科學家常用的程式語法外,更強調兩
者在語法與觀念上的差別,使同學在課程結束後建立並厚實資料科學基礎。

課程大綱

安裝R與Python環境
Python基礎
Numpy基礎
Pandas
Missing Value
R基礎
Matrix、Array與ndarray
tidyverse簡介
DataFrame vs. Tibble
資料轉換技巧
R與Python的溝通

適合對象

無程式設計經驗可。尤其適合欲一窺資料科學領域的初學者。
如對R或Python語言有基礎者,可藉由本課程迅速掌握第二個語言觀念與技巧

開發環境

R 4.1.2
Python 3.9
RStudio
Anaconda

近期班次

講師介紹

國立政治大學金融學系博士

(一) 經歷

  • 東吳大學 財務工程與精算數學系 兼任助理教授
  • 證基會 兼任講師
  • 實踐大學 風險管理與保險系 兼任助理教授
  • 台北大學 統計學系 兼任助理教授
  • 德明財經大學 保險金融管理系 兼任助理教授

(二) 授課時數:

2014年至本班教學,累計授課時數至2022年8月18日為1470小時