Python網路爬蟲實戰

Python網路爬蟲實戰

《經濟學人》宣稱「數據已經是所有成長與改變的驅動力。」
資料被認為是數位世代的「新石油」。與石油一樣的是,這樣的資源要去開採; 而不一樣的是,資料是成長快速並且用之不竭的資源,越發利用其價值也就越顯著。
此門課程節選自「Python程式設計與網站擷取」,提供有興趣學習「網路爬蟲」並有基礎Python程式能力者直接入門的管道。課程將會介紹目前Python實踐網站擷取的相關技術,教你用對的方法與工具對網路數據進行「開採」,從任何網站來源獲取並處理任意資料。學員不僅僅強化Python基本程式設計,更能夠自己建立起網路爬蟲來搜刮網頁內容。課程內容亦搭配大量實作範例與虛擬助教批改系統,來強化對於Python這一程式語言與網站擷取應用的理解。
如果你已對Python程式學習與資料挖掘具備滿腔熱情,那就開始這趟Python網路爬蟲實戰的旅程吧!

課程大綱

Python重點精華整理與網路爬蟲簡介
靜態頁面擷取實戰練習
表單與登入爬取練習
動態頁面擷取實戰練習
爬蟲排程與驗證碼實戰練習

適合對象

本課程適合稍具 Python 程式設計能力及對網路爬蟲有興趣者

開發環境

Python3
Jupyter Notebook

實體課程注意事項

本班為實體課程,常見QA詳情連結

校園防疫措施詳情連結

公務員全程參與課程學習後可於課程結束後申請登錄公務人員學習時數

課程影片觀看期限至課程結束後一週關閉

(一)退費期限:開課日後⅓時數內,詳情連結

(二)查詢結業狀況:結業名單連結

近期班次

講師介紹

(一)學歷

  • 國立臺灣大學資訊網路與多媒體研究所碩士
  • 國立交通大學資訊工程學系學士

(二) 經歷

  • 2016-數巨飛船有限公司 共同創辦人
  • 2015-2017國立臺灣大學創新與創業學程 網站管裡員
  • 2014-社群輿情分析與AI技術應用專案: 科技部、工研院、中央銀行、國防部等單位 資料探勘與視覺化專案顧問與研究員
  • 2016法務部調查局幹部訓練所-資料視覺化及輿情分析研習班 講師

(三) 教學經歷

  • 2016年至本班教學,累計授課時數至2024年3月1日為1,880小時,為資深講師。擔任:Python網路爬蟲與Scrapy課程、Python程式設計課程、D3.js互動式資料視覺化課程、Scratch程式設計一把抓課程、HTML5,CSS3,Bootstrap,jQuery網頁設計基礎班課程、CSS網頁設計與視覺特效專題班課程講師
  • 國立政治大學:106-108學年度資訊學院-程式設計概論 授課老師
  • 法務部調查局幹部訓練所:資料視覺化及輿情分析研習班 講師

(四) 得獎紀錄:
  1.美國計算機協會ACM 人機互動會議CHI’15 學生遊戲競賽-創新介面組 TranSection Top 3
  2.IndieCade’15 美國獨立遊戲設計大賽3D Jam - 7th
  3.100年台電全國多媒體廣告競賽 - 大專組第一名
  4.中華民國汽機車協會 第四、五屆交通安全動畫大賽 機車、汽車組 冠軍
  5.HackNTU’14 第二屆臺大黑客松-第二名&人氣獎
  6.MobileHero 2014 通訊大賽 穿戴式暨物聯網競賽-季軍
  7.2016 第十四屆台大創新競賽 評審團銅獎&人氣賞

(五) 研究專長與興趣領域:
人機互動、資料視覺化、資料探勘、電腦動畫