按此列印  
                           
   
  請尊重智慧財產權,課程教材不得非法影印。  
  佛光大學
Fo Guang University
教學計畫表 Syllabus
 
 
課程中文名稱
 Course Name in Chinese
網頁擷取程式設計  
Course Code
CS5H600
課程英文名稱
Course Name in English
Wrapper Development 學年/學期
Academic Yeas/Semester
107 /2
開課單位/學門別
Course Offering
Department/
Academic Discipline
資訊應用學系碩士班 學制別
Degree
碩士班

Credits
 3     每週授課時數
Weekly Hours of
 Instruction
 3    修別
Type
選修 Elective
/學門別
Program
學系專業選修Specialized Elective
課程分流
實務型
課程屬性
Curriculum attribute
■一般課程
授課教師
Instructor
羅榮華 聯絡方式
jhlo@mail.fgu.edu.tw
03-9871000 #
上課時間/地點
Time of Class/Location of Class
四.2,3,4(U108)
先修課程
Prerequisites
課程描述(若為實務型課程需含搭配產業界或非營利組織需求之說明)
Course Description
 
網際網路上存在著巨量的有用資訊,然而大多數的資訊均是以HTML網頁的形式呈現;HTML網頁適合用於給人類瀏覽,卻不適合直接交由機器處理。如欲對此巨量資訊的其中一部份,作進一步的加值處理,如文字探勘、情資蒐集與萃取,便需要進行網頁擷取程式的設計。本課程將網頁擷取程式的設計,分為如何透過HTTP協定取得網頁資料,以及對於HTML網頁進行剖析(parsing)與萃取(extraction)兩大部份來介紹。
 
課程目標
(若為實務型課程請具體描述該課程所要培養之實務能力)
Course Objectives
序號目標描述
1能使用HTMLParser擷取特定網頁內容
2能使用HttpClient傳送表單至網頁伺服器取得網頁
 授課進度表 ContentWeekly Schedule
週次內容備註
1課程簡介 
2Anaconda/Spyder; 爬蟲相關應用與緣起 
3Anaconda/Spyder; 爬蟲相關應用與緣起 
4資料處理能力:CSV、XML、JSON、YAML之讀取與寫入;SQLite資料庫之處理 
5資料處理能力:CSV、XML、JSON、YAML之讀取與寫入;SQLite資料庫之處理 
6資料處理能力:CSV、XML、JSON、YAML之讀取與寫入;SQLite資料庫之處理 
7流程控制網頁資料擷取與轉換:Requests、Urlib、Beautiful Soup、Selenium 套件進行靜態爬蟲與動態爬蟲 
8流程控制網頁資料擷取與轉換:Requests、Urlib、Beautiful Soup、Selenium 套件進行靜態爬蟲與動態爬蟲 
9流程控制網頁資料擷取與轉換:Requests、Urlib、Beautiful Soup、Selenium 套件進行靜態爬蟲與動態爬蟲 
10期中報告 
11資料分析能力:Numpy、Pandas套件中存取單一元素、存取子陣列、聚合操作(aggregation operation)、索引、排序 
12資料分析能力:Numpy、Pandas套件中存取單一元素、存取子陣列、聚合操作(aggregation operation)、索引、排序 
13資料分析能力:Numpy、Pandas套件中存取單一元素、存取子陣列、聚合操作(aggregation operation)、索引、排序 
14資料視覺化能力:Matplotlib套件中圖表之設定、各種圖表之呈現、多圖表繪製、CSV檔案繪製圖表 
15資料視覺化能力:Matplotlib套件中圖表之設定、各種圖表之呈現、多圖表繪製、CSV檔案繪製圖表 
16Case Studies 
17Case Studies 
18期末報告 
教學策略Instructional Strategies
學期成績計算及多元評量方式Grading Policy
項次配分項目/catagory配分比例/Percentage會考測驗/general_test實務操作/accounting_practice專題發表/case_presentation其他/other
1平時成績/Asssignments 30%   100
2期中考成績/Midterm Exam 0%   100
3期末考成績/Final Exam 30%   100
4其他/other 40%   100

主要參考書目

References

Python 資料科學與人工智慧應用實務 作者: 陳允傑 出版社:旗標

指定閱讀

Required Readings

深度學習相關論文

課程平台/晤談地點與時間

Course Management
SystemInstructor’s
 Office and Office hours 

U421 四5, 6,7

教師座談

http://elearn.fgu.edu.tw