[咻咻報]第八期-小分享:批次抓取公民資料

Day 2,043, 05:01 Published in Republic of China (Taiwan) Serbia by syusyou

好像有點久沒發報了

這次主要是要分享出我無聊寫的一個小腳本,可以批次抓取公民的資料,在個人頁面上看的到的大致上我都有做抓取。

程式的原始碼在這裡 http://goo.gl/lNI98
頁面出現後按 Ctrl+S 就能儲存起來。

使用方法如下:

1. 因為這是用 python 所寫的腳本,需要安裝 python 才能執行(python 下載頁面:http://goo.gl/o2HpD 請選擇 2.x.x 版本下載)。

2. 建立一個名為 name.txt 的文件,其格式是把要統計的人以一行一個連結的方式儲存起來,與剛剛下載的 citizen.py 放在同一個資料夾內,name.txt的範例:http://goo.gl/67SZh
還有一點要注意的是連結中間的語言必須是 /en/,其他像是 /tw/ 或 /cn/ 都有可能造成程式錯誤。

3. 點擊 citizen.py 兩下,開始抓取資料。如果程式成功結束,會產生一個名為 output.csv 的檔案,這個檔案類型可用 Excel 開啟。output.csv的範例:http://goo.gl/jQhrY

檔案裡面的資料說明如下:
Link 市民連結
Name 市民名字
Citizen Level 等級
Citizen Exp 經驗值
Citizenship 國籍
Birthday 生日
National Rank 在國家中的排名(若為0則表示此人已死)
Party 所屬政黨
Military Unit 所屬軍團
Strength 力量值
Military Rank 軍階
Military Level 軍階等級
Rank Point 軍階點數
Newspaper Name 報紙名稱
Newspaper Link 報紙連結
Friends Number 朋友數量
以下十二個為獎章的數量:
Hard Worker 工作
Congressman 議員
President 總統
Media Mogul 媒體
Battle Hero BH
Campaign Hero CH
Resistance Hero 起義
Super Soldier 大兵
Society Builder 社交
Mercenary 傭兵
Top Fighter 這要怎翻0.0
True Patriot 愛國

================
補充:使用上有bug請來跟我說,因為我懶得做測試 orz(全民公測OP)