ひつじTips

技術系いろいろつまみ食います。

pythonのBeautifulSoupを使って,ちょー助をスクレイピングしてCSVで吐く

概要

会社の飲み会の出欠確認のために,部署の秘書さんがちょー助を作ってくれたが,その出欠をメールに書こうとしたら,ちょー助はcsvで出してくれないらしい...

chosuke.rumix.jp

ので,前から使ってみたかったBeautifulSoupを使ってスクレイピングして,csvを吐くpythonスクリプトつくった.

# なんかちょー助とかメールでとか,すげぇジャパニーズ企業感あるなぁ..
# 最近のイケてるところだとSlackの機能とかで予定調整やってそうなもんだわ..

結果

テスト用に下のちょー助を作った.

[ちょー助] 女性声優ソート!

引数にちょー助のURLを与えて実行すると,以下のようにcsv形式でstdout吐いて,実行パス直下にcsvを作る.

C:\Users\Me\programs\python>python cho-suke_scraper.py "http://chosuke.rumix.jp/main.aspx?g=4c0f2fa1f04c15cdd7"
name,2018/3/2(金),2018/3/3(土),2018/3/4(日)
NANA,◎,△,○
ゆかりん,◎,◎,◎
ゆーき,○,○,○
ほりえゆい,×, ,×
うえだ,◎,◎,◎
なかはらまい,○,△,×
あすみす!, ,○,◎
ころあず,×,×,×
諸星,○,◎,◎
yui(*-v・)yui,○,○,○
hego, , , 
あやち,○,○,△
御前,○,○,△
ちわわ,×,◎,◎
ゴトゥーザ,×,△,△
ゆずねぇ,◎,◎,◎
まみこ,△,○,○
みずはす,○,×,×
さわしろ,◎,◎,×

ソース

BeautifulSoupさんのおかげでめっちゃシンプル.特に解説すべきこともなし.

gist519ff689be24aa66253948a43611ec5d

感想

BeautifulSoupよいね.めっちゃラクだった.

でもこういう系のツールってどうしてもwebアプリでやりたくなるな~.スクリプト実行もめんどいわ.github pagesでJS動くらしいし,JSにしてwebアプリにしようかね

qiita.com

あと実は,調整さんならcsvをダウンロードする機能があるので,そちらを使ったほうがよい.

chouseisan.com

てか,このテスト用ちょー助をつくるために,女性声優ソートやる時間の方が長かったのではないか疑惑.

数年前はなのは声優ばっかだったが,アイカツのおかげで多少若手が混ざってきたなぁ.

参考