ぽよメモ

レガシーシステム考古学専攻

2015-08-20から1日間の記事一覧

textとstring

ついさっき投稿したこれBeautifulSoupとMechaizeでwebスクレイピングで最後抽出してきたhtmlの文章を加工整形する際、t.text.strip()しました。 抽出してきたhtmlはこんな感じ(見やすいように改行を加えている箇所があります) <p class="info_message"> 現在あなたの受講している科目</p>…

BeautifulSoupとMechanizeでwebスクレイピング

Pythonの勉強をはじめました。 手始めに大学の学務課のサイトから休講情報などを取ってこれるようにしたいなぁと思い、webスクレイピングから始めてみることにしました。 使うのはPython(今回は2.7.10)、BeautifulSoup、Mechanize、lxmlです。 pyenvでPython…