旧ゆるふわクオンツの日常

旧ゆるふわクオンツの日常

https://dw-dw-dt.hatenablog.com/ に引っ越します。リンク切れの記事もこちらのリンク先にあります。

ネットに落ちてるファイル(景気ウォッチャー調査)のクローリングとスクレイピング

 すでに先人達によってやり尽くされた感があって何を今更というネタではありますが(^_^;)

 Pythonを使ってウェブからデータを取得する方法について記載したいと思います。(seleniumを使うバージョンや、次のステップであるデータの解析・加工はまた別の機会にでも)
 環境は Mac OS High Sierra / Python 3.6.4 :: Anaconda custom (64-bit)となっております。
(注)ちなみになぜPythonかというと、、、ライブラリも豊富だし、普通に流行っているし、あとはコンパイラ言語ではなく、スクリプト言語であるという点ですかね。try & errorが多いクローリングやスクレイピングでは、ソースコードを修正してコンパイルして、っていうのが非常に面倒ですからね。。

====目次====

==========

続きを読む