Top image

Perl Monk

主にPerlとRaspberryPiの個人的技術研鑽

[Node-RED]SeleniumでWEBスクレイピング ~Serverインストール編~

2020/04/15 20:00
category:サーバ全般

Node-REDでそろそろWEBスクレイピングをしたいと思います。

これができると、RPAに一歩近づいた気分になれます。

あまり選択肢はなく、Seleniumを使うのがよさそうのなので実験してみました。

が、Seleniumサーバ周りをインストールするのがちょっとめんどくさそうなのでDockerでデプロイする方法がよさそうでした。

Selenium構成イメージ

~ Dockerインストールは略 ~

docker run -d -p 4444:4444 -p 5900:5900 -v /dev/shm:/dev/shm selenium/standalone-firefox-debug

以上・・・! 上記はFirefoxのパターンの為、Chrome等の場合は別のモノを指定します。

https://github.com/SeleniumHQ/docker-selenium

debugを使うと、x11vncが立ち上がってる様子なのでVNCビューア等で5900を指定してログインする事が可能です。

あとは、Seleniumのサーバとブラウザを接続するドライバ、ブラウザが入っています。

GUIにログインすると、実際の操作しているブラウザの挙動が確認出来ます。

解像度を変更するには、Docker側の環境変数用ファイルを修正します。

/var/lib/docker/containers/コンテナID/config.v2.json

SCREEN_WIDTH ⇒幅

SCREEN_HEIGHT ⇒高さ

これでサーバ側の準備は整いました。