VPS上でChromedriver + Selenium + Pythonでスクレイピングしてデータをどんどんためていきたいなと思って、Chrome自体をインストールを行ってみました。
CentOS7なら簡単にChromeをインストールできる
CentOS6だとyumでインストールできるgoogle-chrome-stableのバージョンが低いみたいですが、CentOS7ならほぼ最新版をインストールできます。
yum install google-chrome-stable
google-chrome-stable.x86_64 0:73.0.3683.75-1がインストールされる(現時点)
73.0はほぼ最新バージョンですね。
/opt/google/chrome/chromeがインストールされたChromeブラウザの本体
これを実行すると、不足しているライブラリがあるよと言われるかもしれません(その環境によるが、普通は言われると思う)。
ldd /opt/google/chrome/chrome
としてライブラリを確認
libatk-1.0.so.0 => not found
のようにnot foundなlibがないか確認する。
この例であれば、
yum install -y libatk-1.0.so.0
とかして、不足しているライブラリをインストールしよう(基本的にはこの方法でライブラリをインストールすることができます)。
ライブラリがリンクされない場合は次のようにgoogle-chrome-stableを再インストールしてみるとOK。
もし、うまくいかない場合には、google-chrome-stableをいったん削除する(アンインストールする)
yum remove -y google-chrome-stable
でいったんアンインストールしてみて
再度
yum install -y google-chrome-stable
これで、リンク関連の問題は解決しているはずで、うまくいくはず。
Google Chromeが正常にインストールされたかどうか確認
/opt/google/chrome/chrome --headless --disable-gpu --window-size=1024,768 --hide-scrollbars --screenshot='google.png' https://www.google.co.jp/
これでgoogle.co.jpの画面がスクリーンショットされ、google.pngとして保存されているはず。
chrome driver のダウンロード
seleniumでスクレイピングしたいなら、chromedriverが必要なので、以下のようにダウンロード&解凍すればOK。
wget https://chromedriver.storage.googleapis.com/73.0.3683.68/chromedriver_linux64.zip
unzip chromedriver_linux64.zip
コメント