【Googleスプレッドシート】情報収集の自動化→IMPORTHTML関数

Googleスプレッドシートでオリジナル経済指標サマリーが出来たよ Googleスプレッドシート

情報収集を全自動化!誰でも簡単に設定できて超楽チン!Googleスプレッドシート「IMPORTHTML関数」

定期的に欲しい情報を集めるためにいちいちブックマークを開いてコピーして貼り付けてまた次の情報を集めるために他のサイトに飛んでコピーして・・・(繰り返し)という作業を自動化するテクニックを紹介します。

IMPORTHTMLはスプレッドシートで誰にでも簡単に使える小技です。

ぜひ試してみてくださいね。

IMPORTHTMLを覚えたキッカケ「経済指標を集めるのがめんどくさかった」

この記事ではGoogleスプレッドシートに自動で情報を収集させて、シートに反映させるIMPORTHTML関数(インポートエイチティーエムエル)を紹介します。

「自動で情報を取得なんてなんか難しそう!」と思われるかもしれませんが、VLOOKUPと同じくらいのレベルで誰でも扱える簡単な関数なので是非お試しください!

私がIMPORTHTMLを覚えたキッカケ

  • 投資の参考にするため、世界の経済情勢のサマリーを作るためその都度探し集めていた
  • 必要な情報がスプレッドシートを開けば、常に最新の状態に更新されていればいいのに…

毎週のように情報を集めながら、

「こんなルーティン的な情報収集は時間の無駄だから、できることなら自動化させたほうがいいね」と思うに至ったわけです。

スプレッドシートのIMPORTHTML関数はこんな方にピッタリ

・定期的に特定の情報を取得したい
・時間をかけず簡単に仕組み化したい
・どこにいてもスマホですぐに欲しい情報を確認したい(マルチデバイス対応)

⇒GoogleスプレッドシートのIMPORTHTML関数を使って自動で情報収集(スクレイピング)させる。

Googleスプレッドシートで経済指標を自動で取得する

例として、私がいつもお世話になっている投資家のための無料経済情報サイト

investing.comより、定期的に知りたい経済指標を取得できるようにしてみます。

下の画像の赤枠部分を、自動で情報収集できるようにします。

Googleスプレッドシートでスクレイピング

Googleスプレッドシートを開き、空白のシートに以下をコピペしてみてください。

=IMPORTHTML("https://jp.investing.com/economic-calendar/new-home-sales-222","table",1)
investing.comでGoogleスプレッドシートのスクレイピング実践
いかがですか?
このように表を引っ張って来るように指示することで、以降はスプレッドシートを開いたタイミングで勝手に自動取得してくれるようになります。


IMPORTHTMLの基本と疑問

=IMPORTHTML(“サイトのURL”,”table(もしくはlist)”,番号)
ここで湧き上がるいくつかの疑問
「tableなのか?listなのか?」
「番号は何番???」
これらは何回かトライして、ちょうどいい場所を探したほうが早いと思います。
私はhtmlについて基本的なことは知っているつもりですが、どの部分で番号などが定義づけがされているのか、一目見ただけでは確認できませんでした…。
いくつかのサイトで試してみたところ、
番号について「上から下にみていった時の表の順番になっているかも?」と私の中で仮説が立ちました。

「ヤフー天気」でも同じ方法でスクレイピングが出来た!

仮説を検証するべく、

次は同じ方法でヤフー天気の週間天気予報を取得してみたいと思います。

GoogleスプレッドシートのIMPORTHTML関数で自動情報収集 ヤフー天気の場合

ページの下の方にあるから4番目くらい?

ということで、今回は「4」を入力。

Googleスプレッドシートで自動情報収集

うまくいきました!

HTMLを睨めっこして定義を探すより、この方法の方が目的の情報をはやく表示させることが出来そうです。

シートごとに取得した情報をサマリーにしてみる

GoogleスプレッドシートのIMPORTHTMLでスクレイピングする。オリジナル経済指標サマリー

先述の方法でGoogleスプレッドシートの各シートに情報をどんどん放り込み、あとは「まとめシート」を作成し、各シートから必要な情報を引っ張ってくれば簡単にあなただけのオリジナルサマリーの完成です。

リアルタイムの最新情報をいつでも自動取得、スマホからでも見ることが出来ます。

このように経済指標を集めるために私はGoogleスプレッドシートのIMPORTHTML関数を今回使用しました。

ビジネスシーンでもスプレッドシートのIMPORTHTMLによるスクレイピングは活用できるかもしれない

スプレッドシートのIMPORTHTMLは、仕事でも活用出来る場面が多そうです。

例えば、お得意先や業界のプレスリリースを集めるなどは得意だと思います。

「情報を集めて転記する」というような作業の自動化には、GoogleスプレッドシートのIMPORTHTMLはお手軽な方法で誰にでもおススメできる方法です。

(注意点)ログインID、パスワードが必要なサイトではIMPORTHTML関数が使えない

便利なGoogleスプレッドシートのIMPORTHTMLですが、ログインIDやパスワードを要求されるサイトでは使えません。

(GASなどのプログラム(Excelでいうマクロ)を使ってパスワードを自動入力して行った先でcsvファイルをダウンロードするなどの方法もあり、自動化は可能です。)

スクレイピングをよく理解するためにおススメの本


 

Googleスプレッドシートが重い!遅い時はメモリ不足かも?簡単に改善できますよ。

コメント