NAGOYA AI Blog

愛知・名古屋の人工知能・AIのニュースとブログ - N2i Blog

データ集めを助けてくれるサイト「import.io」

f:id:n2i-ishikawa:20171218101658j:plain

こんにちは。

突然ですが、「スクレイピング」という言葉を聞いたことはありますか?
サービスや統計・AIでデータが必要になる時があります。そんなデータをウェブページの中から集めてしまおうというのがスクレイピングです。

 

スクレイピングをしようとすると、対象となるサイトの構造を調べたり、少なからずコードを書いたりする必要が出てきます。

しかし、少しサンプルが欲しいだけの時に、わざわざこんなことをするのでは疲れてしまいます。

 

そこで、そんなときに使える例として「import.io」というサービスを紹介します。

有料ですが、1週間は無料で体験できます。

www.import.io

import.ioでは、指定したURLをもとにテーブルを作ることができます。

一つのカラムにしたい部分を選択し、いらない部分を取り除き、と作業を進めて自分好みのテーブルを作ります。

カラム名はCSSセレクタ名などからいい感じに自動で名前をつけてくれたりもします。

f:id:n2i-ishikawa:20171218102053p:plain

カラムを選んでいくことができる

データは日々変化するので、変化を監視し、更新や通知をするスケジュールを組むこともできます。

作られたデータはエクセルやCSV、JSON形式でダウンロードできます。

体験版ではできませんが、API化してプログラムと連携させることもできます。

 

こういったサービスを使って簡単に得たデータをもとに、誰もが日常で効率的に判断をする日々は近いのかもしれません。

 

------------------------------------------------------------------------

N2iでは、企業向け人工知能の受託開発や

人工知能を使ったビックデータ解析を行っています。

【ご相談・お問い合わせこちら

-------------------------------------------------------------------------