N2i ジャーナル

名古屋と東京を拠点に活動するITベンチャー N2i がIT・ビジネス情報をお届けします

名古屋と東京を拠点に活動するITベンチャーN2iがIT・ビジネス情報をお届けします

畳み込みネットワークが苦手だった「集合体から個別に識別する方法」をカプセルネットワークが解決!

f:id:web-marke:20180301163256j:plain

 

2017年11月にGoogleの研究員であるジェフリー・ヒントン氏が、CNNの欠点を克服したという「カプセルネットワーク」(CapsNet)を発表しました。CapsNetがどのようなものか、オライリーの記事を読むとよくわかるようになっています。 

 

これは興味深い記事でした。左下の写真から羊を検索しようとすると、どうしても集合のまとまりとして羊を認識していたものを、個別で見分けることが可能になるというものです。

f:id:n2i-t:20180226103040j:plain

 

 

考え方は簡単で、下の三角形と四角形で例をあげています。

 

三角形と四角形で表されるオブジェクトは家とボートです。

同じ図形を使っていますが、三角形の向きが違うことによって家に見えたりボートに見えたりするテクニックを使っています。

 

三角形と四角形の向きを関連づけて調べることによって、複雑な物体でも認識できるようになります。それが以下の家とボートが複雑にくっついた図です。

 

 

f:id:n2i-t:20180226103107p:plain

 

ぱっと見は、人間でも一瞬まよってしまう図形の組み合わせですが、三角形の向きと四角形の向きの関連性を見極めることによって、この図形は家とボートが組み合わさったものであることを識別することができました。

 

これがカプセルネットワークです。

 

f:id:n2i-t:20180226103116p:plain

 

シンプルなアイデアですが言われればなるほど!と納得してしまいますね。これで同じオブジェクトが集合体でてきても、瞬時に人間を数えたり車を数えたりできますね。 

 

www.oreilly.com

gigazine.net

Powered by はてなブログ