GoogleDeepMindとオックスフォード大学のプロジェクトは、BBCの番組動画からディープランニングによって読唇術を行いました。2010年から2015年にかけて放送された6つのテレビ番組(Newsnight、BBC Breakfast、Question Timeなど)の約5000時間の動画を使用し、118,000の文章を使って、AIに学習させました。
ランダムに選んだ200の映像の断片から読唇術のプロ(人間)が正しく読み取ったのはわずか12.4%、AIは46.8%でした。
LipNet: How easy do you think lipreading is?
-------------------------------------------------------------------------
N2iでは企業向け人工知能の受託開発
人工知能を使ったビックデータ解析を行っています。
【ご相談・お問い合わせ】はこちら
-------------------------------------------------------------------------