更新日:2018.12.11
平成30年12月6日(木)、7日(金)、パシフィコ横浜において「ビジョン技術の実利用ワークショップViEW2018」が開催され、齊藤 剛史准教授(大学院情報工学研究院 システム創成情報工学研究系)が開発した、読唇技術をスマートフォンやタブレットなどのスマートデバイスで体験できる読唇システムのWebアプリを、公開しました。
読唇技術は音声情報を用いずに映像情報のみから発話内容を推定する技術で、音声認識技術の利用が難しい高騒音環境や、音声認識技術を利用しにくい公共の場所、発声が困難な障害者のためのインタフェースとして期待されています。
開発システムは、日本語25単語を対象としています。認識精度など実用化のための課題が残っていますが、読唇技術とはどのようなものなのかを誰でも簡単に体験していただけるシステムです。スマートデバイスでデモンストレーション可能な世界初の読唇システムです。
◇読唇技術デモンストレーションWebアプリはこちら(外部リンク)
◇また、本研究は英国雑誌「Impact」に掲載されました。詳細はこちら