ページの先頭です
本文へジャンプする

Japan

ここから本文です
サイト内の現在位置を表示しています

ホーム > プレスリリース > 記事

映像・音声コンテンツから関連する話題を抽出する技術を開発
~音声認識技術を活用して映像データの効率的な視聴を実現~

2006年 5月29日
日本電気株式会社

ニュースを音声認識している様子 認識結果を話題ごとに分割した様子
ニュースを音声認識している様子 認識結果を話題ごとに分割した様子

NECはこのたび、映像・音声コンテンツに含まれる音声から話題(トピック)の変化を検出し、映像・音声コンテンツを話題ごとに分割する「トピック分割技術」を開発しました。

今回開発した「トピック分割技術」は、自然な話し言葉を業界最高レベルの精度でテキスト(文章)に変換する音声認識技術、および、テキストを意味のあるまとまりに切り分けるテキスト分割技術、により実現したものです。

このトピック分割技術により、デジタル放送網やインターネット上で大量に流通する映像・音声コンテンツを話題ごとに検索・頭出し・視聴・閲覧でき、映像コンテンツの効率的な提供および視聴が可能になります。

近年、地上デジタル放送・ワンセグ放送・サーバ型放送等の放送サービスの多様化、映像や音声を媒体としたブログ(日記風の簡易型ホームページ)による個人の情報発信の活性化、FTTH等の通信回線やハードディスクレコーダ・携帯プレーヤの大容量化、などが進んでおり、日常生活の中でデジタル映像データに触れる機会が増えています。将来、通信・放送の融合が進展すると、ますます膨大な量のコンテンツが流通し、情報の洪水ともいえる中で、サービス利用者は自身が欲する情報を効率的に取得することがさらに難しくなると考えられています。

これに対し、現在は、電子番組表(EPG)やコンテンツに付随する字幕などのメタデータ(関連情報)をキーワード検索することにより、視聴したいコンテンツを見つける技術が用いられています。しかし、これらの技術では、(1)メタデータ作成に大きなコストがかかる、(2)キーワードを用いた単純な検索では、ニュース番組の1ニュース項目のような意味のある単位での視聴が容易ではない、といった問題点がありました。

このたびの開発は、こうした課題を克服するもので、コンテンツを話題ごとに正確に分割することにより、意味的にまとまった話題単位でのコンテンツの頭出しや視聴が低コストで実現可能になります。

このたび開発した「トピック分割技術」の特長は以下の通りです。

(1) 話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治・芸能・スポーツなど話題の具体的内容に影響されることなく分割可能。
(2) 一連の話題の移り変わりを数理的なモデル(隠れマルコフモデル)で表現し、話題の変化点をコンテンツ全体から総合的に判断することにより、話題が変わる頻度に関わらず安定して高い性能を実現。
(3) 人工知能分野の最新の学習アルゴリズム(変分ベイズ法)を応用することにより、多くの語彙を含む複雑なコンテンツに対しても高い精度で話題の変化を検出できます。

NECでは、今回の開発がコンテンツの視聴、推薦、管理等を効率化し、通信・放送サービスの提供者および利用者の利便性向上に大きく貢献すると考え、今後、コンテンツ関連事業での製品化を目指して研究開発を強化していく計画です。

以上

本件に関するお客様からのお問い合わせ先

NEC 研究企画部 企画戦略グループ
https://www.nec.co.jp/r_and_d/ja/cl/contact.html


このページに掲載されているプレスリリースその他の情報は、発表日現在の情報であり、時間の経過または様々な後発事象によって変更される可能性がありますので、あらかじめご了承ください。

本文ここまで
ページの終わりです
ページの先頭へ戻る