ページの先頭です。
本文へジャンプする。

本ウェブサイトでは、JavaScriptおよびスタイルシートを使用しております。
お客さまがご使用のブラウザではスタイルが未適応のため、本来とは異なった表示になっておりますが、情報は問題なくご利用いただけます。

ここからサイト内共通メニューです。
サイト内共通メニューを読み飛ばす。
サイト内共通メニューここまで。
サイト内の現在位置を表示しています。
ホーム > ニュース > プレスリリース > NECのテキスト含意認識技術がNIST主催の評価タスクで第一位を獲得

NECのテキスト含意認識技術が米国国立標準技術研究所(NIST)主催の
評価タスクにおいて第一位を獲得

2012年4月13日
日本電気株式会社

NECは、二つの文が同じ意味を含むかどうかを判定するテキスト含意認識技術の性能について、米国国立標準技術研究所(NIST、注1)が主催する評価タスク(注2)で世界各国からの参加機関中第一位の評価(注3)を獲得しました。

テキスト含意認識技術とは、大量のテキスト(ビッグデータ)を分析して新たな価値を創出するための基盤技術の一つで、インターネット上に溢れる製品・サービスに対する顧客の声や風評を集約して分析し、マーケティングや企業のリスク管理などに活用するものです。

従来、テキスト含意認識技術は、二つの文に含まれる単語の一致・不一致を中心に分析していたため、異なる単語で同じ意味が表現されていたり、同じ単語を用いて異なる意味が表現されている場合に、正しい分析結果が得られないといいう課題がありました。
このたびNECが開発し第一位の評価を受けた技術は、文中における単語の重要性、主語や述語などの文の構造を考慮し、二つの文が同じ意味を含むかどうかを高精度に判定し、より正しいテキスト含意認識を実現するものです。

本技術の特長は以下のとおりです。

  1. 文の表現の違いを考慮して、意味の一致を判定
    二つの文を比較する際、文に含まれる単語の同義語・派生語・省略語を、同じ単語とみなすとともに、文中における単語の重要度を考慮して意味の違いを判定。これにより、同じ意味を含みながら異なる単語で表現されている二文を、高精度に判定可能。

  2. 文の構造を利用して、意味が異なることを判定
    二つの文を比較する際、文の主語・述語・目的語の関係性を判定に利用。これにより、述語は一致するが主語が不一致の文など、同じ単語を用いながら意味の異なる二文を、高精度に判定可能。

昨今、企業内外に流通するテキストデータが爆発的に増加しています。NECでは、これらのビッグデータから新たな価値を創出する技術の研究を強化しており、このたび獲得した評価はNECのビッグデータ分析技術の先進性を示すものです。
NECは今後も、本技術を活用した製品・サービスを通じ、お客様の新たな価値の創出に貢献してまいります。

以上

(注1) NIST: National Institute of Standards and Technology (注2)

NIST 主催のTAC2011(Text Analysis Conference 2011) にて開催されたテキスト含意認識技術(Recognizing Textual Entailment, RTE)の評価タスクRTE-7。詳細は L. Bentivogli et al., "The Seventh PASCAL Recognizing Textual Entailment Challenge", <新しいウィンドウを開きます。 http://www.nist.gov/tac/publications/2011/agenda.html> 参照。

(注3)

TAC2011が採用した指標F値での評価。適合率(システムが同じ意味を含むと判定した文のうち正解だった割合)と再現率(システムが同じ意味を含むと判定すべき文のうち正解した割合)の調和平均で、値が大きいほど性能が良いとされる。NECはメインタスク、新規性検出サブタスク双方で第一位を獲得。

私たちNECグループは、
「人と地球にやさしい情報社会をイノベーションで実現する
グローバルリーディングカンパニー」を目指しています。

共有する: このエントリーをはてなブックマークに追加

本件に関するお客様からのお問い合わせ先

NEC 知的資産R&D企画本部 広報グループ
新しいウィンドウを開きます。 お問い合わせフォーム

このページに掲載されているプレスリリースその他の情報は、発表日現在の情報であり、時間の経過または様々な後発事象によって変更される可能性がありますので、あらかじめご了承ください。

ページの先頭へ戻る

Copyright NEC Corporation. All rights reserved.