NEC Empowered by Innovation NEC
検索  キーワード検索の文字入力 検索範囲の選択 by Google
ホーム ニュース 会社概要 商品 ソリューション ダウンロード サイトマップ
現在のページの位置: ホーム > プレスリリース > 記事

プレスリリース



大量のテキストデータからリアルタイムに新しい話題の潮流を発見するテキストマイニングエンジンを開発

2004年12月03日

日本電気株式会社

NECはこのたび、コンタクトセンターなどに時々刻々と蓄積していく大量の電子メールなどのテキストデータからリアルタイムにトピック(話題)を分析し、顧客のニーズや世の中のトレンドの早期発見を実現するテキストマイニングエンジン「TopicAnalyzer(TM)」(注1)を開発しました。

今回開発した「TopicAnalyzer(TM)」は、機械学習技術に基づき、テキストデータからトピック(話題)の構造をリアルタイムに学習する技術の開発によって実現したもので、以下の特長を有しています。

(1) テキストデータのトピック構造を「有限混合モデル」とよばれる統計的モデルで表現し、これを独自に開発した「機械学習アルゴリズム(注2)」で適応的に学習することにより、テキストデータの入力と同時に似たようなトピックを持つデータのグループ化や、トピックの重要性・特徴を表すキーワードの抽出を実現。
(2) 独自の「動的モデル選択理論」(注3)とよばれる機械学習技術を適用することにより、今までにない新しいトピックのリアルタイム検出を世界で初めて実現。また、一度現れたトピックが時間とともに成長・消滅する変化傾向の把握も可能。
(3) オンライン処理による情報分析により、従来のバッチ型テキスト分析に比べて約100倍の処理速度を実現。

このたび開発した「TopicAnalyzer(TM)」を用いることで、コンタクトセンターなどでは顧客の関心をいち早く捉えた効果的なCRM(Customer Relationship Management)の展開が可能になります。また、「TopicAnalyzer(TM)」を広くWeb上の情報監視システムや各種ナレッジシステムに応用することにより、ホットな話題や新しい情報の潮流をいち早く発見することが可能になります。

近年、即時に情報を伝達するインターネットや電子メールなどの普及に伴い、コンタクトセンターやWeb上の掲示板などのように大量のテキストデータが時間とともに次々と流入してくるシステムを監視して、「一体何が話題になっているのか?」といったトピックの分析をリアルタイムに行うことが重要になっています。特にコンタクトセンターなどでは、顧客の関心の傾向をいち早く捉えてビジネスに反映するため、CRM担当者が多大な工数をかけてトピックを分析する必要性が高まっています。
従来、こうしたトピック分析は、データベースに蓄積された大量のデータを一括して処理する形で行われていました。しかし、そのような方法では、次々とデータが入ってくる環境の下では、ダイナミックな傾向を分析することができない、計算時間が膨大にかかるといった問題がありました。このたび開発したテキストマイニングエンジン「TopicAnalyzer(TM)」は、こうした課題を克服し、リアルタイムにトピックの傾向分析や新しく出現した問い合わせのパタン検出などを行うもので、情報分析の効率化に貢献します。

NECでは、今回の「TopicAnalyzer(TM)」の開発が、CRMソリューションや、ユビキタス環境におけるナレッジマネジメントソリューションに高い付加価値を与えるものと考え、今後、本技術の早期製品化を目指して研究開発活動を強化していきます。

以上


(注1) TopicAnalyzer(TM)は、NECの商標です。
(注2) 独自の「タイムスタンプつき忘却型学習アルゴリズム」を用いています。これは過去のデータを徐々に忘れながら、より新しいデータの性質に適応して統計モデルを学習するアルゴリズムです。
(注3) 主要なトピックがいくつ存在するか、について最適な数を、データが与えられる毎に、情報量規準(一種の統計的指標)に基づいて選択するための方式です。

<本件に関するお客様からのお問い合わせ先>

NEC 研究企画部 企画戦略グループ

https://www.nec.co.jp/r_and_d/ja/cl/contact.html


本文ここまで
ページトップに戻る
プレスリリーストップに戻る
Copyright© NEC Corporation 1994-2004