[C&C for Human Potential / NEC Corporation]
平成9年7月28日
報道関係各位
日本電気株式会社

新メモリアーキテクチャに基づく高並列コンピュータの開発について

- 分散共有メモリ機構とメッセージ通信機構の融合を初めて実現 -
「並列コンピュータCenju−4」

「並列コンピュータCenju−4」

NECはこのたび、分散共有メモリ機構とメッセージ通信機構を融合した新メモリアーキテクチャに基づく世界最初の「NEC並列コンピュータCenju-4」を開発いたしました。

今回開発したNEC並列コンピュータCenju-4は、分散共有メモリ機構と高速メッセージ通信機構の両方の機能を兼ね備え、最大1,024ノード構成(従来型高並列コンピュータの4倍)、ピーク性能400ギガFLOPS(同32倍)、最大メモリ容量512ギガバイト(同32倍)の高性能高並列コンピュータであります。

分散共有メモリ機構とメッセージ通信機構の融合を実現するにあたって、通信機能を備えたメモリコントローラ、および複数ノードへの送受信機能を備えた高速ネットワークスイッチの2種のLSIを開発し、ノード間の通信において転送速度200メガバイト/秒(同5倍)を達成しました。

また、ソフトウエアシステムは、MACH(マック)マイクロカーネルをベースとし、物理的に複数のノードから構成されている計算機を論理的に一つの計算機システムとして動作させる機能を備えています。さらに、研究機関における並列処理研究用プラットフォームとして、オペレーティングシステムのソースコードおよび関連研究成果を公開いたします。

NEC並列コンピュータCenju-4で今回実現した、分散共有メモリ機構とメッセージ通信機構を備えたメモリシステムの特長は次の通りです。

  1. ノード間にまたがるメモリ空間を一つの空間として実現するために、40ビット長からなるグローバルアドレス方式(注)を採用しました。これにより最大512ギガバイトの実メモリを直接アクセスすることができます。

  2. ノード間でのメモリの一貫性制御をキャッシュライン単位でハードウエアが自動的に行ないます。これにより、複数のノード間で同一アドレスを読み書きした場合においても、メモリ間およびキャッシュ間で矛盾を生じません。さらに、全てハードウエアで制御するため、遠隔ノードのデータを高速に読み書きすることができます。

  3. 同一ジョブにおいて共有メモリ用のページとメッセージ通信用ページをページ単位に使い分けできるようにしました。これにより、小量のデータ転送が多い場合には共有メモリを、大量のデータ転送が必要な場合はメッセージ通信機能を利用することができ、目的に応じて最適な通信形態を選択することができます。

これらの特長により、NEC並列コンピュータCenju-4は並列回路シミュレーションのような数値処理応用において同一ノード数でのシステム性能で従来型高並列コンピュータの4倍の性能を達成しました。さらに、分散共有メモリ機構とメッセージ機構の両方を同時に活用することにより、複雑で大規模な問題を効率良く並列化することが可能となります。

例えば、複雑な物体の挙動を多面的に解析するためのマルチフィジックス計算においては、流体計算と構造計算の両方を同時に行なう必要があります。このような複合型計算においては、流体計算や構造計算などの各モジュール毎に分散共有メモリを用いた密結合型並列処理を行ない、モジュール間でメッセージ通信を用いた疎結合型並列処理を行なうことにより、システム全体を自然に並列化し、NEC並列コンピュータCenju-4の持つ通信性能を最大限に活用することができます。

NEC並列コンピュータCenju-4のハードウェア構成とソフトウェア構成は次の通りであります。

(1)高性能プロセッサ

各ノードのプロセッサにスーパースカラーアーキテクチャを採用した高性能汎用RISCマイクロプロセッサ「VR10000」を搭載し、従来型高並列コンピュータに比べてノードあたり8倍の浮動小数点演算性能(400MFLOPS)を実現しました。また1次命令/データキャッシュとして32Kバイトずつ、さらに2次キャッシュとして1MバイトのSSRAMキャッシュを装備しており、大規模計算にも対応可能です。

(2)高速メモリ

科学技術計算における大容量データアクセスのために主記憶として、通常のDRAMよりも最大2倍以上高速にアクセス可能なシンクロナスDRAMを採用しています。

(3)高速多段網

ノード間の高速通信を実現するために、最新の半導体デバイスを用いて、従来型高並列コンピュータの約5倍の通信性能を持つ200Mバイト/秒のデータ転送速度のスイッチングユニットを開発しました。4×4のスイッチをベースに8ノードから1024ノードまでの構成が可能です。

(4)局所入出力機能

各ノードごとに、イーサーネットおよび内蔵ディスクを備えています。

(5)マイクロカーネル型並列オペレーティングシステム

各ノード毎にMACHマイクロカーネルを搭載し、マルチスレッド、マルチプロセス、仮想記憶をサポートします。プロセス間通信と同一のインタフェースを持つカーネル間通信機能により、遠隔ノード上のサーバーと局所ノード上のサーバーを区別せずにアクセスできます。

(6)高速並列通信ライブラリ

高速通信として、遠隔メモリ読み込み、遠隔メモリ書き込み、メッセージ通信、遠隔関数呼出しが可能なParalib/CJ4(パラリブ/CJ4)や事実上の標準である科学技術計算向き通信ライブラリMPI(Message Passing Interface)が利用可能です。

(7)並列プログラミング言語/環境

並列プログラム言語HPF(High Performance Fortran)コンパイラを中心とした統合的並列プログラミング環境としてPCASEの研究を行っております。また、並列デバッガおよびMPIプロファイラが利用可能です。

NEC並列コンピュータCenju-4は本日発売を開始し、出荷開始は本年12月、価格は3800万円からとなっております。

NECでは、これまでに10年以上にわたって大規模高性能計算に向けた並列処理研究を続けてまいりました。また、高並列コンピュータとしては全世界で50台以上の出荷実績を持ち、国内外の研究機関およびNEC並列センターを通じて、数々の高並列コンピュータ研究ソフトウエアが培われています。このような研究成果をさらに発展させ、実用的な並列オペレーティングシステム、並列プログラミング環境および並列応用ソフトウエアを実現するためには、より多くの研究コミュニティーの参加が不可欠であり、このために、オペレーティングシステムのソースコードの公開、共同研究成果の公開を図りたいと考えています。また、科学技術計算分野のみならず、様々な応用分野において並列処理技術の研究開発に取り組んでゆくことにしております。

NEC並列コンピュータCenju-4の主な仕様に付きましては別紙をご参照下さい。

以 上


(注)40ビット長のグローバルアドレス方式

ネットワークで結合された他のノードのメモリを直接読み書きするためのアドレス方式。本システムの場合は、40ビットのアドレス長のうち、10ビットをノード番号の指定に用い、30ビットをノード内の物理アドレスに用いる。


個人情報保護   ご利用条件   お問い合わせ

Copyright NEC Corporation. All rights reserved.