NEC Empowered by Innovation NEC
検索  キーワード検索の文字入力 検索範囲の選択 by Google
ホーム ニュース 会社概要 商品 ソリューション ダウンロード サイトマップ
現在のページの位置: ホーム > プレスリリース > 記事

プレスリリース



東北大学スーパーコンピュータSX-7がHPCチャレンジベンチマークにおいて、世界最高速記録を達成

2004年12月21日

日本電気株式会社

NECはこのたび、東北大学情報シナジーセンター(根元義章センター長)に納入し、2003年1月から稼動しておりますスーパーコンピュータSX-7において、HPC(高性能計算)分野での新しいベンチマークテストであるHPCチャレンジベンチマーク(http://icl.cs.utk.edu/hpcc/)で、28項目中16項目で世界最高速を達成いたしました。

HPCチャレンジベンチマークは、米国政府の援助のもと、テネシー大学のJ.ドンガラ(J.Dongarra)博士を中心に米国や日本のHPC関係者が参画して、作成されたものであります。従来、高性能計算機の性能番付として主流であったTOP500ベンチマークで使用されてきたLinpack(連立方程式の計算)を補完し、高性能計算機の性能を多面的な観点から評価する目的で開発されたベンチマークであります。同ベンチマークはHPCシステムで重要となる複数の性能テストから構成されており、コンピュータの演算性能だけではなく、メモリアクセス性能、並列処理のためのライブラリであるMPI(Message Passing Interface)の通信性能など、HPCシステムにおける様々な機能の性能を総合的に評価することが出来ます。
今回のベンチマークテストでは、NECのSXシリーズのようなベクトル型スーパーコンピュータだけではなく、汎用プロセッサを使用したスカラー型スーパーコンピュータの性能も数多く登録(注1)されており、今後のHPCベンチマークテストの主流になるものと見込まれております。

このたび、SX-7が世界最高速を達成した、HPCチャレンジベンチマークは、Linpackベンチマークも含んだ7カテゴリー28項目のベンチマークから構成されており、その詳細は次の通りであります。

  カテゴリー 内容
1 HPC(1項目) 連立一次方程式で、演算性能を評価(Linpack-HPCと同等)
2 PTRANS(1項目) 行列の転置(注2)で、ネットワーク(プロセス間)転送性能を評価
3 STREAM(8項目) シングル環境と多重負荷時(注3)のメモリ性能を評価
4 Random Access
(3項目)
シングル環境と多重負荷時のメモリのランダムアクセス(インダイレクトアクセス)の性能を評価。
プロセス間のデータアクセス性能(注4)を評価
5 Latency、Bandwidth
(10項目)
プロセス間のアクセスの立ち上げ時間(レイテンシー)を評価、ネットワーク性能が評価される。
ノード間の転送性能(Bandwidth)を評価
6 DGEMM(2項目)
シングル環境及び多重負荷時の行列積の演算性能を評価
7 FFTE(3項目)
FFT(高速フーリエ変換)(注5)の演算性能を評価
シングル環境、多重負荷時、トータル性能評価(注3)

今回のベンチマークにおいて今回東北大学から登録されたSX-7は、このベンチマークをSX-7シングルノードで実行したもので、評価28項目の中でシングル環境と多重負荷時のメモリ性能(STREAM)で全8項目、プロセス間の転送性能(Bandwidth)で4項目、シングル環境及び多重負荷時の行列積の演算性能(DGEMM)で2項目、FFTの演算性能の2項目と16項目において、世界トップの記録を達成いたしました。

HPCチャレンジベンチマークは、Linpackに加えて、実際の計算処理では重要となるメモリバンド幅やネットワークなどの基本性能や、実際の応用ソフトウェアにおいて多用される基本演算である行列積、FFTの性能を幅広く評価するものであり、これらの評価から、SX-7はバランスの取れた実効性能の高いシステムであることが実証されております。

NECは、今後Linpackを補完する、より総合的なベンチマークであるHPCチャレンジベンチマークにおいて、多くの項目で世界一を目指し、高い実効性能のスーパーコンピュータを提供していく所存であります。

このたびのベンチマーク結果の詳細(28項目別結果)につきましては、別紙をご参照ください。

以上


(注1) 2004.12.13現在49件、15機種が登録
(注2) 行列の転置
一般的に、行列はA(i,j)と表すが、この各要素を行列の行と列に関して入れ替えることが「転置」である。また、結果的に、A(j,i)の形で格納されることが、行列の転置となる。行列のデータはメモリ領域に入っているが、転置を行うと、メモリ領域で、データが全部入れ替えることになるので、非常に負荷が高い操作になる。さらに、分散して行列を格納している場合、転置を行うと、分散していたデータ全部の入れ替えを、繋いでいるネットワークを介して行うことになる。このとき、ネットワークを介した転送に非常な負荷がかかるため、行列転置によって、転送性能のがわかる。
(注3) シングル環境と多重負荷時、トータル性能評価
最近のコンピュータは、1つのシステムでCPUを複数使えるようになっているが、CPU以外の部分については共有しているため、複数のプログラムを同時に実行するとリソースの奪い合いがおこる。これを避ける方法として、プログラムを1個しか流さないことであり、これがシングル環境での実行である。この場合には、CPUの性能がフルに発揮される。逆に、複数プログラムを同時に流した場合、シングル環境で流した場合よりも性能が劣化するが、その劣化具合を調べるのが多重負荷時の実行である。この2つを調べることにより、システムの性能を見ることが可能である。トータル性能とは、複数CPUがある場合、全部のCPUを同時に使って単一のプログラムを実行した場合の性能であり、一つのシステム全体でどの程度性能があるかを調べることが可能である。
(注4) プロセス間のデータアクセス性能
同時にプログラムが流れているとき(プロセスが複数あるとき)その間で、情報のやり取りが必要となることがあり、このプロセス間のデータのやり取りの性能を調べる指標としてバンド幅とレイテンシーがある。バンド幅は、データを転送するときの線の太さを指し、データ転送時間が速いことを帯域が大きいと言う。レイテンシーは、相手にデータが届くまでのアクセス時間であり、バンド幅は、大量のデータを送るときに影響し、レイテンシーは、小データを複数回大量に送るときに影響する。
(注5) FFT(高速フーリエ変換)
FFTは、波の解析で使うフーリエ変換を理論的に高速に計算する方法である。フーリエ変換は、音声の周波数成分分析や画像処理、天気予報のモデルの中に出ている。携帯電話では、音声をデジタル化した時のノイズフィルターにFFTは使われるなど、知らないところでFFTの恩恵を受けている。

<本件に関するお客様からのお問い合わせ>

HPC販売推進部

電話: (03)3798-9131
E-mail: info@hpc.jp.nec.com


本文ここまで
ページトップに戻る
プレスリリーストップに戻る
Copyright© NEC Corporation 1994-2004