本ウェブサイトでは、JavaScriptおよびスタイルシートを使用しております。
お客さまがご使用のブラウザではスタイルが未適応のため、本来とは異なった表示になっておりますが、情報は問題なくご利用いただけます。
Oracle Grid Centerに設置した、大規模SMPサーバ「Express5800/スケーラブルHAサーバ」、ストレージ「iStorage D3」環境上で、1TBのデータウェアハウスを構築し、Oracle Database 11g Release 2の新機能である「In-Memory Parallel Query」の有効性を検証しました。
実際のデータウェアハウスを想定した検証モデルに対して、従来と比較し、約5〜9倍高速化することを実証しました。
一般ユーザは約5倍、経営層ユーザは約9倍、クエリが高速化することを実証しました。

これは、Express5800/スケーラブルHAサーバの持つ大量のCPU/メモリを、Oracle Database 11g Release2の新機能である「In-Memory Parallel Query」が効率的に活用したためです。
一般ユーザの発行する短期間のクエリは、In-Memory Parallel Queryで処理され高速化されました。
一方、経営層ユーザは、長期間のクエリを発行するため、データをメモリへキャッシュできず、従来通りディスクアクセスが発生します。
ただし、従来までは、全てのユーザ(一般ユーザ、経営層ユーザ)がI/Oリソースを使用していましたが、11g R2では、数の少ない経営層ユーザが占有できます。
これにより、長期間のクエリも大幅に高速化することを確認しました。

また、基礎検証として、以下の組み合わせの有効性を実証しました。
メモリサイズより大きな表は、メモリ上へ展開することはできず、In-Memory Parallel Queryとなりません。
しかし、Partitioning機能を用い、小さく分割したパーティション表に対しては、In-Memory Parallel Queryを適用できるため、高速化を実現できます。

In-Memory Parallel QueryとPartitioningの組み合わせにより、頻繁に発行される月ごとや四半期ごとのクエリに対して、従来と比較し、約5倍高速化されることを実証しました。
※本検証では、7年分の売上データを保持する大規模表に対して、レンジパーティションで、月ごとにパーティション表を作成しています。

Partitioningに加えて、圧縮機能を組み合わせることで、さらに大量のデータをメモリ上に展開し、In-Memory PQの適用範囲を広げることができます。
検証では、1TBの表を約1/2に圧縮し、In-Memory PQの適用範囲が2倍に拡大されることを確認しました。
また、圧縮により、非圧縮のときと比較して高速化の度合いが大きくなり、約9倍、レスポンスタイムが改善することを実証しました。

Enterprise Managerを使用し、データベースを管理することで、今まさに実行されている、In-Memory Parallel Queryを確認し、チューニングを実施することが可能です。
パーティション・アドバイザ、圧縮・アドバイザにより、パーティショニングの効果や圧縮率の見積もりも実施できます。
本検証においても、Enterprise Managerを使用し、管理コストを大幅に削減できました。

実際のデータウェアハウスでの利用シーンを想定し、検証を実施しました。
下記のように、データウェアハウスのユーザを、一般ユーザ、経営層ユーザの2つに分けた検証モデルを作成し、In-Memory Parallel Queryの有効性を確認しました。
| 検索期間 | 検索期間 | ユーザ数 |
|---|---|---|
| 一般ユーザ | 短期(直近) | 多い |
| 経営層ユーザ | 長期 | 少ない |
また、基礎検証では、シングルユーザからクエリを発行し、 In-Memory Parallel QueryとPartitioning、Advanced Compression、Enterprise Managerを組み合わせたときの基礎性能を確認しました。
検証内容・結果、および検証の詳細につきましては、検証報告書をご覧ください。
本検証で使用した代表的なOracle Database 11gの機能は以下の通りです。
メモリー上でSQLの並列処理を行い、高い検索性能を実現する機能です。
データ圧縮機能と組み合わせ、より多くのデータをメモリ上に展開することで、さらに高いパフォーマンスが得られます。
表や索引を、データの特性や利用目的に合わせ、期間や範囲などの論理単位で分割する機能です。
必要なデータが存在するパーティションにのみアクセスするため、大規模データベースでは大幅なレスポンスの向上が実現できます。
また、管理性や可用性の向上にも効果的です。
データを圧縮する機能で、最小限のコストで高い圧縮率を実現します。
データ圧縮によって、ネットワーク・トラフィックやデータ・バックアップの削減にもつながります。
さらに、ディスクから読み取るブロックの数が減少するため、問合せのパフォーマンスも向上します。
Webブラウザからデータベースの監視、管理、各種作業を実施する管理ツールです。
視覚的な性能監視を提供し、管理の効率化を実現します。
また、自動性能チューニング機能を提供し、性能問題の早期解決が可能です。
今回の検証では、高い拡張性を備えるExpress5800/スケーラブルHAサーバをデータベースサーバとし、Oracle Database 11g Release 2をインストールし、4GbpsのFibre Channel(以降、FC)4本で接続されたiStorage D3上にデータベースを配置し、検証しました。
| モデル | Express5800/A1160 |
|---|---|
| CPU | 4コア インテル® Xeon® プロセッサ E7440 (2.4GHz) x 8 計32コア |
| メモリ | 128 GB |
| モデル | iStorageD3-10 |
|---|---|
| ホストインタフェース | Fibre Channel 4Gbps× 4 |
| キャッシュメモリ | 4GB |
| ディスクドライブ | SAS 147GB(15,000rpm) × 36 |
| OS | Red Hat Enterprise Linux 5 Update 3 |
|---|---|
| データベース | Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 (ASM使用) Oracle Partitioning |
| 運用管理ソフトウェア | WebSAM iStorageManager Ver6.2 Oracle Enterprise Manager 10g Release5 |
【構成図】
Oracle Database 11g Release 2 In-Memory Parallel QueryによるNEC Express5800/スケーラブルHAサーバ上でのData Warehouseシステム全体の性能向上(1,863KB)