GPUを使用した最初のスーパーコンピュータ であるTitan
GPUクラスター (英 : GPU cluster )は、各ノードにグラフィックスプロセッシングユニット (GPU)を搭載したコンピュータ・クラスター である[1] 。GPUクラスターでは、汎用グラフィックスプロセッシングユニット (GPGPU)による最新のGPUの計算能力を利用することで、非常に高速な計算を行うことができる。
ハードウェア
GPU種類
GPUクラスターは、採用するGPUによってヘテロジニアスとホモジニアスの2つに分類することができる。
ヘテロジニアス
主要な独立系ハードウェア企業 (英語版 ) (例:AMD とnVidia )の両方のハードウェアが使用される。同じGPUの異なるモデル(たとえば8800GTと8800GTXの混在)を使用した場合もヘテロジニアスクラスターとみなされる。
ホモジニアス
すべてのGPUが同じハードウェアクラス、メーカー、モデルであること(たとえば数100個の8800GTと同量のメモリで構成されるホモジニアスクラスター)。
GPUの種類によって利用できる機能が異なるため、上記の意味に基づいてGPUクラスターを分類することは、クラスター上でのソフトウェア開発を大きく方向付けることになる。
インターコネクト
コンピュータノードとそれぞれのGPUに加えて、ノード間でデータをやり取りするためには、十分な速度のインターコネクト(相互接続)が必要である。インターコネクトの種類は、存在するノードの数に大きく依存する。インターコネクトの例としてはギガビット・イーサネット やInfiniBand などがある。
ソフトウェア
多数のGPU搭載マシンを1つのマシンとして動作させるために必要なソフトウェアコンポーネントには、次のものがある。
オペレーティング・システム
各クラスタノードに搭載された各GPUタイプに対応したGPUドライバ 。
クラスタリングAPI (メッセージパッシングインターフェイス 、MPIなど)。
AMAX (英語版 ) のVirtualCL(VCL)クラスタ・プラットフォームは、OpenCL のラッパーであり、ほとんどの変更されていないアプリケーションが、すべてのデバイスがローカル・コンピュータ上にあるかのように、クラスタ内の複数のOpenCLデバイスを透過的に利用できる。
アルゴリズムマッピング
GPUクラスターで動作するためのアルゴリズムのマッピングは、従来のコンピュータ・クラスター で動作するためのアルゴリズムのマッピングに多少似ている。例: 配列の一部をRAM から分割するのではなく、テクスチャ をGPUクラスターのノードに分割する。
ベンダー
NVIDIA は、Tesla 20シリーズGPGPUを使用して完全に構成されたGPUクラスターを構築して提供する能力を持つ、専用のTesla Preferred Partner (TPP)のリストを提供している[2] 。AMAX Information Technologies (英語版 ) 社、Dell 社、Hewlett-Packard 社、Silicon Graphics 社は、GPUクラスターとシステムの完全なラインナップを提供する数少ない企業である。
参照項目
脚注
^ Kindratenko, Volodymyr V.; Enos, Jeremy J.; Shi, Guochun; Showerman, Michael T.; Arnold, Galen W.; Stone, John E.; Phillips, James C.; Hwu, Wen-mei (2009). “GPU clusters for high-performance computing” . 2009 IEEE International Conference on Cluster Computing and Workshops (New Orleans, LA, USA: IEEE): 1–8. doi :10.1109/CLUSTR.2009.5289128 . ISBN 978-1-4244-5011-4 . http://ieeexplore.ieee.org/document/5289128/ .
^ “GPU Computing Partners ”. Nvidia. 2019年7月1日時点のオリジナル よりアーカイブ。2021年4月11日 閲覧。
外部リンク