高速・高安定型マトリクスソルバライブラリ Super Matrix Solver

      MultiFrontal(マルチフロンタル)法に基づく直接法ソルバ
      Super Matrix Solver MF

Super Matrix Solver MF の特長

■マルチフロンタルアルゴリズムに基づく直接法です。
■アルゴリズム(オーダーリング)の改良によりFill-inを少なくし、計算を高速化しました。
■共有メモリ環境での並列処理(OpenMP)に対応しています。
■少ない引数(パラメータ)で手軽に利用できます。
■反復法では解けない優対角性の無い行列など幅広い行列を安定的に計算することができます。
■Out-of-Coreで計算できます。

MFの概略仕様

項目 内容 備考
対象とする解析分野 構造解析・電磁場解析など  
対象とする係数行列 有限要素法、有限体積法、差分法などの離散化手順により作成される疎行列 密行列の計算も可能ですが、疎行列の計算で性能を発揮します
対角に0要素のある問題 計算可能 非優対角の問題も計算可能
要素のデータ型 実数(倍精度)、複素数(倍精度)  
問題の対称性 非対称問題も計算可能 Skew/Hermit対称にも対応
計算可能な行列サイズ 1GBの実メモリが使用可能な場合の目安
2次元の問題:
  約100万元(In-Core)、約500万元(Out-of-Core)
3次元の問題:
  約20万元(In-Core)、 約80万元(Out-of-Core)
 
入力データ 係数行列、右辺定ベクトル  
出力データ 解ベクトル  
エラーメッセージ 戻り値としてワーニング、エラーメッセージを返す。(計算情報、システム情報など)  
提供方式 DLL形式(WINDOWS)、
スタティックライブラリー形式(Linux、UNIX)
ソースコードは開示しません
付属資料 説明書(データフォーマット/パラメータ/組込手順などの説明資料)、サンプルデータ,MF組込用サンプルプログラム(C,FORTRAN)  

Super Matrix Solver MF の性能例

他の解法と本マルチフロンタル法とのFill-in数による性能比較
(当社マルチフロンタル法のFill-inを1とした場合の比較)


SparseLU及び他のマルチフロンタル(MF)法については実計算時間ではなく、Fill-inによる性能が論文発表されているため、同じくFill-inで比較した。Fill-Inが少ないほど計算量が少なくなるため計算が速くなる。

SX-Aurora TSUBASA版 Super Matrix Solver MF

Super Matrix Solverをベクトルマシン向けにチューニング

疎行列向けソルバ「SMS-MF」はXeon CPUと比較して1.4~2.6倍の高速化を実現

Super Matrix Solver-MFの速度比較(未知数:1,100,000)

※マシンスペック SX-Aurora TSUBASA:SX-Aurora TSUBASA A300-4 Type10B/1VE 8コア

Linux:Intel(R) Xeon(R) Silver 4108 CPU @ 1.80GHz 2CPU×16コア

SX-Aurora TSUBASAシリーズ - アプリケーションのご紹介

適用事例

FCBI法と呼ばれる有限要素法による流体数値解析スキームの研究にSMS-MFを適用
>> マサチューセッツ工科大学 客員研究員 工学博士 河野 晴彦様

非線形地震応答解析による地盤・構造物の耐震設計
>> 東電設計株式会社 新領域研究開発推進室様


詳細資料

カタログ/資料ダウンロードページに下記の資料がございますので、ダウンロードしてご利用ください。
■MF製品情報(PDFファイル/375KB)

Version 3での計算スピード向上

Version 3では、さらなるオーダリングアルゴリズムの改良、ソースコードの最適化等により、Version 2に比べ大幅なスピード向上を実現しました。

性能向上(Version 2との比較)例

Data 計算時間[秒] 計算速度比
Version 2 Version 3 Ver. 3/Ver. 2
Data1(50400元) 138.00 14.45 9.55
Data2(11253元) 17.50 4.05 4.33
Data3 (3615元) 0.45 0.44 1.04

[テスト環境]   CPU: Intel Xeon 3.06GHz, Memory: 2GByte, OS: Windows XP (32-bit)


共有メモリ環境での並列処理に対応(Version 3)

並列処理(Open MP)化により、最近主流になりつつあるDual/Quad Core タイプのCPUなどの共有メモリ環境においては、より高速に計算を実行可能です。

並列処理による速度向上例

Data 計算時間[秒] 台数効果
1CPU 2CPU 4CPU 1CPU 2CPU 4CPU
Data A(300000元) 134.49 102.27 90.61 1.31 1.48
Data B (50400元) 11.08 9.95 8.97 1.11 1.23

[テスト環境]   CPU: Intel Core2 Quad 2.4GHz, Memory: 4GByte, OS: Windows XP x64 (64-bit)


より大規模な In-Core 計算に対応(Version 3.1)

ますます搭載メモリの大容量化が進むデスクトップPC環境に対応して、Version 3.1では64bit環境において使用メモリを事実上制限なく設定可能になりました。これにより、従来よりさらに大規模なマトリクスに対してもオンメモリでの計算が可能となります。

稼働環境

  Windows Linux SX-Aurora
TSUBASA
32ビット 64ビット 32ビット 64ビット 64ビット
Version 3.1 × ×

 ○:対応済み、×:非対応、-:未対応


(注)本資料は性能を保証するものではありません。また仕様は無断で変更される場合があります。