Sun Ultra24 Workstation での GSL の CBLAS の SGEMM の性能
Sun Ultra 24 Workstation (プロセッサは Intel Core2Duo E8600 (3.3GHz)) で GSL (GNU Scientific Library) の CBLAS の SGEMM の性能を測った。
結果は以下図(行列サイズは16の倍数)。僕が実装したスカラーとブロックの行列乗算アルゴリズムと比較した(ブロックのは、8x8でブロック化)。時間があったら他のBLASも試す。