Optimization

Optimizations for Fortran or C compilers

Last modified: 2014/08/17

cray：

g77 :

g95 :

pgfortran : (ver. 12.5)

-byteswapio
Little or Big endian をデフォルトとは逆にする
-fast
最適化
-fastsse
SSE命令の最適化
-fPIC
他のコンパイラとの互換性を有する独立コードを生成。
-pc [32/64/80]
浮動小数点計算時のアーキテクチャ上レジスタビット長制御
-time
コンパイルステップ毎の実行時間を表示
-tp [sandybridge-64/istanbul-64/bulldozer-64]
クロスコンパイル時のCPUアーキテクチャ毎の最適化
http://www.softek.co.jp/SPG/Pgi/TIPS/cross.html
-Mconcur
自動並列化
-Mipa=fast
最適化
-Minfo
コンパイル時の情報を標準出力する
-Mfree
F90ソースコードとして認識させる
-mp
OpenMPディレクティブを有効にする
-pc 64 -Kieee -O0 -Ktrap=fp -Minform=inform -Mbounds -Mvect=noassoc -Mlre=noassoc
バグ取り用

参考URL：

ifort (ver.11 - 13) ：

-assume byterecl
(指定したレコード長)*4byte をバイナリファイルの1レコード長にする。 pgi や gccコンパイラなどでは、指定したレコード長をデフォルトで(指定したレコード長)*4byte とするが、 ifortでは指定したレコード長で1レコード長が決まるため.
-convert big_endian
- ファイルの処理をbig endianで行う。(g77 にはない)
-o
- デフォルトで作成される実行ファイル(a.out,a.exe)を、-o 以下に続くファイル名に変える。
- (e.g.) ifort hoge.f -o jikkou.exe => jikkou.exe が実行ファイル。
-mcmodel=[small/medium/large]
- Memoryが2GBを越える配列を使用する場合のオプション.
- デフォルトは "small"
-xSSE[2/3/4.1/4.2], -msse[2/3]
- アーキテクチャ毎の最適化オプション.
-unroll0
ループアンロールを無効にする.
-parallel
- 自動並列化を有効にして、マルチスレッド・コードを生成.
-par-report2
自動並列化の状態を表示.
-fno-alias
- 外部関数からのエイリアシング解消(ポインタ関連).
-O0 -check all -warn all -gen_interfaces -fpe0 -ftrapuv -traceback -assume byterecl
バグ取り用

gfortran :

-fconvert=big-endian : ファイルの処理をbig endianで行う.
-O0 -Wall -Wuninitialized -ffpe-trap=invalid,zero,overflow -fbounds-check -frecord-marker=4
バグ取り用

AMD x86 open64 Compiler :

C のOptimization (icc で確認)

Intel Compiler (ver.11 - 12くらい) ：

CPP のOptimization

- -C : コメント行等を保持したまま実行
- これをUbuntu 13.10 上の cpp で付加して実行すると、cpp のコメントも挿入してしまう場合がある。
- 特にFortranのマクロを食わせる場合に注意。

参考URL：

Page updated

Google Sites

Report abuse