2次元配列: Sample 1: 2次元配列への代入(FORTRAN)

高速化プログラミング   
トップ  >  メモリジャンプと高速化  >  2次元配列  >  Sample 1: 2次元配列への代入(FORTRAN)

2次元配列: Sample 1: 2次元配列への代入(FORTRAN)

言語の変更:   C版   JScript版

■ 概要

このサンプルでは正方マトリックスに値を単に代入するという非常に単純なプログラムを示します。ここでは2重ループを使って値を代入します。ループの順番から考えると、以下の2通りのコーディングの仕方があります。

Code 1では内側ループ(ループj)はマトリックスの列(第2の指数)に関連付けられます。一方、Code 2では行(第1の指数)に関連付けられます。マトリックスのサイズnは1000から30000までの30個の値を採用します。各nに対してマトリックスへの代入にかかった時間を測定し出力します。

■ ソースコード


  ◆ Code 1   ◆ Code 2
 
c Program to measure time to initialize a nxn matrix to a value.
c  a(i,j) = 1 for i=1,...,n, and j=1,...,n.
      program main
      implicit none
      integer i, j, k, n
      integer, allocatable :: a(:,:)
      integer*8 time0, time1, dtime
      real*8 time
c
      write(*,*)"Matrix size    Elapsed time [sec]"
      do k=1,30
c Matrix size
        n = k * 1000

c Allocation
        allocate(a(n,n))

c Start time
        call system_clock(time0)

c Main calculation: initialization
        do i=1,n
          do j=1,n
            a(i,j) = 1
          end do
        end do

c Finish time
        call system_clock(time1, dtime)

c Output time
        time = 1d0*(time1-time0)/dtime
        write(*,"(i12,f16.7)")n, time

c Deallocation
        deallocate(a)
      end do

      end program

    
 
c Program to measure time to initialize a nxn matrix to a value.
c  a(i,j) = 1 for i=1,...,n, and j=1,...,n.
      program main
      implicit none
      integer i, j, k, n
      integer, allocatable :: a(:,:)
      integer*8 time0, time1, dtime
      real*8 time
c
      write(*,*)"Matrix size    Elapsed time [sec]"
      do k=1,30
c Matrix size
        n = k * 1000

c Allocation
        allocate(a(n,n))

c Start time
        call system_clock(time0)

c Main calculation: initialization
        do i=1,n
          do j=1,n
            a(j,i) = 1
          end do
        end do

c Finish time
        call system_clock(time1, dtime)

c Output time
        time = 1d0*(time1-time0)/dtime
        write(*,"(i12,f16.7)")n, time

c Deallocation
        deallocate(a)
      end do

      end program

    

■ 計算時間の測定結果

Code 1Code 2を実行したときの計算時間をそれぞれ青線と赤線で図1に示します。そして両者の比を緑線で示します。

測定時間
図1 測定時間

■ 考察

FORTRAN言語では2次元配列を列単位で1次元配列に組みなおされるので、内側のループが行に関連付けられたCode 1は図2のように飛び飛びしたメモリアクセスになります。一方、内側のループが行に関連付けられたCode 2は図3のように連続したメモリアクセスになります。

Code 1のときのメモリアクセス
図2 Code 1のときのメモリアクセス
Code 2のときのメモリアクセス
図3 Code 2のときのメモリアクセス

さて図1ではCode 1Code 2より計算時間が長いという結果を得ました。これはメモリアクセスのジャンプが頻繁に起こるためです。サイズnが大きくなるにつれてCode 1Code 2との計算時間の比率が増えていき、Code 1Code 2より50倍近く遅くなることもあります。言い換えれば、メモリアクセスのジャンプを避ければ、50倍も速いコードを書けるということがいえます。



はじめに

演算数を減らす

メモリジャンプを減らす

高性能のアルゴリズム

その他



3 4 9 0 5 4