<div style="text-align: left;"><img src="https://www.juliabox.org/assets/img/juliacloudlogo.png" style="margin: 0px 0px 0px 0px; padding-right: 20px;width: 80px; float: left;" title="" alt="" /></div>
<img src="http://dmkpress.com/images/cms/thumbs/a5b0aeaa3fa7d6e58d75710c18673bd7ec6d5f6d/978-5-97060-370-3_270_369__100.jpg" style="margin: 0px 0px 5px 20px; width: 100px; float: right;" title="" alt="" />
Всестороннее введение в новый язык программирования для научно-технических вычислений [Julia](http://julialang.org/) в книге Малколма Шеррингтона, Packt Publishing, июль 2015.

<h1>Осваиваем язык Julia</h1><br />

Совершенствование мастерства в области аналитики и программирования при помощи Julia в целях решения задач комплексной обработки данных
<div style="text-align: left;font-size:8pt;padding-top:10px;">Программный код Julia (v0.4.5) протестирован в Windows 8.1/10 и Linux/Lubuntu 16.4</div>
<div style="text-align: left;"><h1>Глава 10. Работа с Julia</h1></div>

## Внутреннее устройство
### Язык Femtolisp

### Программный интерфейс Julia

In [2]:
time_ns() = ccall(:jl_hrtime, UInt64, ())
time_ns()

0x000343c17b1449bf

## Генерация машинных кодов

In [3]:
inc(x) = x + 1

inc (generic function with 1 method)

In [4]:
code_lowered(inc,(Int64,))

1-element Array{Any,1}:
 :($(Expr(:lambda, Any[:x], Any[Any[Any[:x,:Any,0]],Any[],0,Any[]], :(begin  # In[3], line 1:
        return x + 1
    end))))

In [5]:
code_typed(inc,(Int64,))

1-element Array{Any,1}:
 :($(Expr(:lambda, Any[:x], Any[Any[Any[:x,Int64,0]],Any[],Any[],Any[]], :(begin  # In[3], line 1:
        return (Base.box)(Base.Int,(Base.add_int)(x::Int64,1))
    end::Int64))))

In [6]:
code_llvm(inc,(Int64,))


define i64 @julia_inc_1874(i64) {
top:
  %1 = add i64 %0, 1
  ret i64 %1
}


In [7]:
code_native(inc,(Int64,))

	.text
Filename: In[3]
Source line: 1
	pushq	%rbp
	movq	%rsp, %rbp
Source line: 1
	leaq	1(%rcx), %rax
	popq	%rbp
	ret


In [8]:
code_llvm(inc,(Float64,))


define double @julia_inc_1884(double) {
top:
  %1 = fadd double %0, 1.000000e+00
  ret double %1
}


In [9]:
code_native(inc,(Float64,))

	.text
Filename: In[3]
Source line: 1
	pushq	%rbp
	movq	%rsp, %rbp
	movabsq	$267743936, %rax        # imm = 0xFF572C0
Source line: 1
	addsd	(%rax), %xmm0
	popq	%rbp
	ret


In [10]:
function fib(n::Integer)
  @assert n > 0
  return (n < 3 ? 1 : fib(n-1) + fib(n-2))
end 

fib (generic function with 1 method)

In [11]:
code_lowered(fib,(Integer,))

1-element Array{Any,1}:
 :($(Expr(:lambda, Any[:n], Any[Any[Any[:n,:Any,0]],Any[],0,Any[]], :(begin  # In[10], line 2:
        unless n > 0 goto 0
        goto 1
        0: 
        ((top(getfield))(Base,:throw))(((top(getfield))((top(getfield))((top(getfield))(Base,:Main),:Base),:AssertionError))("n > 0"))
        1:  # In[10], line 3:
        unless n < 3 goto 2
        return 1
        2: 
        return (Main.fib)(n - 1) + (Main.fib)(n - 2)
    end))))

## Профилирование

In [13]:
#
# asian_iprofile.jl
#

using IProfile

@iprofile begin
  function asianOpt(N=10000,T=100;
    S0=100.0,K= 100.0,r=0.05,v=0.2,tma=0.25)
    dt = tma/T;
    S = zeros(Float64,T);
    A = zeros(Float64,N);
    for n = 1:N
      S[1] = S0
      dW = randn(T)*sqrt(dt);
      for t = 2:T
        z0 = (r - 0.5*v*v)*S[t-1]*dt;
        z1 = v*S[t-1]*dW[t];
        z2 = 0.5*v*v*S[t-1]*dW[t]*dW[t];
        S[t] = S[t-1] + z0 + z1 + z2;
      end
      A[n] = mean(S);
    end
    P = zeros(Float64,N);
    [ P[n] = max(A[n] - K, 0) for n = 1:N ];
    price = exp(-r*tma)*mean(P);
  end
end

In [14]:
using IProfile

cd(joinpath(homedir(),"julia_projects","code"))

include("asian_iprofile.jl")
asianOpt(1);

@iprofile clear

asianOpt(100000) 

2.592635596502289

In [15]:
@iprofile report

  count  time(%)   time(s) bytes(%) bytes(k)
  count  time(%)   time(s) bytes(%) bytes(k)
       1   0.00   0.000001   0.00         0  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 8, dt = tma / T
       1   0.00   0.000021   0.00         1  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 9, S = zeros(Float64,T)
       1   0.03   0.000324   0.44       800  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 10, A = zeros(Float64,N)
  100000   0.22   0.002608   0.00         0  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 12, S[1] = S0
  100000  14.70   0.171335  98.68    179200  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 13, dW = randn(T) * sqrt(dt)
 9900000  21.11   0.245931   0.00         0  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 15, z0 = (r - 0.5 * v * v) * S[t - 1] * dt
 9900000  20.78   0.242108   0.00         0  	# C:\Users\labor\julia_projects\code\asian_iprofile.jl, line 16, z1 = v

### Профилирование встроенными средствами

In [16]:
function myfunc()
    A = rand(100, 100, 200)
    maximum(A)
end

myfunc()          # выполнить один раз, чтобы вызвать компиляцию

@profile myfunc()

0.9999997403693976

In [17]:
Profile.print()

8 task.jl; anonymous; line: 447
 1 ...4\IJulia\src\IJulia.jl; eventloop; line: 139
  1 ...v0.4\IJulia\src\msg.jl; recv_ipython; line: 65
   1 ...a\v0.4\ZMQ\src\ZMQ.jl; recv; line: 525
    1 poll.jl; wait; line: 299
     1 task.jl; wait; line: 286
      1 task.jl; wait; line: 360
       1 stream.jl; process_events; line: 731
 7 ...4\IJulia\src\IJulia.jl; eventloop; line: 142
  7 ...src\execute_request.jl; execute_request_0x535c5df2; line: 182
   7 loading.jl; include_string; line: 282
    7 profile.jl; anonymous; line: 16
     3 random.jl; rand!; line: 347
      3 dSFMT.jl; dsfmt_fill_array_close_open!; line: 76
     1 reduce.jl; _mapreduce; line: 153
      1 reduce.jl; mapreduce_impl; line: 295


In [None]:
using ProfileView

ProfileView.view()

## Статический анализ кода 
### Пакет Lint

In [19]:
using Lint

lintfile("etl.jl")

etl.jl:58 W356 cat: local variable might cause confusion with a synonymous export from Base


In [3]:
function asionOpt(N::Int=10000.0,T::Int=100; S0=100.0,K= 100.0,v=0.05,v=0.2,tma=0.25)  # 1: v=0.05 вместо r=0.05
  dt = tma/T;
  S = zeros(Float64,T);
  A = zeros(Float64,N);
  for n = 1:N
    S[1] = S0 
    dW = randn(T)*sqrt(dt);
    for t = 2:T
      z0 = (r - 0.5*v*v)*S[t-1]*dt;
      z1 = v*S[t-1]*dW[t];
      z2 = 0.5*v*v*S[t-1]*dW[t]*dW[t];
            S[t] = S[t-1] + z0 + z1 + z2 + z3;               # 2: лишний терм z3
    end
    A[n] = mean(S);
  end
  P = zeros(Float64,N);
    
  @lintpragma("Print type P")                                # 3
    
  [ P[n] = max(A[n] - K, 0) for n = 1:N ];
  price = exp(-r*tma)*mean(P);
end

@lintpragma("Info me Я специально подправил этот фрагмент")  # 4

asionOpt (generic function with 3 methods)

In [4]:
asionOpt(100)

2.8323528289923416

In [None]:
cd(joinpath(homedir(),"julia_projects","code"))

using Lint

lintfile("asian_lint.jl")

## Отладка

In [None]:
#
# asian_debug.jl
#

using Debug

@debug function asianOpt(N=10000,T=100; S0=100.0,K= 100.0,r=0.05,v=0.2,tma=0.25) 
  dt = tma/T;
  S = zeros(Float64,T);
  A = zeros(Float64,N);
  for n = 1:N
    S[1] = S0 
    dW = randn(T)*sqrt(dt);
    for t = 2:T
      z0 = (r - 0.5*v*v)*S[t-1]*dt;
      z1 = v*S[t-1]*dW[t];
      z2 = 0.5*v*v*S[t-1]*dW[t]*dW[t];
      S[t] = S[t-1] + z0 + z1 + z2;
    end
    A[n] = mean(S);
    @bp
  end
  P = zeros(Float64,N);
  [ P[n] = max(A[n] - K, 0) for n = 1:N ];
  @bp
  price = exp(-r*tma)*mean(P);
end

In [None]:
cd(joinpath(homedir(),"julia_projects","code"))

using Debug

include("asian_debug.jl")

asianOpt(5)


at C:\Users\labor\julia_projects\code\asian_debug.jl:21

      20       A[n] = mean(S);
 -->  21       @bp
      22     end

debug:21> 

## Разработка пакета

In [2]:
#
# MyMod.jl
#

module MyMod

export hi, inc, fac, fib, pisq;

hi() = "Привет"
hi(who::AbstractString) = "Привет, $who"
inc(x::Number) = x + 1

function fac(n::Integer)
  @assert n > 0
  (n == 1) ? 1 : n*fac(n-1);
end

function fib_helper(a ::Integer, b::Integer, n::Integer)
  (n > 0) ? fib_helper(b, a+b, n-1) : a
end

function fib(n::Integer)
  @assert n > 0
  fib_helper(0, 1, n)
end

function pisq(n::Integer)
  (n <= 0) ? error("Нулевой или отрицательный аргумент") : begin
    s = 1.0
    for k = 1:n
      s += (-1.0)^k/(1.0 + k)^2
    end
    return 12*s
  end
end

end

MyMod

In [3]:
using MyMod

hi()

"Привет"

In [4]:
fib(11)

89

In [6]:
using MyMod
using Base.Test

@test hi("Голубоглазка") == "Привет, Голубоглазка"
@test inc(11//7)         == 18//7
@test fac(7)             == 5040
@test fib(10)            == 55
@test_approx_eq inc(2.3) 3.3 

In [7]:
@test_approx_eq pisq(100000) pi*pi

LoadError: LoadError: assertion failed: |pisq(100000) - pi * pi| <= 1.7763568394002505e-11
  pisq(100000) = 9.869604401689116
  pi * pi = 9.869604401089358
  difference = 5.997584651140642e-10 > 1.7763568394002505e-11
while loading In[7], in expression starting on line 1

In [8]:
# Проверка успешная

@test_approx_eq_eps pisq(100000) pi*pi 1.0e-6; 

In [9]:
using FactCheck

facts("MyMod - проверка арифметики") do
  @fact inc(2.3) --> 3.3         
  @fact fac(5)   --> 120        
  @fact fib(10)  --> 54         
  @fact pisq(100000) --> pi*pi  # => грубо (pi*pi, 1.0E-6)
end

MyMod - проверка арифметики
  Failure :: (line:-1) :: fact was false
    Expression: fib(10) --> 54
      Expected: 54
      Occurred: 55
  Failure :: (line:-1) :: fact was false
    Expression: pisq(100000) --> pi * pi
      Expected: 9.869604401089358
      Occurred: 9.869604401689116
Out of 4 total facts:
  Verified: 2
  Failed:   2


delayed_handler (generic function with 4 methods)

## Сообщества программистов
### Группа разработчиков JuliaAstro
#### Модели космологии

<pre>
function cosmology(;
  h = 0.69,         # Безразмерный параметр Хабла
  Neff = 3.04,      # Эффективное число нейтринных частиц
  OmegaK = 0,       # Плотность кривизны
  OmegaM = 0.29,    # Плотность материи
  OmegaR = nothing, # Плотность радиации
  Tcmb = 2.7255,    # Температура реликтового излучения
  w0 = -1,          # Уравнение состояния темной энергии…
  wa = 0 )          # ... w0 + wa*(1 - a)
</pre>

In [2]:
using Cosmology

c = cosmology()

Cosmology.FlatLCDM(0.69,0.7099122024007928,0.29,8.779759920715362e-5)

In [3]:
fieldnames(c)'

1x4 Array{Symbol,2}:
 :h  :Ω_Λ  :Ω_m  :Ω_r

In [4]:
c.Ω_Λ + c.Ω_m + c.Ω_r; 

0.9999999999999999

In [5]:
Cosmology.hubble_dist_mpc0(c)    # => расстояние Хаббла

4344.818231884058

In [6]:
Cosmology.hubble_time_gyr0(c)    # => Хаббловский возраст Вселенной

14.17121739130435

In [7]:
z = 1.7; Cosmology.Z(c,z)

1.1096021745670541

In [8]:
Cosmology.hubble_dist_mpc(c,z) 

1714.4094327823723

In [9]:
Cosmology.hubble_time_gyr(c,z)

5.591780247876224

In [10]:
comoving_transverse_dist_mpc(c, z)   # =>  Мпк (мегапарсек)

4821.019758197134

In [11]:
angular_diameter_dist_mpc(c,z)       # =>  Мпк

1785.562873406346

In [12]:
luminosity_dist_mpc(c,z)             # =>  Мпк

13016.753347132264

In [13]:
comoving_volume_gpc3(c,z)            # =>  гигапарсек3 (Gpc3)

469.3592091342582

In [14]:
age_gyr(c,z)                         # => триллион лет

3.872075267473227

### Гибкая система передачи изображений
#### Высокоуровневый API

In [16]:
cd(joinpath(homedir(),"julia_projects","space"))

using FITSIO

f001a = FITS("f001a066.fits")

File: f001a066.fits
Mode: "r" (read-only)
HDUs: Num  Name  Type   
      1          Image  


In [17]:
fieldnames(f001a)'

1x4 Array{Symbol,2}:
 :fitsfile  :filename  :mode  :hdus

In [18]:
f001a[1]

File: f001a066.fits
HDU: 1
Type: Image
Datatype: Int16
Datasize: (7055,7055)


In [19]:
ndims(f001a[1])

2

In [20]:
size(f001a[1]) 

(7055,7055)

In [22]:
data = read(f001a[1]);
header = read_header(f001a[1]);

In [23]:
length(header)    

128

In [24]:
header["BITPIX"]

16

In [25]:
header["SCANIMG"]

"XJ295_A066_01_00.PIM"

In [26]:
header["TELESCOP"]

"Palomar 48-in Schm"

In [27]:
getcomment(header,"TELESCOP")

"Telescope where plate taken"

In [28]:
header["SITELAT"]

"+33:24:24.00"

In [29]:
header["SITELONG"]

"-116:51:48.00"

In [None]:
f = FITS("newfile.fits", "w")
data = reshape([1:120000], 300, 400);
write(f, data)                     # Записать новое расширение с визуальными данными
write(f, data; header=header)   # а также заголовок
close(f)

#### Низкоуровневый API

In [None]:
cd(joinpath(homedir(),"julia_projects","space"))

using FITSIO
using FITSIO.Libcfitsio

# Низкоуровневый API реализован в подмодуле Libcfitsio

f001 = fits_open_file("f001a066.fits")

n = fits_get_hdrspace(f001)[1]; # => 128

for i = 1:n
   println(fits_read_keyn(f001,i))
end

### Группа разработчиков JuliaGPU

In [5]:
using OpenCL

pf = OpenCL.devices()

3-element Array{OpenCL.Device,1}:
 OpenCL.Device( Intel(R) Core(TM) i3-3217U CPU @ 1.80GHz on Intel(R) OpenCL @0x0000000000fe93e0)
 OpenCL.Device(Intel(R) HD Graphics 4000 on Intel(R) OpenCL @0x00000000111b1840)                
 OpenCL.Device(GeForce GT 710M on NVIDIA CUDA @0x0000000011733a60)                              

In [18]:
#
# cl_platforms.jl
#

function cl_platform(pname)
    
  @printf "\n%s\n\n" pf
    
  for pf in OpenCL.platforms()
        
    if contains(pf[:name],pname)
            
      @printf "\n\n%s\n\n" pf
      @printf "Название платформы:\t\t%s\n" pf[:name]
            
      if pf[:name] == "Portable Computing Language"
        warn("PCL-платформа пока не поддерживается")
        continue
      else
        @printf "Профиль платформы:\t\t%s\n" pf[:profile]
        @printf "Поставщик платформы:\t\t%s\n" pf[:vendor]
        @printf "Версия платформы:\t\t%s\n\n" pf[:version]

        for dv in OpenCL.available_devices(pf)
          @printf "Имя устройства:\t\t\t%s\n"               dv[:name]
          @printf "Тип устройства:\t\t\t%s\n"               dv[:device_type]
          @printf "Объем ОЗУ:\t\t\t%i MB\n"                 (dv[:global_mem_size] / (1024*1024))
          @printf "Макс. размер выделяемой памяти:\t%i MB\n" (dv[:max_mem_alloc_size] / (1024*1024))
          @printf "Макс. тактовая частота:\t\t%i MHZ\n"     (dv[:max_clock_frequency])
          @printf "Макс. число блоков вычислений:\t%i\n"  (dv[:max_compute_units])
          @printf "Макс. размер рабочей группы:\t%i\n"    (dv[:max_work_group_size])
          @printf "Макс. размер рабочего элемента:\t%s\n\n" (dv[:max_work_item_size])
        end 
                
      end
    end
  end
end

cl_platform (generic function with 1 method)

In [19]:
using OpenCL

cl_platform("Intel")


[OpenCL.Device( Intel(R) Core(TM) i3-3217U CPU @ 1.80GHz on Intel(R) OpenCL @0x0000000000fe93e0),OpenCL.Device(Intel(R) HD Graphics 4000 on Intel(R) OpenCL @0x00000000111b1840),OpenCL.Device(GeForce GT 710M on NVIDIA CUDA @0x0000000011733a60)]



OpenCL.Platform('Intel(R) OpenCL' @0x00000000109f07c0)

Название платформы:		Intel(R) OpenCL
Профиль платформы:		FULL_PROFILE
Поставщик платформы:		Intel(R) Corporation
Версия платформы:		OpenCL 1.2 

Имя устройства:			 Intel(R) Core(TM) i3-3217U CPU @ 1.80GHz
Тип устройства:			cpu
Объем ОЗУ:			6030 MB
Макс. размер выделяемой памяти:	1507 MB
Макс. тактовая частота:		1800 MHZ
Макс. число блоков вычислений:	4
Макс. размер рабочей группы:	1024
Макс. размер рабочего элемента:	(1024,1024,1024)

Имя устройства:			Intel(R) HD Graphics 4000
Тип устройства:			gpu
Объем ОЗУ:			1400 MB
Макс. размер выделяемой памяти:	350 MB
Макс. тактовая частота:		1050 MHZ
Макс. число блоков вычислений:	16
Макс. размер рабочей группы:	512
Макс. размер рабочего элемента

In [21]:
#
# cl_gpu_calc.jl
#

import OpenCL

const cl = OpenCL
const kernel_source = """
  __kernel void mmul(
  const int Mdim, const int Ndim, const int Pdim,
  __global float* A, __global float* B, __global float* C) {
    int k;
    int i = get_global_id(0);
    int j = get_global_id(1);
    float tmp;
    if ((i < Ndim) && (j < Mdim)) {
      tmp = 0.0f;
      for (k = 0; k < Pdim; k++)
        tmp += A[i*Ndim + k] * B[k*Pdim + j];
        C[i*Ndim+j] = tmp;
    }
  }
"""

const ORDER = 1024; # Порядок квадратных матриц A, B и C
const TOL = 0.001;  # Точность (tolerance) вычислений с плавающей тчк
const COUNT = 3;    # Число прогонов

Ndims = 1024
sizeN = ORDER * ORDER;
h_A = float32(randn(ORDER)); # Заполнить массив случайными числами
h_B = float32(randn(ORDER)); # --- то же самое --
h_C = Array(Float32, ORDER); # Массив результатов

ctx = cl.Context(cl.devices()[2]);
queue = cl.CmdQueue(ctx, :profile);

d_a = cl.Buffer(Float32, ctx, (:r,:copy), hostbuf = h_A);
d_b = cl.Buffer(Float32, ctx, (:r,:copy), hostbuf = h_B);
d_c = cl.Buffer(Float32, ctx, :w, length(h_C));

prg = cl.Program(ctx, source=kernel_source) |> cl.build!
mmul = cl.Kernel(prg, "mmul");

for i in 1:COUNT
  fill!(h_C, 0.0);
    
  global_range = (ORDER, ORDER);
  mmul_ocl = mmul[queue, global_range];
  evt = mmul_ocl(Int32(ORDER), Int32(ORDER), Int32(ORDER), d_a, d_b, d_c);
  run_time = evt[:profile_duration] / 1e9;
  cl.copy!(queue, h_C, d_c);
    
  mflops = 2.0 * Ndims^3 / (1000000.0 * run_time);
    
  @printf "%10.8f сек. за %9.5f мегафлопс\n" run_time mflops
end

0.74296528 сек. за 2890.42262 мегафлопс




0.65634264 сек. за 3271.89416 мегафлопс
0.65047216 сек. за 3301.42284 мегафлопс


In [85]:
#
# cl_mmul.jl
#

import OpenCL

const cl = OpenCL
const mult_kernel = """
   __kernel void mult(__global const float *a,
                      __global const float *b,
                      __global float *c)
    {
      int gid = get_global_id(0);
      c[gid] = a[gid] * b[gid];
    }
"""

const N = 100_000;

a = rand(Float32, N);
b = rand(Float32, N);

device, ctx, queue = cl.create_compute_context();

a_buff = cl.Buffer(Float32, ctx, (:r, :copy), hostbuf=a);
b_buff = cl.Buffer(Float32, ctx, (:r, :copy), hostbuf=b);
c_buff = cl.Buffer(Float32, ctx, :w, length(a));

p = cl.Program(ctx, source=mult_kernel) |> cl.build!;
k = cl.Kernel(p, "mult");

tm = @elapsed cl.call(queue, k, size(a), nothing, a_buff, b_buff, c_buff);

@printf "Время выполнения: %f\a sec.\n" tm

Время выполнения: 0.459816 sec.
