In [2]:
import matplotlib.pyplot as plt
from matplotlib import cm
import numpy as np

%matplotlib notebook
#%matplotlib inline


plt.rcParams["font.family"] = "serif"
plt.rcParams["mathtext.fontset"] = "dejavuserif"
#plt.rcParams['figure.dpi'] = 150

In [3]:
def example():
    
    '''Plots delta function f(t) = delta(t - tau)
    and its Laplace Transform F(s) = exp(-tau*s)
    F(s) = L[f(t)]'''
    
    tau = 1
    s = np.linspace(0.1, 10, 100)
    F = np.exp(-tau*s)

    def delta(x, pos):
        f = []
        for dx in x:
            if dx == pos:
                f.append(1)
            else: 
                f.append(0)
        return np.asarray(f)

    t = s**-1
    f = np.zeros(1001)
    f = delta(t, tau)
    fig = plt.figure()
    ax  = fig.add_subplot(111)
    ax.set_xlabel('$t$ or $1/s$')
    ax.set_xscale('log')
    #ax.set_yscale('log')
    ax.plot(t, f, 'r', label = r'f(t)')
    ax.plot(s, F, 'b', label = r'$F(s)=\mathcal{L}\left\{f(t)\right\}$')
    ax.annotate(r'$e^{-\tau s}$',    xy = (2, 0.5),   c='b', fontsize = 13)
    ax.annotate(r'$ \rightarrow $', xy = (3.5, 0.5), c='k', fontsize = 13)
    ax.annotate(r'$\delta(t-\tau)$', xy = (5, 0.5),   c='r', fontsize = 13)
    ax.legend()
#example()

# Inverse the Laplace Transfom using L1 regression methdod

## The point
The point is to determine the decay rate $\tau$ of the exponential function $F(S) = e^{-\tau s}$ using numerical routines for Inverting the Laplace Transform. For exponential continous function $F(s)$, for $\text{Re}(s) > 0$:
$$F(s) = \sum_{i=0}^{n} \exp{\left(-\tau_i s\right)}$$
$$f(t) = \mathcal{L}^{-1}\left\{F(s)\right \} = \sum_{i=0}^{n} \delta(t - \tau_i)$$

In [4]:
example()

<IPython.core.display.Javascript object>

## Numerical Laplace Transform

For this, we replace (1) with finite-difference approximation (2) from <a href="https://sci-hub.st/https://doi.org/10.1137/0730038">[1]</a>:

$$F(s) = \int_0^{\infty} \exp{(-st)}f(t)dt\text{   (1);}$$

$$ \mathbf{Y} = \mathbf{X}\vec{\beta}+\vec\epsilon\text{    (2),}$$

where $\mathbf{X}$ - discrete approximation of Laplace transform;
$\vec\beta$ – elements of spectral function, with length $N_F$;
$\mathbf{Y}$ – given transient vector lenght $N_f$; 
$\vec\epsilon$ – normal noise.

$$\begin{equation*}
\mathbf{X} = \left(
\begin{array}{cccc}
x_{11} & x_{12} & \ldots & x_{1(N_f-1)}\\
x_{21} & x_{22} & \ldots & x_{2(N_f-1)}\\
\vdots & \vdots & \ddots & \vdots\\
x_{(N_F-1)1} & x_{(N_F-1)2} & \ldots & x_{(N_F-1)(N_f-1)}
\end{array}
\right)
\end{equation*}$$

$$x_{ij} = \int_{s_j}^{s_{j+1}}\exp{\left(-s\cdot t_i\right)}ds$$

## The problem

Considering that noise is normal distributed we can maximize the posterior probability and hence minimize the residual sum of squares  

$$\mathbf{Y} = \mathbf{X}\vec{\beta}+\vec\epsilon$$

Since we will fitting the exponential decay with shifted delta function ( $\mathcal{L}\left\{\delta(t-\tau)\right\} = e^{-\tau s}$, for $\text{Re}(s)>0$ ), and in this model weights $\beta_i$ may take zero values. $L_1$ regression can gives us a sparse solution.

$$Q = \left(\mathbf{Y} - \mathbf{X}\vec{\beta}\right)^{T}\cdot\left(\mathbf{Y} - \mathbf{X}\vec{\beta}\right) + \lambda \vec\beta$$
$$\frac{\partial Q}{\partial \beta_i} = -2\mathbf{X}^T\mathbf{Y}+2\mathbf{X}^T\mathbf{X}\vec\beta +\lambda \text{sign}(\beta)$$

For $L_2$ regression model:

$$
\vec{\beta} = \left(\mathbf{X}^{T}\mathbf{X} +\alpha\mathbf{I} \right)^{-1} \mathbf{X}^{T}\mathbf{Y}
$$

## Generating data

Тут данные – временная зависимость ёмкости диодной структуры. Она меняется по экспоненциальному закону:

$$C(t) = C_0\left( \left( 1-\frac{N_t}{2N_D}\right)\exp{\left(-\tau_n t\right)}\right) \propto \exp(-\tau_t t),$$

$$\tau_n = \sigma_n\langle v_{th}\rangle N_C \exp{\left(-\frac{E_C-E_t}{kT}\right)} = \propto T^2 \exp{\left(-\frac{E_a}{kT}\right)},$$

где $C(t)$ – емкость структуры, $\sigma_n$ – сечение захвата центра, $E_a$ – энергия активации центра, $T$ – температура.

Поэтому сигнал ``` C ```  тут будет следующим:

$$C(t) = \sum_n \pm A_i\exp{\left(\tau_i t\right)},$$

где $A_i$ – амплитуда экспоненты; $\tau_i$ – экспоненциальный множитель. (Знак $\pm$ означает наличие ловушек как с положительной так и с отрицательной амплитудой)

Из набора кривых реллаксаций емкости, измеренных при различных температурах, можем расчитать параметры центра. В координатах $\ln{\left(\tau\cdot T^{-2}\right) – 1/T}$ наклон прямой будет равен $(-E_a/k)$ а сечение захвата определяется перечечением прямой с осью ординат




In [5]:
T   = np.arange(260, 370, 1) #K
C0  = 20*np.log(T) + np.cos(T/30) + 600 # Стационарная емкость
time = np.arange(0.15, 14.7, 0.15)

cut = len(T)
#######E2       E2*
Ea  = [0.74,   0.75] #eV
sig = [3E-15, 5E-14] #cm**2
Nt  = [4E16,   4E16] #cm-3
Nd  = 1E16

m   = 0.28*9.109E-31 #kg
k   = 1.380649E-23 #J/K
h   = 6.62607015E-34 #J*s
Nc  = 2*(2*np.pi*m*k*T/h**2)**(1.5) #m**-3
Nc  = Nc*10**-6 #cm-3
v   = np.sqrt(3*k*T/m) #m/s
v   = v*100 #cm/s

k   = 8.617333262E-5 #eV/K
tau0 = sig[0]*v*Nc*np.exp(-Ea[0]/(k*T)) #E2 trap
tau1 = sig[1]*v*Nc*np.exp(-Ea[1]/(k*T)) #E2* trap


fig = plt.figure()
ax  = fig.add_subplot(111)
c = cm.gnuplot(np.linspace(0, 1, cut)) 

C = []
for i in range(cut):
    temp = C0[i]
    temp = temp - Nt[0]/(2*Nd)*np.exp(-tau0[i]*time)
    temp = temp + Nt[1]/(2*Nd)*np.exp(-tau1[i]*time)
    temp = temp + np.random.normal(0, 1, len(time))*5E-3 ##adding noise
    C.append(temp)
    
index = 60
print('T = %.2f'%T[index])

for i in range(cut):
    ax.plot(time, C[i], c = c[i])
ax.plot(time, C[index], 'g-', lw = 4)

<IPython.core.display.Javascript object>

T = 320.00


[<matplotlib.lines.Line2D at 0x1181afbe0>]

## Filling $\mathbf{X}$ martix:


In [6]:
tmin = 1E-1 
tlim = 1E2
s    = time #
NF   = len(s)
Nf   = NF # 200
t    = tmin*10**(np.linspace(0, 40*np.log10(tlim/tmin), Nf)*0.025) #t domain with exp density points
dt   = np.diff(t)

s    = time

X    = np.zeros([NF, Nf], dtype = float)
for i in range(NF-1):
        for j in range(Nf-1):
            x1     = -s[i]*(t[j] - dt[j])
            x2     = -s[i]*(t[j] + dt[j])
            X[i,j] = (np.exp(x1) + np.exp(x2))*dt[j]
np.shape(X)

(97, 97)

In [7]:
lmin = 1E-10
llim = 1E1
L = 100
lmbd = np.array([2E-1, 2E-2])
#lmbd = lmin*10**(np.linspace(0, 40*np.log10(llim/lmin), L)*0.025)  # reg. parameter values

In [8]:
I = np.identity(Nf)

## Gradient descent

In [9]:
def L1(X, Y, dl):
    """Returns solution vector and cost function
    using L1 regression and gradient descent.
    
    X  – Laplace transform Matrix
    Y  – Given transient function
    l1 – L1 Reg. parameter
    
    returns beta for Y = X*beta
    """
    
    costs = []
    beta  = np.random.randn(Nf)/np.sqrt(Nf)
    n     = 5000
    learning_rate = 0.09
    dl    = dl
    for k in range(n):
        Yhat  = X@beta
        delta = Yhat - Y
        beta  = beta - learning_rate*(X.T@delta + dl*np.sign(beta))
        mse   = delta.dot(delta)/NF
        costs.append(mse)
 
    return beta, costs

In [10]:
l1data = []

fs  = []
costs = []

for dl in lmbd:
    f, cost = L1(X, C[index] - C[index][-1], dl) # C - C[-1] – means that transient is too long 
    fs.append(f)                                 # F(s) = exp(-tau*s) + const
    costs.append(cost)                           # F(s->inf) = const
l1data = [fs, costs]                             # F(s) - const = exp(-tau*s) = F(s) - F(s)[last index]
l1data = np.asarray(l1data)

## Plotting

In [11]:
print('T = %.2f K'%T[index])
fig = plt.figure(figsize = (7,5))
ax  = fig.add_subplot(211)
ax.set_title('L1 regularization')
ax.set_xscale('log')
ax.axvline(x = tau0[index], c='k')
ax.axvline(x = tau1[index], c='k')

l1index = 1

ax.plot(t, l1data[0][l1index], 'r-', label = '$\lambda = %.2e $'%lmbd[l1index])

ax.legend()
az  = fig.add_subplot(212)
az.set_title('Cost function')
az.set_yscale('log')
az.set_xscale('log')
az.plot(l1data[-1][l1index])

    
plt.tight_layout()

T = 320.00 K


<IPython.core.display.Javascript object>

## Important!

В реальности реллаксация представляет из себя функцию $C(t) = C_0 + A\exp(-\tau\cdot t)$ т.е. $C(t \rightarrow\infty) = C_0$
Для устранения вклада стационарной емкости $C_0$ мы вычитаем последнюю точку реллаксации, допуская, что реллаксация достаточно длинная:
```C - C[-1]```

In [12]:
import sys
sys.path.append('functions/')

from ilt import SVD

def laplace(time, C, bound, Nf, l, REG):
    'Return specified silution of problem using L1 or SVD routines'

    if REG == "L1":
        f_l1, cost = L1(X, C - C[-1], l)
        return t, f_l1
    elif REG == "SVD":
        t_svd, f_svd, x = SVD(time, np.abs(C) - C[-1], bound, Nf, l)
        return t_svd, f_svd
    elif REG != 'L1' or REG !='SVD':
        print('Що ти робиш, негідник!')
        return brake 

#t_svd, temp = ilt(time, np.abs(C[index] - C[index][-1]), [tmin,  tlim], Nf, 1E-1)

## Important!

В реальности реллаксация представляет из себя функцию $C(t) = C_0 + A\exp(-\tau\cdot t)$ т.е. $C(t \rightarrow\infty) = C_0$
Для устранения вклада стационарной емкости $C_0$ мы вычитаем последнюю точку реллаксации, допуская, что реллаксация достаточно длинная:
```C - C[-1]```

In [13]:
index = 60
fig = plt.figure(figsize = (7,5))
plt.plot( laplace(time, C[index] - C[index][-1], [tmin, tlim], Nf, 1E-1, REG = 'L1')[-1],  'r-', label = 'L1')
plt.plot(-laplace(time, C[index] - C[index][-1], [tmin, tlim], Nf, 1E-1, REG = 'SVD')[-1],  '-', label = 'SVD')
plt.legend()

<IPython.core.display.Javascript object>

<matplotlib.legend.Legend at 0x101a165588>

### Ploting heatmap

In [14]:
def heatmap(REG):

    'Returns heatmap of all data'
    
    XZ = []
    YZ = []
    ZZ = []

    for i in range(0, cut):
        YZ.append(np.ones(len(C[1])-1)*T[i])
        TEMPE, TEMPX = laplace(time, C[i] - C[i][-1], [tmin, tlim], Nf, 1E-1, REG = REG)
        XZ.append(TEMPE)
        ZZ.append(TEMPX)

    XZ = np.asarray(XZ)
    YZ = np.asarray(YZ)
    if REG == 'SVD':
        ZZ = -np.asarray(ZZ)
    else:
        ZZ = np.asarray(ZZ)
    
    fig = plt.figure(figsize = (10,4.5))
    a2d = fig.add_subplot(121)

    cmap = cm.bwr
    v = np.amax(np.abs(ZZ))/50
    normalize = plt.Normalize(vmin = -v, vmax = v)

    extent = [np.log10(tmin), np.log10(tlim), (T[-1]), (T[0])]
    a2d.set_xlabel(r'Emission $\log_{10}{(e)}$')
    a2d.set_title(REG)
    a2d.set_ylabel('Temperature T, K')
    a2d.plot(np.log10(tau0), T, '--', label = 'E2')
    a2d.plot(np.log10(tau1), T, '--', label = 'E2*')
    a2d.legend()
    a2d.axvline(x = np.log10(XZ[0][index]), c = 'k')
    #a2d.grid(True)



    pos = a2d.imshow(ZZ[::1,::1], cmap = cmap,  
               norm = normalize, interpolation = 'none',
               aspect = 'auto', extent = extent)
    plt.colorbar(pos)


    plt.xticks(np.arange(np.log10(XZ.min()),np.log10(XZ.max()),0.9999))
    plt.yticks(np.arange((T.min()),T.max(),20.0))
    
    ad = fig.add_subplot(122)
    ad.plot(T, ZZ[:,index], c = 'k')
    ad.legend()

    

    plt.show()
    plt.tight_layout() 

In [15]:
heatmap('SVD')

<IPython.core.display.Javascript object>

No handles with labels found to put in legend.


In [16]:
heatmap('L1')

<IPython.core.display.Javascript object>

No handles with labels found to put in legend.


### P.S.
SVD routines are working only with same sing exponents amplitudes (only positive singular values). So here SVD is only for comparison of obtained results.

Короче вопросы следующие:

* Можно ли как-нибудь улучшить начальную генерацию весов в перед градиентным спуском, чтобы ускорить работу подгонки?
* Обычно learning rate меняется в процессе обучения или лучше будет оставить его постоянным? Если менять, то как? И какие вообще значения брать?
* Стоит ли попробовать $L1 + L2$ регуляризацию, тут это уместно? Если да, то подскажи как выбирать параметр для обоих регуляризаторов? (Я уже попробовал, в файле ```main.ipynb```)
* Как в целом улучшить работу? Перейти на другие библиотеки или что?

### Articles

1 <a href="https://sci-hub.st/https://doi.org/10.1137/0730038"> A REGULARIZATION METHOD FOR THE NUMERICAL INVERSION OF THE LAPLACE TRANSFORM. CHEN WEI DONG</a>

2 <a href="https://sci-hub.st/https://doi.org/10.1002/cmr.a.21263"> Laplace Inversion of Low-Resolution NMR Relaxometry Data Using Sparse Representation Methods. PAULA BERMAN ET AL.</a>