<center>
    <h1>
        Application of Benford's law to quality control of digital terrain models
    </h1>
</center>
<center>
    <h1>
        Application de la loi de Benford au contrôle de qualité des modèles numériques de terrain
    </h1>
    
    <h2>
            Authors: FATIHI Ayoub & KECHNA Mehdi
    </h2>
</center>

### This notebook is inspired from this paper: *[Application de la loi de Benford au contrôle de qualité des modèles numériques de terrain](https://www.researchgate.net/publication/331580669_Application_de_la_loi_de_Benford_au_controle_de_qualite_des_modeles_numeriques_de_terrain)*

<center>
<div>
<img src="img/Simon_Newcomb_.jpg" width=200 height=160 alt="Shrouded" />
<img src="img/frank_benford.jpeg" width=200 height=150 alt="Shrouded" />
</div>
</center>

(Fr) **La loi de Benford**, également appelée **loi de Newcomb-Benford**, **loi des nombres anormaux** ou **loi du premier chiffre**, est une observation sur la distribution de fréquence des chiffres de tête dans de nombreux ensembles de données numériques de la vie réelle. La loi stipule que dans de nombreux ensembles de nombres naturels, le premier chiffre a tendance à être petit. Dans les ensembles qui obéissent à cette loi, le chiffre 1 apparaît comme le premier chiffre significatif environ 30 % du temps, tandis que le chiffre 9 apparaît comme le premier chiffre significatif moins de 5 % du temps. Si les chiffres étaient distribués uniformément, ils apparaîtraient chacun environ 11,1 % du temps. La loi de Benford permet également de prédire la distribution des chiffres de poids fort, des chiffres de poids faible, des combinaisons de chiffres, etc.

---

**Benford's law**, also called the **Newcomb–Benford law**, the **law of anomalous numbers**, or the **first-digit law**, is an observation about the frequency distribution of leading digits in many real-life sets of numerical data. The law states that in many naturally occurring collections of numbers, the leading digit is likely to be small. In sets that obey the law, the number 1 appears as the leading significant digit about 30 % of the time, while 9 appears as the leading significant digit less than 5 % of the time. If the digits were distributed uniformly, they would each occur about 11.1 % of the time. Benford's law also makes predictions about the distribution of second digits, third digits, digit combinations, and so on.

[Reference](https://www.wikiwand.com/en/Benford%27s_law)

## Benford’s Law Distribution
<center>
    
    <img src="img/benford.png" alt="benford line" />
    
    <img src="img/Rozklad_benforda.png" alt="benford table" />
    
</center>

In [None]:
# IMPORTING LIBRARIES
import numpy as np
import matplotlib.pyplot as plt
import rasterio
from rasterio.plot import show, show_hist
from LNC import *

# Study case 0: DEM of BeniMellal Khenifra Region

In [None]:
# Load DEM
dem = rasterio.open('tifs/demBK.tif')

# Load slope
slp = rasterio.open('tifs/demBK_slope.tif')

# Load aspect 
asp = rasterio.open('tifs/demBK_aspect.tif')

## The raster

In [None]:
plt.figure(figsize=(15, 12))
plt.axis('off')
show(dem, cmap='magma');

## The histogram

In [None]:
fig, axhist = plt.subplots(1, 1, figsize=(10, 9))

show_hist(dem, bins=50, lw=0.0, stacked=False, 
          alpha=0.3,
          title="DEM Histogram", ax=axhist)
axhist.get_legend().remove()

In [None]:
 print("\nDEM\n")
 print(dem.profile)
 print("\nSLOPE\n")
 print(slp.profile)
 print("\nASPECT\n")
 print(asp.profile)

In [None]:
# Reading the first band (not from zero!) of the dem
band1 = dem.read(1).flatten()

f1 = get_dln(band1)

n = sum(f1)
ff1 = []
for i in range(len(f1)):
    ff1.append(100*f1[i]/n)


f_lnd(f1)

In [None]:
# Reading the first band (not from zero!) of the slope
band2 = slp.read(1).flatten() # 2d array

f2 = get_dln(band2)

n2 = sum(f2)
ff2 = []
for i in range(len(f2)):
    ff2.append(100*f2[i]/n2)


f_lnd(f2)

In [None]:
# Reading the first band (not from zero!) of the aspect
band3 = asp.read(1).flatten() # 2d array

f3 = get_dln(band3)

n3 = sum(f3)
ff3 = []
for i in range(len(f3)):
    ff3.append(100*f3[i]/n3)


f_lnd(f3)

In [None]:
plot_benford(ff1, ff2, ff3);

# Study case 1: DEM of Carrier (issu par drone)

In [None]:
# Load DEM
dem1 = rasterio.open('tifs/MNT_carriere.tif')

# Load slope
slp1 = rasterio.open('tifs/MNT_carriere_slope.tif')

# Load aspect 
asp1 = rasterio.open('tifs/MNT_carriere_aspect.tif')

## The raster

In [None]:
plt.figure(figsize=(15, 12))
plt.axis('off')
show(dem1, cmap='rainbow');

## The histogram

In [None]:
fig, axhist = plt.subplots(1, 1, figsize=(10, 9))

show_hist(dem1, bins=50, lw=0.0, stacked=False, 
          alpha=0.3,
          title="DEM Histogram", ax=axhist)
axhist.get_legend().remove()

In [None]:
 print("\nDEM\n")
 print(dem1.profile)
 print("\nSLOPE\n")
 print(slp1.profile)
 print("\nASPECT\n")
 print(asp1.profile)

In [None]:
# Reading the first band (not from zero!) of the dem
band1 = dem1.read(1).flatten()

f1 = get_dln(band1)

n = sum(f1)
ff1 = []
for i in range(len(f1)):
    ff1.append(100*f1[i]/n)


f_lnd(f1)

In [None]:
# Reading the first band (not from zero!) of the slope
band2 = slp1.read(1).flatten() # 2d array

f2 = get_dln(band2)

n2 = sum(f2)
ff2 = []
for i in range(len(f2)):
    ff2.append(100*f2[i]/n2)


f_lnd(f2)

In [None]:
# Reading the first band (not from zero!) of the aspect
band3 = asp1.read(1).flatten() # 2d array

f3 = get_dln(band3)

n3 = sum(f3)
ff3 = []
for i in range(len(f3)):
    ff3.append(100*f3[i]/n3)


f_lnd(f3)

In [None]:
plot_benford(ff1, ff2, ff3);

## References:

**Polidori, Laurent & El Hage, Mhamad. (2019).**
___Application de la loi de Benford au contrôle de qualité des modèles numériques de terrain. 19 - 22.___ 

[Application de la loi de Benford au contrôle de qualité des modèles numériques de terrain](https://www.researchgate.net/publication/331580669_Application_de_la_loi_de_Benford_au_controle_de_qualite_des_modeles_numeriques_de_terrain)*

La loi de Benford fait le constat empirique d'une régularité dans la distribution statistique du premier chiffre dans de nombreuses séries de nombres (géographie, sport, économie etc.). Elle a été utilisée pour détecter des fraudes comptables ou électorales. Dans le même esprit, nous avons cherché à l'utiliser comme critère de vraisemblance pour évaluer la qualité des modèles numériques de terrain. Les métriques considérées sont l'altitude, la pente et l'ordre de Strahler.

**Wikipedia Benford's lwa**

https://www.wikiwand.com/en/Benford%27s_law