#Entretien technique - mai/juin 2024

**Consignes :**

- vous pouvez utiliser n'importe quelle ressource en ligne pour aborder les exercices.
- Les exercices sont indépendants, alors ne bloquez pas 15 minutes sur une question.
- Soignez votre code au mieux. Cependant, il n'est pas nécessaire de le commenter dans le détail : soyez concis.
- **A la fin des 30 minutes, envoyez-nous par mail une copie du calepin.**

**Clonage du dépôt git :**

In [None]:
! git clone https://github.com/nanopiero/apprentissage_enonce.git

In [None]:
! ls apprentissage/data

**Exo n°1 (bibliothèque numpy, fonctions, code objet)**

**A.** En modifiant le code suivant, construire une matrice *M* de 10000 lignes et 100 colonnes dont les composantes sont prises aléatoirement dans l'intervalle [5,10].

In [None]:
import numpy as np
M = np.random.rand(2,5)
M

In [None]:
M = 5 + 5 * np.random.rand(10_000, 100)
M[0, :10]

**B.** Définir une fonction *norme_vecteur* qui prend en entrée un vecteur de taille 100 et en calcule la norme euclidienne à partir des fonctions de base de numpy.

In [None]:
def norme_vecteur(vecteur):
  """
  calcule la norme euclidienne
  """
  return np.sqrt(np.sum(vecteur**2))

# Test
norme_vecteur(M[0,:])

**C.** Parcourir les lignes de *M* et leur appliquer la fonction *norme_vecteur*. Stocker les normes dans une liste.

In [None]:
L = []
for i in range(10000):
  L.append(norme_vecteur(M[i,:]))

print(L[:10])

**D.** Tracer un histogramme des normes obtenues

In [None]:
import matplotlib.pyplot as plt

plt.hist(L)

**Exo n°2 (code objet, traitement d'image)**

**A.** Appliquer le code suivant à *data/image.jpg*

In [None]:
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import copy

class ImageTransform:
    def __init__(self, image_path):
        self.image = Image.open(image_path)

    def get_numpy_channels(self):
        return np.array(self.image)

    def set_channels(self, np_array):
        self.image = Image.fromarray(np_array)

    def display_image(self, width_cm=15):
        dpi = 96  # Default DPI for matplotlib
        width_inches = width_cm / 2.54
        height_inches = (self.image.height / self.image.width) * width_inches
        fig, ax = plt.subplots(figsize=(width_inches, height_inches), dpi=dpi)
        ax.imshow(self.image)
        ax.axis('off')
        plt.show()

    def switch_channels(self, channel_tuple):
        # A compléter
        pass


# Example Usage
# image_transform = ImageTransform('path/to/image.jpg')
# image_transform.display_image()

In [None]:
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import copy

class ImageTransform:
    def __init__(self, image_path):
        self.image = Image.open(image_path)

    def get_numpy_channels(self):
        return np.array(self.image)

    def set_channels(self, np_array):
        self.image = Image.fromarray(np_array)

    def display_image(self, width_cm=15):
        dpi = 96  # Default DPI for matplotlib
        width_inches = width_cm / 2.54
        height_inches = (self.image.height / self.image.width) * width_inches
        fig, ax = plt.subplots(figsize=(width_inches, height_inches), dpi=dpi)
        ax.imshow(self.image)
        ax.axis('off')
        plt.show()

    def switch_channels(self, channel_tuple):
        np_array = self.get_numpy_channels()
        # channela = np_array[...,channel_tuple[0]]
        channela = copy.deepcopy(np_array[...,channel_tuple[0]])
        channelb = np_array[...,channel_tuple[1]]
        np_array[...,channel_tuple[0]] = channelb
        np_array[...,channel_tuple[1]] = channela
        self.set_channels(np_array)


In [None]:
! ls

In [None]:
path_to_image = 'apprentissage/data/image.jpg'
image_transform = ImageTransform(path_to_image)
image_transform.display_image()
channels = image_transform.get_numpy_channels()
print(channels.shape)

**B.** Compléter la méthode "switch_channel" pour intervertir les canaux rouge et bleu. Visualiser.   

In [None]:
image_transform.set_channels(channels)
image_transform.switch_channels((0, 2))
image_transform.display_image()

**Exo n°3 (csv, pandas, statistiques de base)**

**A.** Charger temp_pointe_du_raz.csv (la bibliothèque pandas est conseillée). Convertir les températures en degré Celsius.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# Load the CSV file
file_path = 'apprentissage/data/temp_pointe_du_raz.csv'
df = pd.read_csv(file_path)

In [None]:
# Convert the temperature from Kelvin to Celsius
df['temperature_celsius'] = df['temperature'] - 273.15
# Handle NaN values by dropping themb
# Print the first 100 values of temperature in Celsius
print(df['temperature_celsius'].head(100))

In [None]:
# Handle NaN values by dropping them
df = df.dropna()

**B.** Tracer la frise chronologique des températures.

In [None]:
# Display a chronological plot of the temperature for the N first values
def plot_temperature(N):
    plt.figure(figsize=(10, 5))
    plt.plot(pd.to_datetime(df['date'], format='%Y%m%d%H%M%S')[:N], df['temperature_celsius'][:N])
    plt.xlabel('Date')
    plt.ylabel('Temperature (°C)')
    plt.title(f'Chronological Plot of Temperature for the First {N} Values')
    plt.show()

plot_temperature(1000)

**C.** Déterminer la moyenne, la médiane, et l'intervalle interquantile de la série statistique.

In [None]:
# Print the mean, median and the difference between the 1st and 3rd quartiles
mean_temp = df['temperature_celsius'].mean()
median_temp = df['temperature_celsius'].median()
q1 = df['temperature_celsius'].quantile(0.25)
q3 = df['temperature_celsius'].quantile(0.75)
iqr = q3 - q1

print(f"Mean Temperature: {mean_temp} °C")
print(f"Median Temperature: {median_temp} °C")
print(f"Interquartile Range (IQR): {iqr} °C")

**D.** Y a-t-il une cyclicité dans la série ? Si oui la mettre en évidence.

In [None]:
# Display the Fourier transform of the series, paying attention to the time axis
# Display the Fourier transform of the series, paying attention to the time axis
def plot_fourier_transform():
    temperature_series = df['temperature_celsius']
    n = len(temperature_series)
    fft = np.fft.fft(temperature_series - np.mean(temperature_series))
    fft_freq = np.fft.fftfreq(n, d=1)  # Assuming the time step is 1 hour

    plt.figure(figsize=(10, 5))
    plt.plot(fft_freq[:n // 2], np.abs(fft)[:n // 2])
    plt.xscale('log')
    plt.xlim([1/120, 1/5])  # Limiting to 1/5 hours
    plt.ylim([0, 40000])  # Limiting to 1/5 hours

    # Highlight specific frequencies
    highlighted_freqs = [1/48, 1/24, 1/12, 1/6]
    for freq in highlighted_freqs:
        plt.axvline(x=freq, color='red', linestyle='--')

    plt.xlabel('Frequency (1/hour)')
    plt.ylabel('Amplitude')
    plt.title('Fourier Transform of Temperature Series')
    plt.show()


plot_fourier_transform()

**Exo n°4 (json, dictionnaires, base de données)**

**A.** Chargez le json *data/annotations.json* dans un dictionnaire python.

In [None]:
import json
# Load the JSON file into a Python dictionary
def load_json(file_path):
    with open(file_path, 'r') as file:
        data = json.load(file)
    return data

file_path = 'apprentissage/data/annotations.json'
data = load_json(file_path)
print(data)

**B.** Ce dictionnaire associe des noms d'images (clefs) à des métadonnées ('filename', 'size', 'file_attributes') et des annotations (dans 'regions').
La plupart des images n'ont pas été annotées. Dans ce cas 'regions' est une liste vide. \
Supprimer toutes les clefs du dictionnaire pour lesquelles la sous-clef 'regions' est vide. Combien en reste-t-il ?   

In [None]:
# Suppress all keys if the regions subkey is empty
def suppress_empty_regions(data):
    keys_to_remove = [key for key, value in data.items() if not value['regions']]
    for key in keys_to_remove:
        del data[key]
    return data


# Suppress empty regions
print(len(data))
data = suppress_empty_regions(data)
print(len(data))
print(data)

**C.** Importer la fonction *simplify_annotations* du module exos/utile.py. L'appliquer aux données.

In [None]:
import os
os.chdir('apprentissage/exos')


In [None]:
! cd apprentissage

In [None]:
from utile import simplify_annotations
data = simplify_annotations(data)

In [None]:
print(data)

**D.** Stocker les données contenues dans la sortie de *simplify_annotations* dans une base de données sqlite locale. Cette base doit contenir trois colonnes 'name_image', 'size' et 'regions'. Chaque ligne correspondra à une image.

In [None]:
import sqlite3


# Connect to SQLite database (or create it if it doesn't exist)
db_path = 'image_data.db'
conn = sqlite3.connect(db_path)
cursor = conn.cursor()

# Create table
cursor.execute('''
CREATE TABLE IF NOT EXISTS images (
    name_image TEXT PRIMARY KEY,
    size INTEGER,
    regions TEXT
)
''')

# Insert data into the table
for name_image, attributes in data.items():
    cursor.execute('''
    INSERT INTO images (name_image, size, regions)
    VALUES (?, ?, ?)
    ''', (name_image, attributes['size'], attributes['regions']))

# Commit the transaction
conn.commit()

# Close the connection
conn.close()

print("Data has been successfully inserted into the SQLite database.")

In [None]:
# Install sqlite3
!apt-get update
!apt-get install sqlite3 -y


In [None]:
! sqlite3 image_data.db "SELECT * FROM images;"