# Portée d'un projectile
Supposons que nous ayons un projectile avec lequel nous voulons atteindre une certaine distance. La formule de la portée d'un projectile est $R = \frac{{v_0}^2 \sin(2\theta_0)}{g}$ et elle montre que la portée maximale dépend du carré de la vitesse initiale et de l'angle de lancement. Supposons que nous ne connaissons pas la physique et que nous voulons utiliser la régression pour prédire la portée maximale. Dans notre cas, si l'angle est entre 50 et 60 degrés, nous observons une portée maximale et nous obtenons une cible maximale 'y'. De même, si la vitesse est entre 90 et 100 unités arbitraires, nous observons une portée maximale.

La cellule de code en dessous crée le set de données que vous devez utiliser pour entraîner puis tester un modèle de régression logistique régularisé. 

Ne vous inquiétez pas si vous ne comprenez pas certaines parties du code, il utilise des outils plus avancés tels que *pandas* et *scikit-learn*. Exécutez simplement la cellule pour obtenir les tableaux numpy "x_train, x_test, y_train, y_test".

In [3]:
import numpy as np
from sklearn.model_selection import train_test_split

# Définit un générateur de nombres aléatoires
np.random.seed(0)

# Nombre d'expériences
n = 15000

# Génère des angles aléatoires entre 10 et 90 degrés.
angles = np.random.uniform(low=10, high=90, size=n)

# Génère des vitesses aléatoires entre 10 et 100 unités.
velocities = np.random.uniform(low=10, high=100, size=n)

# Combine les angles et les vitesses dans un seul tableau 2D (ce sera nos caractéristiques d'entrée)
X = np.column_stack((angles, velocities))


# Génère une cible variable
# Pour simplifier, un coup est réussi lorsque l'angle est compris entre 50 et 60 degrés et que la vitesse est comprise entre 90 et 100 unités.
y = [1 if (50 <= angle <= 60) and (90 <= velocity <= 100) else 0 for angle, velocity in zip(angles, velocities)]

# Conversion à un tableau numpy
y = np.array(y)

# Équilibre l'échantillon de données : on conserve un nombre égal de résultats réussis et manqués.
import pandas as pd
df = pd.DataFrame(X, columns=['angle', 'velocity'])
df['y'] = y
df_sig = df[df['y']==1]
df_back = df[df['y']==0].sample(n=df_sig.shape[0])
df_balanced = pd.concat([df_sig, df_back])

# Convertit les colonnes 'angle' et 'velocity' en un tableau numpy 2D pour X
X = df_balanced[['angle', 'velocity']].values

# Convertit la colonne 'y' en un tableau numpy 1D pour y
y = df_balanced['y'].values

# Le code ci-dessous prépare les sets de données d'entraînement et de test pour vous (nous introduirons le package sklearn lors de la session de l'après-midi)
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.01, random_state=324, stratify=y)

Dans la cellule ci-dessous, définissez la fonction de coût pour un modèle de régression logistique régularisé que vous utiliserez pour prédire si un projectile donné atteint la portée ou non.

In [4]:
def sigmoid(z):
    z = np.clip( z, -500, 500 )           # protège contre les valeurs extrêmes
    g = 

    return g

def compute_cost_logistic(X, y, w, b, lambda_ = 1):
    """
    Args:
      X (ndarray (m,n): Données, m exemples avec n caractéristiques
      y (ndarray (m,)): valeurs cibles
      w (ndarray (n,)): paramètres du modèle  
      b (scalaire)    : paramètre du modèle
      lambda_ (scalaire): Contrôle la quantité de régularisation
    Returns:
      total_cost (scalaire):  coût
    """




SyntaxError: invalid syntax (2560151951.py, line 3)

Dans la cellule ci-dessous, définissez une fonction qui calcule le gradient pour la régression logistique.

In [5]:
def compute_gradient_logistic(X, y, w, b): 
    """
    Args:
      X (ndarray (m,n): Données, m exemples avec n caractéristiques
      y (ndarray (m,)): valeurs cibles
      w (ndarray (n,)): paramètres du modèle  
      b (scalaire)    : paramètre du modèle
    Returns
      dj_dw (ndarray (n,)): Le gradient du coût par rapport aux paramètres w. 
      dj_db (scalaire)      : Le gradient du coût par rapport au paramètre b. 
    """

        


Dans la cellule ci-dessous, définissez une fonction qui implémente la descente de gradient pour le modèle de régression logistique ci-dessus.

**Astuce** : pour vérifier si l'algorithme converge, vous pouvez imprimer la valeur de la fonction de coût toutes les quelques itérations.

In [None]:
import copy, math
def gradient_descent(X, y, w_in, b_in, alpha, num_iters, lambda_): 
  """ Effectue la descente de gradient en batch
  Args:
    X (ndarray (m,n)   : Données, m exemples avec n caractéristiques
    y (ndarray (m,))   : valeurs cibles
    w_in (ndarray (n,)): Valeurs initiales des paramètres du modèle  
    b_in (scalaire)    : Valeurs initiales du paramètre du modèle
    alpha (float)      : Taux d'apprentissage
    num_iters (scalaire) : nombre d'itérations pour exécuter la descente de gradient
    
  Returns:
    w (ndarray (n,))   : Valeurs mises à jour des paramètres
    b (scalaire)       : Valeur mise à jour du paramètre 
  """
    # Un tableau pour stocker le coût J et les w à chaque itération (utile pour effectuer un graphique)
    J_history 
    w = 
    b = 
    
    for i in range(num_iters):
        # calcule le gradient et met à jour les paramètres
        

        # Met à jour les paramètres en utilisant w, b, alpha et le gradient
                   
      
        # Sauve le coût J à chaque itération
        if i<100000:      # limite le nombre d'itérations 
            

        # Affiche le coût toutes les 10 itérations ou à chaque itération si num_iters < 10
        if i % math.ceil(num_iters / 10) == 0:
            print(f"Itération {i:4d}: Cost {}   ")
        
    return 

Dans la cellule ci-dessous, exécutez la descente de gradient pendant au moins 10000 itérations pour entraîner le modèle. Utilisez un paramètre de régularisation lambda_ = 1.0, et un taux d'apprentissage avec une valeur donnée qui vous donne la convergence. Vous devrez peut-être essayer plusieurs fois jusqu'à ce que vous atteigniez la convergence.

**Astuce** : n'utilisez pas une valeur de taux d'apprentissage inférieure à $10^{-4}$, sinon la convergence peut devenir trop lente avec cet ensemble de données.

In [None]:
w_tmp  = 
b_tmp  = 
alpha_ = 
lambda_ = 1.0
iters = 10000

w_out = gradient_descent() 
print(f"\nParamètres mis-à-jour: w:{w_out}, b:{b_out}")

Dans la cellule ci-dessous, utilisez votre modèle pour prédire si chacune des entrées dans le tableau 'x_test' atteint la cible. Vous pouvez ensuite afficher les valeurs cibles 'y_test' pour voir comment le modèle prédit les résultats.

In [None]:
print(sigmoid())
print("Les données tests")