In [None]:
def reward_function(params):
    '''
    Recompensa a un vehículo autónomo por mantenerse en la pista y manejar de manera eficiente.

    Parámetros:
    - all_wheels_on_track: booleano, verdadero si el vehículo permanece en la pista.
    - distance_from_center: float, distancia del vehículo al centro de la pista.
    - track_width: float, ancho de la pista.
    - speed: float, velocidad del vehículo.
    - steering_angle: float, ángulo de dirección del vehículo.
    - heading: float, orientación del vehículo en grados.

    Retorna:
    - reward: float, valor de la recompensa calculada.
    '''
    # Parámetros de entrada
    all_wheels_on_track = params['all_wheels_on_track']
    distance_from_center = params['distance_from_center']
    track_width = params['track_width']
    speed = params['speed']
    steering_angle = params['steering_angle']
    heading = params['heading']

    # Configuraciones básicas
    reward = 1e-3

    # Si todas las ruedas están en la pista, se asigna una recompensa base
    if all_wheels_on_track:
        reward = 1.0

        # Proporción de distancia al centro
        proportion_from_center = distance_from_center / (track_width / 2)

        # Recompensa más alta si está más cerca del centro
        if proportion_from_center < 0.1:
            reward += 10.0
        elif proportion_from_center < 0.2:
            reward += 5.0
        elif proportion_from_center < 0.3:
            reward += 1.0

        # Recompensa por velocidad
        reward += speed ** 2 / 4.0  # Ajusta este valor según el rango de velocidad esperado

        # Penalizaciones o recompensas por orientación
        # Ajusta según el rango esperado de steering_angle y heading
        if abs(steering_angle) < 10:  # Asume un rango de -30 a 30 grados para steering_angle
            reward += 2.0
        elif abs(steering_angle) < 20:
            reward += 1.0
        else:
            reward -= 1.0  # Penalización por un ángulo de dirección muy grande

    # Devuelve el valor de la recompensa
    return float(reward)
