# Desafiando los Límites de la Velocidad: Descubriendo las Historias Detrás de Seis Décadas de Carreras de Fórmula 1 y sus Circuitos Legendarios

---
<summary>
    <font size="5"> Maestría en Ciencias de Datos </font>
</summary>
<summary>
    <font size="5"> Universidad de Sonora </font>
</summary>
<br>
<summary>
    <font size="4"> Propedeutico: Bases de datos </font> 
</summary>
<summary>
    <font size="4"> Profesor: Dr. Juan Pablo Soto Barrera </font>
</summary>
<summary>
    <font size="4"> Alumna: Vesna Camile Pivac Alcaraz </font>
</summary>

---

## Introducción

La Fórmula 1, conocida como el pináculo del automovilismo, ha sido un escenario de emociones intensas, competencia feroz y innovación tecnológica desde su inicio en la década de 1950. A lo largo de las décadas, la Fórmula 1 ha visto a algunos de los mejores pilotos del mundo competir en los circuitos más desafiantes, proporcionando un espectáculo emocionante para los aficionados al deporte en todo el mundo.

En este análisis, exploraremos un conjunto de datos que abarca más de seis décadas de carreras de Fórmula 1, desde los años 1950 hasta 2017. Este conjunto de datos, basado en el trabajo de ChrisG, ofrece una visión detallada de las carreras, los pilotos, los equipos y los resultados a lo largo de los años.

Nuestro objetivo es descubrir patrones y tendencias en los datos que puedan arrojar luz sobre la evolución de este deporte apasionante. Examinaremos aspectos como el rendimiento de los pilotos y los equipos, la influencia de los factores tecnológicos y estratégicos en los resultados de las carreras, y cómo han cambiado estas variables a lo largo del tiempo.

Al sumergirnos en este análisis, esperamos proporcionar una visión fascinante de la rica historia de la Fórmula 1 y ofrecer una nueva perspectiva sobre lo que hace que este deporte sea tan emocionante y atractivo. Ya sea que seas un fanático de la Fórmula 1 de toda la vida o simplemente tengas curiosidad por aprender más sobre este deporte, esperamos que encuentres este análisis tanto informativo como interesante. ¡Arranquemos nuestros motores y comencemos la carrera!

## Modelo Entidad-Relación

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/Modelo-EntidadRelacion.png?raw=true width=600></center>

En el corazón de nuestra base de datos "Formula1", se encuentra un modelo de Entidad-Relación meticulosamente diseñado que consta de cuatro entidades fundamentales, también conocidas como tablas. Este modelo proporciona una representación visual clara de cómo estas entidades interactúan y se conectan entre sí.

Primero, tenemos la entidad "circuits", que establece una relación con la entidad "races". Esta relación se materializa a través de una llave foránea en la tabla "races", que se utiliza para vincular cada carrera a un circuito específico. Es importante destacar que, aunque cada carrera está asociada a un único circuito, un circuito puede ser el escenario de múltiples carreras a lo largo del tiempo. Esto se traduce en una relación de uno a muchos entre "circuits" y "races".

En segundo lugar, la entidad "races" también se relaciona con la entidad "results". En este caso, cada carrera puede generar múltiples resultados, uno por cada participante. Sin embargo, cada resultado está vinculado a una única carrera. Por lo tanto, esta es otra relación de uno a muchos, que se implementa mediante el uso de una llaves foránea en la tabla "results".

Finalmente, existe una relación entre las entidades "drivers" y "results". Cada conductor puede tener muchos resultados a lo largo de su carrera, pero cada resultado está asociado a un único conductor. Esta relación de uno a muchos se establece mediante el uso de la clave foránea "driverId" en la tabla "results".

## Visualización de datos

En esta sección, nos adentraremos en la fascinante tarea de visualizar los datos de las entidades clave de nuestra base de datos de Fórmula 1: corredores, carreras, resultados y circuitos haciendo las siguientes consultas:
``` sql
SELECT * FROM circuits LIMIT 3;
```

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/circuits-limit3.png?raw=true width=500></center>

``` sql
SELECT * FROM drivers LIMIT 5;
```

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/drivers-limit5.png?raw=true width=600></center>

``` sql
SELECT * FROM races LIMIT 10;
```

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/races-limit10.png?raw=true width=600></center>

``` sql
SELECT * FROM results LIMIT 5;
```

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/results-limit5-p1.png?raw=true width=600><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/results-limit5-p2.png?raw=true width=78></center>

## Cantidad de circuitos, carreras y conductores

En esta sección, realizaremos un análisis cuantitativo de los datos de nuestra base de datos de Fórmula 1, centrándonos en tres elementos fundamentales: corredores, carreras y circuitos. Utilizaremos consultas de recuento para obtener una visión general de la cantidad de registros presentes en cada una de estas entidades.

Exploraremos el número total de corredores registrados en nuestra base de datos, lo que nos brindará una visión cuantitativa de la participación de los corredores en las carreras de Fórmula 1 a lo largo del tiempo.

Además, analizaremos el recuento total de carreras registradas, lo que nos permitirá comprender la cantidad de carreras que se han llevado a cabo y la evolución del deporte a lo largo de los años.

Finalmente, nos centraremos en los circuitos utilizados en las carreras de Fórmula 1, obteniendo el recuento total de circuitos presentes en nuestra base de datos. Esto nos brindará información sobre la variedad y la cantidad de circuitos que han sido parte integral del campeonato.

``` sql
select count(*) from circuits;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits.png?raw=true></center>

``` sql
select count(*) from races;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-races.png?raw=true></center>


``` sql
select count(*) from drivers;
```

<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-drivers.png?raw=true></center>


## Uniendo Tablas para Descubrir las Carreras en Bahrain: Un Enfoque con Inner Join

La consulta SQL que estamos analizando tiene como objetivo extraer información de las tablas "races" y "circuits". Comienza seleccionando todas las columnas de ambas tablas y luego procede a unir estas dos tablas en base a una columna común, el "circuitId". Esta unión permite combinar información relevante de ambas tablas en un solo conjunto de datos.

Una vez que las tablas están unidas, la consulta se enfoca en filtrar los resultados. En este caso, estamos interesados en las filas donde el "circuitId" en la tabla "circuits" es igual a 3. Este filtro nos permite centrarnos en los datos específicos que son relevantes para nuestro análisis.

Finalmente, para mantener el conjunto de resultados manejable, la consulta limita el número de filas devueltas a las primeras 10 que cumplen con las condiciones especificadas. En resumen, esta consulta nos proporciona un subconjunto de datos específicos de las tablas "races" y "circuits", centrándose en las carreras que se llevaron a cabo en el circuito con el ID 3 y limitando los resultados a las primeras 10 carreras que cumplen con este criterio.


```sql
SELECT *
FROM races
INNER JOIN circuits
ON races.circuitId = circuits.circuitId
WHERE circuits.circuitId = 3
LIMIT 10;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/innerjoin1.png?raw=true width=600><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/innerjoin2.png?raw=true width=600></center>

Ahora utilizaremos este query de sql para saber cuantas carreras hay con el circuito de Bahrain el cual tiene el circuitId igual a 3.
```sql
SELECT count(*)
FROM races
INNER JOIN circuits
ON races.circuitId = circuits.circuitId
WHERE circuits.circuitId = 3;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-bahrain.png?raw=true></center>

## Análisis de la Frecuencia de Carreras por Circuito en la Fórmula 1

En el análisis de datos de las carreras de Fórmula 1, es esencial entender la distribución de las carreras entre los diferentes circuitos. Cada circuito tiene características únicas que pueden influir en el rendimiento de los pilotos y los equipos, y por lo tanto, el número de carreras que se han celebrado en cada circuito puede tener implicaciones significativas en las estrategias de los equipos y los pilotos.

La consulta SQL que estamos realizando tiene como objetivo identificar los 10 circuitos que han albergado la mayor cantidad de carreras en la historia de la Fórmula 1. Esto se logra contando el número de carreras asociadas a cada circuitId en la tabla "races", y luego ordenando estos conteos en orden descendente. El resultado de esta consulta nos proporcionará una lista de los 10 circuitos más frecuentados, junto con el número exacto de carreras que se han celebrado en cada uno.

Este análisis puede proporcionar información valiosa para una variedad de propósitos. Por ejemplo, puede ayudar a los equipos a planificar sus estrategias de entrenamiento y desarrollo de coches, ya que los circuitos que albergan más carreras pueden requerir una atención especial. Además, puede ser útil para los organizadores de carreras y los patrocinadores para entender qué circuitos son los más prominentes en el deporte. Por último, puede ser de interés para los aficionados que quieran entender más sobre la historia y la geografía de las carreras de Fórmula 1.

```sql
SELECT races.circuitId, circuits.name, COUNT(*)
FROM races
INNER JOIN circuits ON races.circuitId = circuits.circuitId
GROUP BY races.circuitId, circuits.name;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits1.png?raw=true width=300><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits2.png?raw=true width=300></center>
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits3.png?raw=true width=300><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits4.png?raw=true width=300></center>
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/count-circuits5.png?raw=true width=300></center>

```sql
SELECT races.circuitId, circuits.name, COUNT(*) AS num_races
FROM races
INNER JOIN circuits ON races.circuitId = circuits.circuitId
GROUP BY races.circuitId, circuits.name
ORDER BY num_races DESC
LIMIT 10;
```
<center><img src=https://github.com/VesnaPivac/Analisis_Formula1/blob/main/Images/top10-circuits.png?raw=true width=300></center>

## Conclusión

En el transcurso de nuestro análisis de los datos de las carreras de Fórmula 1, hemos descubierto una serie de hallazgos interesantes. A pesar de que el circuito de Bahrain ha albergado un total de 14 carreras, no se encuentra entre los diez circuitos que han acogido la mayor cantidad de carreras. Esto nos proporciona una perspectiva sobre la frecuencia de las carreras en este circuito en comparación con otros.

El circuito que ha albergado la mayor cantidad de carreras es el Autodromo Nazionale di Monza, con un impresionante total de 68 carreras. Le sigue de cerca el Circuit de Monaco, que ha sido el escenario de 65 carreras. En el extremo inferior del top 10, encontramos al Suzuka Circuit, que ha albergado 30 carreras. Estos hallazgos nos proporcionan una visión clara de los circuitos más prominentes en la historia de la Fórmula 1.

Además, gracias a las capacidades de SQL, hemos podido determinar que existen 73 circuitos únicos en nuestro conjunto de datos. A lo largo de los años, estos circuitos han albergado un total de 997 carreras, en las que han participado 842 conductores diferentes. Estos números subrayan la escala y la diversidad de las carreras de Fórmula 1, y nos proporcionan una apreciación más profunda de este deporte.

En conclusión, nuestro análisis ha revelado una serie de insights valiosos sobre las carreras de Fórmula 1. A través de la exploración de los datos y la aplicación de técnicas de SQL, hemos podido entender mejor la distribución de las carreras entre los diferentes circuitos, y hemos obtenido una visión más clara de la historia y la evolución de este emocionante deporte.