## Scope del proyecto


El proyecto consiste en obtener información sobre las cartas del juego YuGiOh!\
\
Para esto, se consiguió un dataset que proporciona la información de las cartas publicadas por booster pack entre 2002 y 2010. Dicho dataset se obtuvo en Reddit en el siguiente [vínculo](https://www.reddit.com/r/datasets/comments/39cmbs/data_set_of_trading_card_games_yugioh_digimon/).\
\
El dataset incluye los siguientes datos:
* Booster pack
* Número de carta por booster pack
* Nombre de carta
* Tipo de carta
* Valor
* Rareza de carta
* Atributo
* Nivel de monstruo
* Sub-tipo de monstruo
* Ataque
* Defensa
* Texto de carta

Al explorar el dataset, se encontró que todos los campos de valor de carta estaban en *Nan*, por lo que se omitieron de la carga final de datos

## Exploración de datos

Luego de cargados los datos, se descargó el dataset utilizando el archivo *main.ipynb*. se obtuvo la siguiente tabla:


![Exploración de dataset descargado](explor1.JPG)

También se determinó la cantidad de boosters y la cantidad de cartas en cada uno de estos:

![Boosters y cartas por booster](explor2.JPG)
![Boosters y cartas por booster](explor3.JPG)


Como parte de la resolución de preguntas de este dataframe, también se obtuvieron gráficas de la distribución de cartas. Se presentan algunas a continuación:

## Modelo de datos

Para poder tratar los datos de una manera íntegra, se cargaron como un Data Warehouse. Para esto, se creó una tabla en AWS utilizando MySQL. Esta tabla se pobló utlizando los diversos archivos csv que se encuentran en el servidor de S3. La tabla se creó utlizando el archivo *script.sql*. En la siguiente figura, se muestra el sql de la base de datos.\
\
![SQL de la tabla](sql.JPG)

## Procesamiento

Se crearon los archivos csv para cargarse a s3. Para poder cargarlos al servicio RDS de AWS, se crearon lambdas dedicadas. Estas recogen los datos de S3 y los cargan a la base. Estos scripts se encuentran en la carpeta *lambda* dentro de la carepta *serverless* de este repositorio.

Para poder descargar los datos, se utiliza el *main.ipynb*. Este descarga los datos en formato Json para cargarlos a un dataframe de pandas, el cual se utiliza para la ingeniería de datos.

En la siguiente imagen, se muestra la arquiectura utilizada en la conexión a AWS.


![Arquitecture](architecture.png)



Para realizar el procesamiento, se deben seguir los siguientes pasos:

1. Clonar el repositorio  

```
git clone https://github.com/luisramilian95/iio-data-science-project-2
```

2. Ir a la carpeta serverless

```
cd serverless
```

3. Instalar las dependencias  

```
npm install
```

4. Desplegar las lambdas

```
sls deploy
```

5. Subir los archivos al bucket `yugioh-dataset`

6. Instalar las dependencias
   1. numpy
   2. pandas
   3. requests

7. Correr el archivo `main.ipynb`







## Análisis

### Preguntas planteadas

Como parte del análisis, se plantearon las siguientes preguntas:
1. Determine los  boosters que contengan la mayor cantidad de:
 >* Monstruos normales
 >* Monstruos con efecto
 >* Monstruos de fusión
 >* Monstruos rituales
 >* Cartas mágicas
 >* Cartas Trampa

2. Determine si hay cartas que se imprimieron en más de un booster diferente. Si sí, enlístelas
3. Determine en qué boosters se encuentran los mayor cantidad de monstruos del mismo atributo.
4. Determine en qué booster se encuentran los monstruos más fuertes.
5. Calcule la probabilidad por booster de sacar una carta rara, súper rara, ultra rara o secreta.

### Desarrollo

Para la solución de las preguntas propuestas, se cargó el dataset de AWS a un dataframe de pandas en Python. Todo el desarrollo se encuentra en el archivo *main.ipynb* adjunto a este repositorio

### Respuestas

1. Utilizando la gráfica interactiva generada en plotly (ver *main.ipynb*), se puden comparar las cartas de cada versión de booster. Se obtienen de esta manera la respuesta a la pregunta planteada:

>* Monstruos normales: Legend of Blue Eyes White Dragon (72)
>* Monstruos con efecto: Invasion of Chaos y Light of Destruction (57)
>* Monstruos de fusión: Legacy of Darkness y Enemy of Justice GX1 (5)
>* Monstruos Rituales: Magic Ruler (4)
>* Cartas mágicas: Magic Ruler (38)
>* Cartas trampa: Pharaonic Guardian (25)

2. Sí hay cartas que fueron impresas en más de un booster. La lista que de cartas es:

|index|card_name|Cantidad|
|:----|:----|:----|
|55|Allure of Darkness|2|
|193|Avenging Knight Parshath|2|
|244|Battlestorm|2|
|314|Blackwing - Shura the Blue Flame|2|
|437|Chaos Emperor Dragon - Envoy of the End|2|
|448|Charge of the Light Brigade|2|
|487|Colossal Fighter/Assault Mode|2|
|652|Dark Grepher|2|
|857|Drill Warrior|2|
|963|Eradicator Epidemic Virus|2|
|1154|Gemini Elf|2|
|1158|Gemini Summoner|2|
|1214|Goblin Zombie|2|
|1259|Gravekeeper's Priestess|2|
|1302|Guardian of Order|2|
|1383|Horus the Black Flame Dragon LV8|2|
|1413|Il Blud|2|
|1459|Invader of Darkness|2|
|1474|Iron Core of Koa'ki Meiru|2|
|1499|Judgment of Anubis|2|
|1562|Koa'ki Meiru Guardian|2|
|1613|Lava Golem|2|
|1700|Magic Cylinder|2|
|1759|Master Gig|2|
|1766|Mazera DeVille|2|
|1849|Moja|2|
|2294|Ring of Destruction|2|
|2332|Rose, Warrior of Revenge|2|
|2354|Sacred Phoenix of Nephthys|2|
|2379|Scrap Archfiend|2|
|2459|Silent Swordsman LV5|2|
|2506|Solar Recharge|2|
|2689|Tempest Magician|2|
|2710|The Creator|2|
|2713|The Dark Creator|2|
|2721|The End of Anubis|2|
|2913|Vampire Lord|2|
|3061|XX-Saber Gardestrike|2|

3. En la gráfica de plotly (ver *main.ipynb*) se encuentran los distintos atributos que pueden tener los monstruos del juego. La mayor cantidad de monstruos para cada atributo se encuentran en:
>* Dark: Metal Raiders (35)
>* Earth: Metal Raiders (39)
>* Fire: Hidden Arsenal 3 (5)
>* Light: Light of Destruction GX2 (35)
>* Water: Invasion of Chaos (15)
>* Wind: Metal Raidres (14)

4. Para resolver la pregunta 4, se utilizaron gráficas de violín (ver *main.ipynb*). Se obtuvieron los valores de ataque y defensa de todos los monstruos de cada booster. Se puede apreciar lo siguiente:

>* En el booster de Phantom Darkness se encuentra el monstruo con mayor ataque (4500)
>* En los booster Light of Destruction y Shadow of Infinity se encuentran los monstruos con las mayores defensas (4000)
>* Realizando el análisis tomando como base las medianas, el booster Elemental Energy posee los monstruos que como grupo tienen el mayor ataque representativo (1600)
>* De nuevo utilizando las medianas, The Lost Millenium, Elemental Energy y Dark Crysis tienen los valores de defensa con valor representativo mayor (1500). De estos, el booster de Elemental Energy tiene más monstruos por encima de la mediana, como se puede apreciar en la gráfica

5. Para iniciar este problema, es necesario saber cómo se distribuye un booster:\
\
Todo booster posee 9 cartas. 8 de ellas son cartas comunes al azar, y 1 es una carta que puede ser rara, súper rara, ultra rara o secreta.
Para poder llevar a cabo esto, se supuso que la tasa de impresión de las cartas es la misma. Esto hace que la probabilidad de una carta no común siempre es 1/9. Establecido esto, se determinó la proporción de cartas de distinta rareza en cada booster mediante un histograma (*main.ipynb*).\
\
Luego de determinada la proporción, se muestran a continuación las probabilidades:

| booster_name                          | card_rarity   |Probability|
|---------------------------------------|---------------|----------|
| Absolute Powerforce 5D1               | Secret Rare   | 0.017094 |
|                                       | Ultra Rare    | 0.021368 |
|                                       | Super Rare    | 0.029915 |
|                                       | Rare          | 0.042735 |
| Ancient Prophecy 5D1                  | Secret Rare   | 0.015251 |
|                                       | Ultra Rare    | 0.021786 |
|                                       | Super Rare    | 0.030501 |
|                                       | Rare          | 0.043573 |
| Ancient Sanctuary 2004                | Secret Rare   | 0.002849 |
|                                       | Ultra Rare    | 0.028490 |
|                                       | Super Rare    | 0.031339 |
|                                       | Rare          | 0.048433 |
| Crimson Crisis 5D1                    | Secret Rare   | 0.016162 |
|                                       | Ultra Rare    | 0.020202 |
|                                       | Super Rare    | 0.034343 |
|                                       | Rare          | 0.040404 |
| Crossroads of Chaos 5D1               | Secret Rare   | 0.016162 |
|                                       | Ultra Rare    | 0.020202 |
|                                       | Super Rare    | 0.034343 |
|                                       | Rare          | 0.040404 |
| Cyber Dark Impact GX2                 | Ultra Rare    | 0.017778 |
|                                       | Super Rare    | 0.031111 |
|                                       | Rare          | 0.062222 |
| Cybernetic Revolution GX1             | Ultra Rare    | 0.017778 |
|                                       | Super Rare    | 0.031111 |
|                                       | Rare          | 0.062222 |
| Dark Crisis 2003                      | Secret Rare   | 0.005698 |
|                                       | Super Rare    | 0.028490 |
|                                       | Ultra Rare    | 0.028490 |
|                                       | Rare          | 0.048433 |
| Duelist Revolution 5D1                | Secret Rare   | 0.017094 |
|                                       | Ultimate Rare | 0.021368 |
|                                       | Super Rare    | 0.029915 |
|                                       | Rare          | 0.042735 |
| Elemental Energy GX1                  | Secret Rare   | 0.015326 |
|                                       | Ultra Rare    | 0.015326 |
|                                       | Super Rare    | 0.026820 |
|                                       | Rare          | 0.053640 |
| Enemy of Justice GX1                  | Ultra Rare    | 0.017778 |
|                                       | Super Rare    | 0.031111 |
|                                       | Rare          | 0.062222 |
| Force of the Breaker GX2              | Ultra Rare    | 0.007937 |
|                                       | Rare          | 0.015873 |
|                                       | Super Rare    | 0.023810 |
|                                       | Secret Rare   | 0.063492 |
| Hidden Arsenal 3 5D1                  | Secret Rare   | 0.037037 |
|                                       | Super Rare    | 0.074074 |
| Hidden Arsenal 5D1                    | Secret Rare   | 0.055556 |
|                                       | Super Rare    | 0.055556 |
| Invasion of Chaos 2004                | Secret Rare   | 0.005848 |
|                                       | Super Rare    | 0.029240 |
|                                       | Ultra Rare    | 0.029240 |
|                                       | Rare          | 0.046784 |
| Labyrinth of Nightmare 2003           | Secret Rare   | 0.005698 |
|                                       | Super Rare    | 0.028490 |
|                                       | Ultra Rare    | 0.028490 |
|                                       | Rare          | 0.048433 |
| Legacy of Darkness 2003               | Secret Rare   | 0.005698 |
|                                       | Super Rare    | 0.028490 |
|                                       | Ultra Rare    | 0.028490 |
|                                       | Rare          | 0.048433 |
| Legend of Blue Eyes White Dragon 2002 | Secret Rare   | 0.005051 |
|                                       | Super Rare    | 0.025253 |
|                                       | Ultra Rare    | 0.025253 |
|                                       | Rare          | 0.055556 |
| Light of Destruction GX3              | Secret Rare   | 0.021786 |
|                                       | Ultra Rare    | 0.021786 |
|                                       | Super Rare    | 0.026144 |
|                                       | Rare          | 0.041394 |
| Magic Ruler 2002                      | Secret Rare   | 0.006006 |
|                                       | Super Rare    | 0.027027 |
|                                       | Ultra Rare    | 0.027027 |
|                                       | Rare          | 0.051051 |
| Metal Raiders 2002                    | Secret Rare   | 0.005051 |
|                                       | Super Rare    | 0.025253 |
|                                       | Ultra Rare    | 0.025253 |
|                                       | Rare          | 0.055556 |
| Phantom Darkness GX3                  | Ultra Rare    | 0.020202 |
|                                       | Secret Rare   | 0.022222 |
|                                       | Super Rare    | 0.028283 |
|                                       | Rare          | 0.040404 |
| Pharaonic Guardian 2003               | Secret Rare   | 0.005698 |
|                                       | Super Rare    | 0.028490 |
|                                       | Ultra Rare    | 0.028490 |
|                                       | Rare          | 0.048433 |
| Raging Battle 5D1                     | Secret Rare   | 0.017429 |
|                                       | Ultra Rare    | 0.019608 |
|                                       | Super Rare    | 0.030501 |
|                                       | Rare          | 0.043573 |
| Shadow of Infinity GX1                | Secret Rare   | 0.015326 |
|                                       | Ultra Rare    | 0.015326 |
|                                       | Super Rare    | 0.026820 |
|                                       | Rare          | 0.053640 |
| Soul of the Duelist 2004              | Ultimate Rare | 0.013889 |
|                                       | Ultra Rare    | 0.018519 |
|                                       | Super Rare    | 0.032407 |
|                                       | Rare          | 0.046296 |
| Stardust Overdrive 5D1                | Secret Rare   | 0.017094 |
|                                       | Ultra Rare    | 0.021368 |
|                                       | Super Rare    | 0.029915 |
|                                       | Rare          | 0.042735 |
| Starstrike Blast 5D1                  | Secret Rare   | 0.015556 |
|                                       | Ultimate Rare | 0.020000 |
|                                       | Super Rare    | 0.031111 |
|                                       | Rare          | 0.044444 |
| Strike of Neos GX2                    | Ultra Rare    | 0.017778 |
|                                       | Super Rare    | 0.031111 |
|                                       | Rare          | 0.062222 |
| Tactical Evolution GX2                | Ultra Rare    | 0.015152 |
|                                       | Secret Rare   | 0.020202 |
|                                       | Super Rare    | 0.030303 |
|                                       | Rare          | 0.045455 |
| The Duelist Genesis 5D1               | Secret Rare   | 0.016162 |
|                                       | Ultra Rare    | 0.020202 |
|                                       | Super Rare    | 0.034343 |
|                                       | Rare          | 0.040404 |
| The Lost Millennium GX1               | Super Rare    | 0.026820 |
|                                       | Ultra Rare    | 0.030651 |
|                                       | Rare          | 0.053640 |
| The Shining Darkness 5D1              | Secret Rare   | 0.017094 |
|                                       | Ultra Rare    | 0.021368 |
|                                       | Super Rare    | 0.029915 |
|                                       | Rare          | 0.042735 |

