# Obtención de datos

Se utilizan datos provistos por Sofascore. Para obtenerlos se hace uso de este script [script](https://github.com/agusrjs/scraping-data-providers/blob/main/pvd_Sofascore.py). En este [repositorio](https://github.com/agusrjs/scraping-data-providers) también se trabaja con datos de otros proveedores.


In [None]:
import pvd_Sofascore as sofascore
import pandas as pd
import re
import requests
import http.client
import json
import time
import os
from bs4 import BeautifulSoup
from datetime import datetime
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

## Liga

Se definen las variables correspondientes a la liga y la temporada. Luegos se extraen los equipos que la conforman.

In [166]:
# Ids
league_id = '703'
tournament_id = '5071'
season_id = '57782'

In [None]:
# Posiciones
groups = sofascore.get_groups_from_league(league_id, season_id)
teams_in_groups = [groups[i]['team_id'] for i in range(len(groups))]
team_ids = pd.concat(teams_in_groups, ignore_index=True)

## Equipos
Se obtienen las estadísticas acumuladas de cada equipo en la temporada.

In [None]:
# Estadísticas
sofascore.get_statistics_from_team_ids(team_ids, league_id, season_id, delay=5)

## Jugadores
Se extraen los jugadores de todos los equipos obtenidos de la Liga. A partir de esto se obtiene su perfil, mapa de calor, atributos y estadísticas.

In [None]:
players = sofascore.get_players_from_team_ids(team_ids)

In [None]:
# Perfiles
sofascore.get_profile_from_players(players)

In [None]:
# Mapas de calor
sofascore.get_heatmap_from_players(players)

In [None]:
# Atributos
sofascore.get_attributes_from_players(players, delay=5)

In [None]:
# Estadísticas
sofascore.get_statistics_from_players(players, league_id, season_id)

## Partidos
Se definen los partidos a analizar. Luego se aplican las funciones para obtener los datos buscados, formación, incidencias, resultado y estadísticas de cada partido. También se extrae el mapa de tiros, los datos de match momentum y los hightlights.

In [None]:
round = 38
events_df = sofascore.get_total_event_from_season(league_id, season_id, round)
events = events_df['event_id'].tolist()

In [None]:
# Alineaciones
sofascore.get_lineups_from_single_event(events)

In [None]:
# Resultados
sofascore.get_results_from_single_event(events)

In [None]:
# Resumen
sofascore.get_highlights_from_events(events)

In [None]:
# Estadísicas
sofascore.get_statistics_from_events(events)

In [None]:
# Mapa de tiros
sofascore.get_shotmap_from_events(events)

In [None]:
# Match momentum
sofascore.get_momentum_from_events(events)

In [None]:
# Incidentes
sofascore.get_incidents_from_events(events)