In [None]:
################################################################################################
################################################################################################
## REVISIÓN DE VERSIONES                                                                      ##
##                                                                                            ##
## v.3.0                                                                                      ##
## - hace scraping de uns lista de competiciones y página de partidos diarios                 ##
## - busca registros duplicados y los elimina                                                 ##
## - añade columna con los porcentajes de partidos NoGoal                                     ##
##                                                                                            ##
## v.2.1                                                                                      ##
## - añade la paginación de los partidos diarios                                              ##
##                                                                                            ##
## v.2.0                                                                                      ##
## - scraping de una página específica de partidos diarios                                    ##
## - crea dataframe y lo envía a archivo .csv                                                 ##
##                                                                                            ##
################################################################################################
################################################################################################

In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np
from tqdm import tqdm

In [2]:
def obtener_stats(func_stats):
    stats_dict = {}
    
    date = func_stats.find('div', attrs={'class':'info match-link'})
    if date:
        stats_dict['date'] = date.get('starttime').replace('T',' ').replace(':00+00:00','')
    else:
        stats_dict['date'] = '-'
 
    draw = func_stats.find('div', attrs={'class':'content-box draw'}).find('div', attrs={'class':'cont'})
    if draw:
        stats_dict['draw'] = draw.get_text('/',strip=True).replace('%','')[4:10]
    else:
        stats_dict['draw'] = '-' 
        
    homeRank = func_stats.find('div', attrs={'class':'position t1'})
    if homeRank:
        stats_dict['homeRank'] = homeRank.get_text()
    else:
        stats_dict['homeRank'] = '-'    
            
    homeTeam = func_stats.find('p', attrs={'itemprop':'homeTeam'})
    if homeTeam:
        stats_dict['homeTeam'] = homeTeam.get_text('/', strip=True)
    else:
        stats_dict['homeTeam'] = '-'

    homeGoals = func_stats.find('div', attrs={'class':'content-box t-1'}).find('div', attrs={'class':'poss-box'})
    if homeGoals:
        stats_dict['homeGoals'] = homeGoals.get_text('/', strip=True).replace('/Probabilidad gana/',' - ').replace('/Goles esperados','')
    else:
        stats_dict['homeGoals'] = '-'     
        
    awayGoals = func_stats.find('div', attrs={'class':'content-box t-2'}).find('div', attrs={'class':'poss-box'})
    if awayGoals:
        stats_dict['awayGoals'] = awayGoals.get_text('/', strip=True).replace('/Probabilidad gana/',' - ').replace('/Goles esperados','')
    else:
        stats_dict['awayGoals'] = '-'     

    awayTeam = func_stats.find('p', attrs={'itemprop':'awayTeam'})
    if awayTeam:
        stats_dict['awayTeam'] = awayTeam.get_text('/', strip=True)
    else:
        stats_dict['awayTeam'] = '-'     
     
    awayRank = func_stats.find('div', attrs={'class':'position t2'})
    if awayRank:
        stats_dict['awayRank'] = awayRank.get_text()
    else:
        stats_dict['awayRank'] = '-' 
        
    competition = func_stats.find('h3', attrs={'class':'competition'})
    if competition:
        stats_dict['competition'] = competition.get_text('/', strip=True)
    else:
        stats_dict['competition'] = '-'
   
    return stats_dict

In [3]:
df = pd.DataFrame()

In [23]:
lista_competiciones = [
    'https://es.besoccer.com/competicion/ligue_1',
    'https://es.besoccer.com/competicion/escocia',
    'https://es.besoccer.com/competicion/portugal',
    'https://es.besoccer.com/competicion/segunda_brasilena',
    'https://es.besoccer.com/competicion/japon',
    'https://es.besoccer.com/competicion/liga_republica_irlanda',
    'https://es.besoccer.com/competicion/premier',
    'https://es.besoccer.com/competicion/segunda',
    'https://es.besoccer.com/competicion/bundesliga_2',
    'https://es.besoccer.com/competicion/j_two_league',
    'https://es.besoccer.com/competicion/brasil',
    'https://es.besoccer.com/competicion/league_one',
    'https://es.besoccer.com/competicion/ligue_2',
    'https://es.besoccer.com/competicion/primera_division_argentina',
    'https://es.besoccer.com/competicion/first_division',
    'https://es.besoccer.com/competicion/vitalis',
    'https://es.besoccer.com/competicion/serie_b',
    'https://es.besoccer.com/competicion/suecia'
]

lista_diaria = []
urlppal = 'https://es.besoccer.com/livescore/2022-09-26'
for i in range(1,4):
    url = urlppal+f'/{i}'
    lista_diaria.append(url)
    
lista_scrapear = lista_diaria + lista_competiciones 
lista_scrapear

['https://es.besoccer.com/livescore/2022-09-26/1',
 'https://es.besoccer.com/livescore/2022-09-26/2',
 'https://es.besoccer.com/livescore/2022-09-26/3',
 'https://es.besoccer.com/livescore/2022-09-26/4',
 'https://es.besoccer.com/livescore/2022-09-26/5',
 'https://es.besoccer.com/competicion/ligue_1',
 'https://es.besoccer.com/competicion/escocia',
 'https://es.besoccer.com/competicion/portugal',
 'https://es.besoccer.com/competicion/segunda_brasilena',
 'https://es.besoccer.com/competicion/japon',
 'https://es.besoccer.com/competicion/liga_republica_irlanda',
 'https://es.besoccer.com/competicion/premier',
 'https://es.besoccer.com/competicion/segunda',
 'https://es.besoccer.com/competicion/bundesliga_2',
 'https://es.besoccer.com/competicion/j_two_league',
 'https://es.besoccer.com/competicion/brasil',
 'https://es.besoccer.com/competicion/league_one',
 'https://es.besoccer.com/competicion/ligue_2',
 'https://es.besoccer.com/competicion/primera_division_argentina',
 'https://es.besoc

In [24]:
for url in lista_scrapear:
    besoccer = requests.get(url)
    s_besoccer = BeautifulSoup(besoccer.text, 'lxml')
    try:
        matches = s_besoccer.find('div', attrs={'class':'comp-matches'}).find_all('a', attrs={'data-status':'-1'})
    except Exception as e1:
        print(i,'.- La url ',url,' no se pudo scrapear')
        print(i,'.-',e1)
        print(i,'.- Probando otra configuración...')
        try:
            matches = s_besoccer.find('div', attrs={'class':'matches'}).find_all('a', attrs={'data-status':'-1'})
        except Exception as e2:
            print(i,'.- La url ',url,' no se pudo scrapear')
            print(i,'.-',e2)

    links_matches = [match.get('href') for match in matches]
    for i in range(len(links_matches)):
        list_analisis = []
        r_match = requests.get(links_matches[i])
        s_match = BeautifulSoup(r_match.text, 'lxml')
        try:
            find_analisis = s_match.find('div', attrs={'class':'menu-scroll'}).select('a[href*="analisis"]')
            analisis = find_analisis[0]
            link_analisis = analisis.get('href')
            r_link_analisis = requests.get(link_analisis)
            s_link_analisis = BeautifulSoup(r_link_analisis.text, 'lxml')
            df = df.append(obtener_stats(s_link_analisis), ignore_index = True)
            print(i,'.- Scrapeando',url)
            print(i,'.-', link_analisis)
        except Exception as e3:
            print(i,'.- La url ',links_matches[i],' no tiene sección análisis')
            print(i,'.-',e3)

5 .- La url  https://es.besoccer.com/livescore/2022-09-26/1  no se pudo scrapear
5 .- 'NoneType' object has no attribute 'find_all'
5 .- Probando otra configuración...


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
0 .- https://es.besoccer.com/partido/seleccion-inglaterra/seleccion-alemania/202359/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
1 .- https://es.besoccer.com/partido/seleccion-hungria/seleccion-italia/202360/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
2 .- https://es.besoccer.com/partido/seleccion-rumania/seleccion-bosnia-herzegovina/2023128/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
3 .- https://es.besoccer.com/partido/seleccion-macedonia-fyr/seleccion-bulgaria/2023111/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
4 .- https://es.besoccer.com/partido/seleccion-montenegro/seleccion-finlandia/2023127/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
5 .- https://es.besoccer.com/partido/gibraltar/seleccion-georgia/2023110/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
6 .- https://es.besoccer.com/partido/seleccion-san-marino/seleccion-estonia/2023158/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
7 .- https://es.besoccer.com/partido/atletico-tucuman/estudiantes-plata/2022493469/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
8 .- https://es.besoccer.com/partido/ca-velez-sarsfield/barracas-central/2022493481/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
9 .- https://es.besoccer.com/partido/alianza-petrolera/junior/2022322797/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


10 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
10 .- https://es.besoccer.com/partido/deportes-tolima/deportivo-pereira/2022322792/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


11 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
11 .- https://es.besoccer.com/partido/deportivo-cali/equidad/2022322794/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


12 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
12 .- https://es.besoccer.com/partido/cartagena/alaves/202349826/analisis
13 .- La url  https://es.besoccer.com/partido/mali/seleccion-zambia/2023462716  no tiene sección análisis
13 .- 'NoneType' object has no attribute 'find'


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


14 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
14 .- https://es.besoccer.com/partido/cerrito/defensor-sporting/2022525987/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


15 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
15 .- https://es.besoccer.com/partido/albion-fc/fenix/2022525988/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


16 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
16 .- https://es.besoccer.com/partido/atletico-rafaela/all-boys/2022365591/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


17 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
17 .- https://es.besoccer.com/partido/instituto/temperley/2022365599/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


18 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
18 .- https://es.besoccer.com/partido/sacachispas/deportivo-moron/2022365600/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


19 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
19 .- https://es.besoccer.com/partido/durango/celaya/202321025/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


20 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
20 .- https://es.besoccer.com/partido/cancun-futbol-club/dorados/202321021/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


21 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
21 .- https://es.besoccer.com/partido/universidad-gu/atlante/202321027/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


22 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
22 .- https://es.besoccer.com/partido/merida/club-atletico-la-paz/202321026/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


23 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
23 .- https://es.besoccer.com/partido/deportes-santa-cruz/puerto-montt/2022376839/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


24 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
24 .- https://es.besoccer.com/partido/cobreloa/union-san-felipe/2022376833/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


25 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
25 .- https://es.besoccer.com/partido/los-andes/san-miguel/2022501204/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


26 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
26 .- https://es.besoccer.com/partido/jj-urquiza/uai-urquiza/2022501201/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


27 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
27 .- https://es.besoccer.com/partido/berrichonne-chateauroux/dunkerque/2023143609/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


28 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
28 .- https://es.besoccer.com/partido/deportivo-saprissa/sporting-san-jose/2023122313/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


29 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
29 .- https://es.besoccer.com/partido/emelec-guayaquil/deportivo-cuenca/2022366964/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


30 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
30 .- https://es.besoccer.com/partido/michigan-stars-fc/maryland-bobcats/2022402875/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


31 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
31 .- https://es.besoccer.com/partido/atletico-parana/juventud-antoniana/2022426841/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


32 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
32 .- https://es.besoccer.com/partido/gais-goteborg/lindome/2022353580/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


33 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
33 .- https://es.besoccer.com/partido/sakhalin/avangard-kursk/2023138532/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


34 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
34 .- https://es.besoccer.com/partido/khimki-ii/fk-kosmos-dolgoprudny/2023138536/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


35 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
35 .- https://es.besoccer.com/partido/znamya-noginsk/zenit-penza/2023138538/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


36 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
36 .- https://es.besoccer.com/partido/yadro-st-petersburg/dinamo-st-pet/2023136815/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


37 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
37 .- https://es.besoccer.com/partido/fl-sakhalinets/zvezda-ryazan/2023138533/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


38 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
38 .- https://es.besoccer.com/partido/arsenal-tula-ii/fk-rodina-moskva-ii/2023138529/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


39 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
39 .- https://es.besoccer.com/partido/fk-tver/dinamo-moskva-ii/2023136818/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


40 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
40 .- https://es.besoccer.com/partido/rodina-moskva-iii/zenit-petersburg-2/2023136814/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


41 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
41 .- https://es.besoccer.com/partido/dinamo-vologda/khimik-dzerzhinsk/2023136821/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


42 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
42 .- https://es.besoccer.com/partido/kolomna/salyut-belgorod/2023138535/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


43 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
43 .- https://es.besoccer.com/partido/fk-yenisey-krasnoyarsk-ii/luki-energiya/2023136816/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


44 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
44 .- https://es.besoccer.com/partido/fk-zorkiy-krasnogorsk/fk-elektron-veliky-novgorod/2023136817/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


45 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
45 .- https://es.besoccer.com/partido/torpedo-vladimir/fk-murom/2023136820/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


46 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
46 .- https://es.besoccer.com/partido/dinamo-bryansk/fk-peresvet-podolsk/2023138530/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


47 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
47 .- https://es.besoccer.com/partido/spartak-tambov/strogino/2023138534/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


48 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
48 .- https://es.besoccer.com/partido/metallurg-lipetsk/fk-kvant-obninsk/2023138531/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


49 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/1
49 .- https://es.besoccer.com/partido/znamya/tekstilshchik/2023136822/analisis
49 .- La url  https://es.besoccer.com/livescore/2022-09-26/2  no se pudo scrapear
49 .- 'NoneType' object has no attribute 'find_all'
49 .- Probando otra configuración...


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
0 .- https://es.besoccer.com/partido/sokol-saratov-57891/kaluga/2023138537/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
1 .- https://es.besoccer.com/partido/spartak-kostroma/chertanovo/2023136819/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
2 .- https://es.besoccer.com/partido/fk-leningradets-lenungradskaya-oblast/zvezda-st-petersburg/2023136813/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
3 .- https://es.besoccer.com/partido/cerro-porteno/tacuary-asuncion/2022520256/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
4 .- https://es.besoccer.com/partido/saint-louis-ii/north-texas/2022607832/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
5 .- https://es.besoccer.com/partido/tacoma-defiance/houston-dynamo-ii/2022607831/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
6 .- https://es.besoccer.com/partido/malta-sub-21/montenegro-sub-21/2022542225/analisis
7 .- La url  https://es.besoccer.com/partido/italia-sub-21/japon-sub21/2022528004  no tiene sección análisis
7 .- 'NoneType' object has no attribute 'find'


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
8 .- https://es.besoccer.com/partido/francia-sub-21/belgica-sub-21/2022523330/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
9 .- https://es.besoccer.com/partido/suntracs/tauro/2022524497/analisis
10 .- La url  https://es.besoccer.com/partido/bracknell-town-fc/hanwell-town/2023240738  no tiene sección análisis
10 .- list index out of range
11 .- La url  https://es.besoccer.com/partido/beaconsfield-sycob/harrow-borough-fc/2023240737  no tiene sección análisis
11 .- list index out of range
12 .- La url  https://es.besoccer.com/partido/kings-langley/needham-market/2023238243  no tiene sección análisis
12 .- list index out of range
13 .- La url  https://es.besoccer.com/partido/hitchin-town/st-ives-town/2023238242  no tiene sección análisis
13 .- list index out of range
14 .- La url  https://es.besoccer.com/partido/redditch-united/rushall-olympic/2023238244  no tiene sección análisis
14 .- list index out of range


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


15 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
15 .- https://es.besoccer.com/partido/flamurtari-vlore/vllaznia-shkoder/2023450323/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


16 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
16 .- https://es.besoccer.com/partido/liberia-fc/kukesi/2023450329/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


17 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
17 .- https://es.besoccer.com/partido/luzi-2008/teuta-durres/2023450330/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


18 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
18 .- https://es.besoccer.com/partido/pogradeci/bylis-ballsh/2023450326/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


19 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
19 .- https://es.besoccer.com/partido/ks-devolli-bilisht/laci/2023450337/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


20 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
20 .- https://es.besoccer.com/partido/turbina-cerrik/erzeni-shijak/2023450333/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


21 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
21 .- https://es.besoccer.com/partido/porvenir/midland/2022501355/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


22 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
22 .- https://es.besoccer.com/partido/san-martin-burzaco/csyd-liniers/2022501354/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


23 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
23 .- https://es.besoccer.com/partido/berazategui/claypole/2022501351/analisis
24 .- La url  https://es.besoccer.com/partido/arabia-saudi-sub-20/macedonia-del-norte-sub-20/2022621914  no tiene sección análisis
24 .- 'NoneType' object has no attribute 'find'
25 .- La url  https://es.besoccer.com/partido/noruega-sub20/republica-checa-sub-20/2022538346  no tiene sección análisis
25 .- 'NoneType' object has no attribute 'find'


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


26 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
26 .- https://es.besoccer.com/partido/rumania-sub20/alemania-sub-20/2022528010/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


27 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
27 .- https://es.besoccer.com/partido/rksv-centro-dominguito/inter-willemstad/2022554068/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


28 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
28 .- https://es.besoccer.com/partido/crksv-jong-holland/scherpenheuvel/2022554069/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


29 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
29 .- https://es.besoccer.com/partido/centro-barber/crksv-jong-colombia/2022554070/analisis
30 .- La url  https://es.besoccer.com/partido/juve-stabia-berretti/foggia-calcio-sub19/2023480186  no tiene sección análisis
30 .- list index out of range
31 .- La url  https://es.besoccer.com/partido/sleaford-town/kimberley-miners-welfare-fc/2023225269  no tiene sección análisis
31 .- list index out of range


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


32 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
32 .- https://es.besoccer.com/partido/chunnam-dragons/busan-i-park/2022401376/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


33 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
33 .- https://es.besoccer.com/partido/gwangju-fc/ansan-greeners/2022401377/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


34 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
34 .- https://es.besoccer.com/partido/Mont-Royal-Outremont/cs-lanaudiere-nord/2022511217/analisis
35 .- La url  https://es.besoccer.com/partido/al-markhiya/al-rayyan/2023420052  no tiene sección análisis
35 .- list index out of range
36 .- La url  https://es.besoccer.com/partido/al-duhail-sc/al-arabi-312/2023420054  no tiene sección análisis
36 .- list index out of range
37 .- La url  https://es.besoccer.com/partido/al-shamal/al-gharafa/2023420053  no tiene sección análisis
37 .- list index out of range


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


38 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
38 .- https://es.besoccer.com/partido/fernando-mora/Pastoreo-FC/2022426441/analisis
39 .- La url  https://es.besoccer.com/partido/9-de-julio-rafaela/union-sunchales/2022568703  no tiene sección análisis
39 .- list index out of range
40 .- La url  https://es.besoccer.com/partido/San-Luis-Femenino/queretaro-femenino/202313736  no tiene sección análisis
40 .- list index out of range
41 .- La url  https://es.besoccer.com/partido/atlas-femenino/puebla-femenino/202313737  no tiene sección análisis
41 .- list index out of range
42 .- La url  https://es.besoccer.com/partido/barra-da-tijuca/Armaçao/2023376905  no tiene sección análisis
42 .- list index out of range


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


43 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
43 .- https://es.besoccer.com/partido/ruvu-shooting/coastal-union/2023330278/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


44 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
44 .- https://es.besoccer.com/partido/berekum-chelsea/medeama/2023386355/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


45 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
45 .- https://es.besoccer.com/partido/kfarsoum/al-hashemeya/2022527461/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


46 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
46 .- https://es.besoccer.com/partido/blama/al-arabi-314/2022527462/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


47 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
47 .- https://es.besoccer.com/partido/incomati-de-xinavane/lichinga/2022528150/analisis
48 .- La url  https://es.besoccer.com/partido/cd-huila/gd-escolinha-isaac-de-benguela/2023477365  no tiene sección análisis
48 .- 'NoneType' object has no attribute 'find'


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


49 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/2
49 .- https://es.besoccer.com/partido/petroleos-luanda/onze-bravos-327/2023477366/analisis
49 .- La url  https://es.besoccer.com/livescore/2022-09-26/3  no se pudo scrapear
49 .- 'NoneType' object has no attribute 'find_all'
49 .- Probando otra configuración...


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
0 .- https://es.besoccer.com/partido/hankook-verdes/progresso-fc/2023454280/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
1 .- https://es.besoccer.com/partido/port-layola/banque-dc-united/2023454279/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
2 .- https://es.besoccer.com/partido/gaadiidka/sahafi-fc/2022613361/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
3 .- https://es.besoccer.com/partido/heegan/dekedda/2022613364/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
4 .- https://es.besoccer.com/partido/bhawanipore-fc-pratidin/mohun-bagan-ac/2022621900/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
5 .- https://es.besoccer.com/partido/sv-river-plate/united-fc/2023386227/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/livescore/2022-09-26/3
6 .- https://es.besoccer.com/partido/sv-estrella-papilon/racing-club-aruba/2023386228/analisis
6 .- La url  https://es.besoccer.com/livescore/2022-09-26/4  no se pudo scrapear
6 .- 'NoneType' object has no attribute 'find_all'
6 .- Probando otra configuración...
6 .- La url  https://es.besoccer.com/livescore/2022-09-26/5  no se pudo scrapear
6 .- 'NoneType' object has no attribute 'find_all'
6 .- Probando otra configuración...


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/escocia
0 .- https://es.besoccer.com/partido/heart-of-midlo/glasgow-rangers-fc/202323199/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/escocia
1 .- https://es.besoccer.com/partido/aberdeen/kilmarnock-fc/202323196/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/escocia
2 .- https://es.besoccer.com/partido/celtic-fc/motherwell/202323197/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/escocia
3 .- https://es.besoccer.com/partido/dundee-united-fc/st-johnstone-fc/202323198/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/escocia
4 .- https://es.besoccer.com/partido/ross-county-fc/hibernian-fc/202323200/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/escocia
5 .- https://es.besoccer.com/partido/st-mirren/livingston-fc/202323201/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
0 .- https://es.besoccer.com/partido/nautico-recife/sampaio-correa-fc/2022382493/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
1 .- https://es.besoccer.com/partido/londrina/ponte-preta/2022382496/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
2 .- https://es.besoccer.com/partido/ituano/brusque/2022382495/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
3 .- https://es.besoccer.com/partido/ec-bahia/operario-pr/2022382498/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
4 .- https://es.besoccer.com/partido/criciuma-ec/chapecoense/2022382494/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/segunda_brasilena
5 .- https://es.besoccer.com/partido/csa/tombense/2022382492/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/liga_republica_irlanda
0 .- https://es.besoccer.com/partido/bohemians-fc/university-college-dublin/2022312111/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/liga_republica_irlanda
1 .- https://es.besoccer.com/partido/dundalk/drogheda-united/2022312112/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/liga_republica_irlanda
2 .- https://es.besoccer.com/partido/st-patrick-s-athletic/derry-city/2022312113/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/liga_republica_irlanda
3 .- https://es.besoccer.com/partido/finn-harps/shelbourne/2022312114/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/liga_republica_irlanda
4 .- https://es.besoccer.com/partido/sligo-rovers/shamrock-rovers/2022312115/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/segunda
0 .- https://es.besoccer.com/partido/sporting-gijon/ibiza-eivissa/202350150/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/segunda
1 .- https://es.besoccer.com/partido/huesca/leganes/202349802/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/segunda
2 .- https://es.besoccer.com/partido/mirandes/real-zaragoza/202349817/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/segunda
3 .- https://es.besoccer.com/partido/malaga/villarreal-b/202349811/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/segunda
4 .- https://es.besoccer.com/partido/ponferradina-sd/tenerife/202349820/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/segunda
5 .- https://es.besoccer.com/partido/burgos-cf/levante/202349795/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/segunda
6 .- https://es.besoccer.com/partido/lugo/real-oviedo/202349805/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/segunda
7 .- https://es.besoccer.com/partido/eibar/racing/202349798/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/competicion/segunda
8 .- https://es.besoccer.com/partido/albacete/fc-andorra-senior/202349823/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/competicion/segunda
9 .- https://es.besoccer.com/partido/ud-palmas/granada/202349831/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


10 .- Scrapeando https://es.besoccer.com/competicion/segunda
10 .- https://es.besoccer.com/partido/cartagena/alaves/202349826/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
0 .- https://es.besoccer.com/partido/thespakusatsu/renofa-yamaguchi/2022356085/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
1 .- https://es.besoccer.com/partido/tokyo-verdy/montedio-yamagata/2022356086/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
2 .- https://es.besoccer.com/partido/v-varen-nagasaki/yokohama/2022356087/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
3 .- https://es.besoccer.com/partido/oita-trinita/ventforet-kofu/2022356095/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
4 .- https://es.besoccer.com/partido/fagiano-okayama/vegalta-sendai/2022356093/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
5 .- https://es.besoccer.com/partido/grulla-morioka/zweigen-kanazawa/2022356088/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
6 .- https://es.besoccer.com/partido/blaublitz-akita/machida-zelvia/2022356089/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
7 .- https://es.besoccer.com/partido/jef-united-ichihara/roasso-kumamoto/2022356091/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
8 .- https://es.besoccer.com/partido/albirex-niigata/omiya-ardija/2022356092/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
9 .- https://es.besoccer.com/partido/tokushima-vortis/mito-hollyhock/2022356094/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


10 .- Scrapeando https://es.besoccer.com/competicion/j_two_league
10 .- https://es.besoccer.com/partido/tochigi/ry-ky/2022356090/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/league_one
0 .- https://es.besoccer.com/partido/forest-green-rovers/exeter-city/202346315/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/league_one
1 .- https://es.besoccer.com/partido/barnsley-fc/charlton-athletic-fc/202346312/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/league_one
2 .- https://es.besoccer.com/partido/bristol-rovers/accrinon-stanley/202346313/analisis
3 .- La url  https://es.besoccer.com/partido/morecambe/cambridge-united/202346317  no tiene sección análisis
3 .- ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/league_one
4 .- https://es.besoccer.com/partido/peterborough-u/port-vale/202346319/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/league_one
5 .- https://es.besoccer.com/partido/sheffield-wednesday-fc/wycombe-wanderers/202346322/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/league_one
6 .- https://es.besoccer.com/partido/shrewsbury-town/burton-albion/202346323/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/league_one
7 .- https://es.besoccer.com/partido/plymouth-argyle/ipswich-town-fc/202346320/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
0 .- https://es.besoccer.com/partido/annecy/bastia/202325993/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
1 .- https://es.besoccer.com/partido/caen/quevilly/202325994/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
2 .- https://es.besoccer.com/partido/dijon-fco/havre-ac/202325995/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
3 .- https://es.besoccer.com/partido/metz/pau/202325996/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
4 .- https://es.besoccer.com/partido/nimes-olympique/paris-sg/202325997/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
5 .- https://es.besoccer.com/partido/chamois-niortais/guingamp/202325998/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
6 .- https://es.besoccer.com/partido/rodez/amiens-sc/202325999/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
7 .- https://es.besoccer.com/partido/saint-etienne/grenoble-foot-38/202326000/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
8 .- https://es.besoccer.com/partido/valenciennes-afc/sochaux/202326001/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/competicion/ligue_2
9 .- https://es.besoccer.com/partido/stade-lavallois/bordeaux/2023189147/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
0 .- https://es.besoccer.com/partido/godoy-cruz-antonio-tomba/ca-boca-juniors/2022493479/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
1 .- https://es.besoccer.com/partido/ca-huracan/ca-banfield/2022493477/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
2 .- https://es.besoccer.com/partido/defensa-justicia/patronato/2022493464/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
3 .- https://es.besoccer.com/partido/sarmiento/arsenal-sarandi-fc/2022493485/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
4 .- https://es.besoccer.com/partido/ca-lanus/san-lorenzo/2022493475/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
5 .- https://es.besoccer.com/partido/ca-river-plate/talleres-cordoba/2022493474/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
6 .- https://es.besoccer.com/partido/independiente/newells-old-boys/2022493486/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
7 .- https://es.besoccer.com/partido/ca-rosario-central/platense/2022493463/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
8 .- https://es.besoccer.com/partido/gimnasia-plata/ca-tigre/2022493482/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


9 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
9 .- https://es.besoccer.com/partido/racing-club-avellaneda/union-santa-fe/2022493462/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


10 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
10 .- https://es.besoccer.com/partido/atletico-tucuman/estudiantes-plata/2022493469/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


11 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
11 .- https://es.besoccer.com/partido/ca-velez-sarsfield/barracas-central/2022493481/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


12 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
12 .- https://es.besoccer.com/partido/aldosivi/central-cordob/2022493483/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


13 .- Scrapeando https://es.besoccer.com/competicion/primera_division_argentina
13 .- https://es.besoccer.com/partido/colon-santa-fe/argentinos-juniors/2022493471/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/vitalis
0 .- https://es.besoccer.com/partido/cf-os-belenenses-ii/farense/202396347/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/vitalis
1 .- https://es.besoccer.com/partido/leixoes/porto-ii/202396348/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/vitalis
2 .- https://es.besoccer.com/partido/ud-oliveirense/benfica-ii/202396352/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/vitalis
3 .- https://es.besoccer.com/partido/vilafranquense/penafiel/202396354/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/vitalis
4 .- https://es.besoccer.com/partido/torreense/cf-estrela-de-amadora/202396355/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/vitalis
5 .- https://es.besoccer.com/partido/sporting-covilha/academico-viseu/202396350/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/vitalis
6 .- https://es.besoccer.com/partido/moreirense-fc/nacional/202396346/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


7 .- Scrapeando https://es.besoccer.com/competicion/vitalis
7 .- https://es.besoccer.com/partido/mafra/tondela/202396349/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


8 .- Scrapeando https://es.besoccer.com/competicion/vitalis
8 .- https://es.besoccer.com/partido/trofense/feirense/202396351/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


0 .- Scrapeando https://es.besoccer.com/competicion/suecia
0 .- https://es.besoccer.com/partido/malmo-ff/hammarby-if/2022336439/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


1 .- Scrapeando https://es.besoccer.com/competicion/suecia
1 .- https://es.besoccer.com/partido/degerfors/djurgardens-if/2022336434/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


2 .- Scrapeando https://es.besoccer.com/competicion/suecia
2 .- https://es.besoccer.com/partido/gif-sundsvall/ifk-norrkoping/2022336440/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


3 .- Scrapeando https://es.besoccer.com/competicion/suecia
3 .- https://es.besoccer.com/partido/varbergs-bois-fc/hacken/2022336441/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


4 .- Scrapeando https://es.besoccer.com/competicion/suecia
4 .- https://es.besoccer.com/partido/sirius/aik-solna/2022336437/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


5 .- Scrapeando https://es.besoccer.com/competicion/suecia
5 .- https://es.besoccer.com/partido/kalmar-ff/helsingborgs-if/2022336438/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


6 .- Scrapeando https://es.besoccer.com/competicion/suecia
6 .- https://es.besoccer.com/partido/ifk-varnamo/mjallby/2022336436/analisis
7 .- Scrapeando https://es.besoccer.com/competicion/suecia
7 .- https://es.besoccer.com/partido/ifk-goteborg/if-elfsborg-boras/2022336435/analisis


  df = df.append(obtener_stats(s_link_analisis), ignore_index = True)


In [25]:
# cuenta el número de registros encontrados - 252 - 558  - 1009 - 1184

len(df)

1184

In [42]:
# busca si hay registros duplicados

df.duplicated()

0       False
1       False
2       False
3       False
4       False
        ...  
1092    False
1093    False
1094    False
1095    False
1096    False
Length: 753, dtype: bool

In [27]:
# elimina los registros duplicados

df = df.drop_duplicates()

In [28]:
# cuenta el número de registros restantes después de eliminar duplicados

len(df)

753

In [40]:
df.style.set_properties(**{'text-align': 'center'}) 

Unnamed: 0,date,draw,homeRank,homeTeam,homeGoals,awayGoals,awayTeam,awayRank,competition,NoGoal%
0,2022-09-23 16:00,2.8,4º,Georgia,33.3% - 1.64,44.9% - 1.93,Macedonia del Norte,7º,"Liga de las Naciones de la UEFA. Liga C, Jornada 5",
1,2022-09-23 16:00,3.3,5º,Estonia,33.3% - 1.57,44.3% - 1.84,Malta,4º,"Liga de las Naciones de la UEFA. Liga D, Jornada 5",
2,2022-09-23 18:45,5.8,9º,Italia,16.4% - 0.89,62.4% - 1.95,Inglaterra,15º,"Liga de las Naciones de la UEFA. Liga A, Jornada 5",
3,2022-09-23 18:45,0.2,8º,Alemania,86.6% - 4.7,6.1% - 1.51,Hungría,7º,"Liga de las Naciones de la UEFA. Liga A, Jornada 5",
4,2022-09-23 18:45,18.2,9º,Finlandia,31.5% - 0.82,34.6% - 0.88,Rumanía,10º,"Liga de las Naciones de la UEFA. Liga B, Jornada 5",
5,2022-09-23 18:45,13.6,3º,Bosnia,37.7% - 1.06,31.5% - 0.94,Montenegro,5º,"Liga de las Naciones de la UEFA. Liga B, Jornada 5",
6,2022-09-23 16:00,9.6,-,Croacia Sub 21,49.8% - 1.45,23.5% - 0.9,Dinamarca Sub 21,-,Clasificación Europeo Sub 21. Final,
7,2022-09-23 16:00,1.1,-,Islandia Sub 21,78.7% - 3.36,9.4% - 1.18,República Checa Sub 21,-,Clasificación Europeo Sub 21. Final,
8,2022-09-23 16:00,1.4,-,Eslovaquia Sub 21,65.5% - 2.79,17.9% - 1.45,Ucrania Sub 21,-,Clasificación Europeo Sub 21. Final,
9,2022-09-23 18:00,5.2,-,Irlanda Sub 21,50.4% - 1.76,26.1% - 1.2,Israel Sub 21,-,Clasificación Europeo Sub 21. Final,


In [35]:
df.loc[df.competition.str.contains('liga escocia', case = False), "NoGoal%"] = '92.85'
df.loc[df.competition.str.contains('serie b - brasil', case = False), "NoGoal%"] = '92.06'
df.loc[df.competition.str.contains('liga fútbol japón', case = False), "NoGoal%"] = '88.67'
df.loc[df.competition.str.contains('liga irlanda.', case = False), "NoGoal%"] = '87.67'
df.loc[df.competition.str.contains('segunda división', case = False), "NoGoal%"] = '86.36'
df.loc[df.competition.str.contains('segunda japonesa j2', case = False), "NoGoal%"] = '84.72'
df.loc[df.competition.str.contains('league one.', case = False), "NoGoal%"] = '84.25'
df.loc[df.competition.str.contains('liga profesional argentina', case = False), "NoGoal%"] = '83.45'
df.loc[df.competition.str.contains('ligue 2', case = False), "NoGoal%"] = '83.14'


In [41]:
# ordena un DataFrame por columna
# se puede ordenar por varias columnas añadiendo el nombre de la siguiente columna e.j. ('date', 'competition')

df.sort_values(['date', 'competition']).to_csv('matches.csv', header = False)

In [32]:
# df.to_csv('matches.csv', header = False)

In [14]:
###
# métodos para trabajar con los datos de pandas
#
# del(df['newcolumn'])  --- elimina una columna
# df.rename(columns = {'NoGoal':'NoGoal%'}, inplace = True)