# CSV INE

El análisis de datos de turismo es una herramienta poderosa para comprender mejor el comportamiento de los viajeros y su impacto en las regiones. Para este proyecto, he seleccionado el conjunto de datos "Viajeros y Pernoctaciones por Comunidades Autónomas y Provincias" proporcionado por el Instituto Nacional de Estadística (INE). La elección se basa en la importancia del turismo en la economía española y la riqueza de información que este conjunto de datos ofrece. A través de este análisis, busco desvelar patrones y tendencias que ayuden a comprender y mejorar la gestión del turismo en nuestras regiones. ¡Comencemos este viaje de descubrimiento!

In [240]:
import pandas as pd
import warnings
import numpy as np
warnings.filterwarnings("ignore")
%run functions.ipynb
pd.set_option('display.max_columns', None) 
pd.set_option('display.max_rows', None)

In [241]:
ruta_archivo= '../data/INE.csv'

En el jupyter notebook de 'functions.ipynb' he aplicado funciones para limpiar y ordenar estos datos por cada año:

## 2022

In [242]:
ine22= leer_archivo_rango_periodo(ruta_archivo, '2022')
ine22.head()

Unnamed: 0,ï»¿Totales Territoriales,Comunidades y Ciudades AutÃ³nomas,Provincias,Viajeros y pernoctaciones,Residencia: Nivel 1,Residencia: Nivel 2,Periodo,Total
0,Total Nacional,,,Viajero,Total,,2022M12,6.054.556
1,Total Nacional,,,Viajero,Total,,2022M11,6.284.698
2,Total Nacional,,,Viajero,Total,,2022M10,9.743.259
3,Total Nacional,,,Viajero,Total,,2022M09,11.050.305
4,Total Nacional,,,Viajero,Total,,2022M08,12.889.916


In [243]:
ine22_viajeros, ine22_pernoctaciones = procesar_ine_data(ine22)

In [244]:
ine22_viajeros.dtypes

Totales_Territoriales             object
Comunidades_Ciudades_Autonomas    object
Provincias                        object
Viajeros_Pernoctaciones           object
Residencia_Nivel_1                object
Residencia_Nivel_2                object
Periodo                           object
Total                             object
dtype: object

In [245]:
ine22_viajeros['Total'] = ine22_viajeros['Total'].apply(lambda x: int(x.replace('.', '')) if x.replace('.', '').isdigit() else pd.NA).astype('Int64')

In [246]:
ine22_viajeros.head()

Unnamed: 0,Totales_Territoriales,Comunidades_Ciudades_Autonomas,Provincias,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total
0,Total Nacional,,,Viajero,Total,,2022M12,6054556
1,Total Nacional,,,Viajero,Total,,2022M11,6284698
2,Total Nacional,,,Viajero,Total,,2022M10,9743259
3,Total Nacional,,,Viajero,Total,,2022M09,11050305
4,Total Nacional,,,Viajero,Total,,2022M08,12889916


In [247]:
total22_viajeros= ine22_viajeros.head(36)
total22_viajeros

Unnamed: 0,Totales_Territoriales,Comunidades_Ciudades_Autonomas,Provincias,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total
0,Total Nacional,,,Viajero,Total,,2022M12,6054556
1,Total Nacional,,,Viajero,Total,,2022M11,6284698
2,Total Nacional,,,Viajero,Total,,2022M10,9743259
3,Total Nacional,,,Viajero,Total,,2022M09,11050305
4,Total Nacional,,,Viajero,Total,,2022M08,12889916
5,Total Nacional,,,Viajero,Total,,2022M07,12292936
6,Total Nacional,,,Viajero,Total,,2022M06,10990468
7,Total Nacional,,,Viajero,Total,,2022M05,9920671
8,Total Nacional,,,Viajero,Total,,2022M04,8689822
9,Total Nacional,,,Viajero,Total,,2022M03,6061398


In [248]:
ine22_viajeros= ine22_viajeros[36:]
ine22_viajeros.reset_index(drop=True, inplace=True)
ine22_viajeros

Unnamed: 0,Totales_Territoriales,Comunidades_Ciudades_Autonomas,Provincias,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total
0,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M12,1007743.0
1,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M11,1084818.0
2,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M10,1685566.0
3,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M09,1980050.0
4,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M08,2172087.0
5,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M07,2076997.0
6,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M06,1947800.0
7,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M05,1833026.0
8,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M04,1670249.0
9,Total Nacional,01 AndalucÃ­a,,Viajero,Total,,2022M03,1147658.0


In [249]:
viajeros22 = procesar_viajeros(ine22_viajeros)
viajeros22.head()

Unnamed: 0_level_0,2022M01_Residentes en Espana,2022M01_Residentes en el Extranjero,2022M02_Residentes en Espana,2022M02_Residentes en el Extranjero,2022M03_Residentes en Espana,2022M03_Residentes en el Extranjero,2022M04_Residentes en Espana,2022M04_Residentes en el Extranjero,2022M05_Residentes en Espana,2022M05_Residentes en el Extranjero,2022M06_Residentes en Espana,2022M06_Residentes en el Extranjero,2022M07_Residentes en Espana,2022M07_Residentes en el Extranjero,2022M08_Residentes en Espana,2022M08_Residentes en el Extranjero,2022M09_Residentes en Espana,2022M09_Residentes en el Extranjero,2022M10_Residentes en Espana,2022M10_Residentes en el Extranjero,2022M11_Residentes en Espana,2022M11_Residentes en el Extranjero,2022M12_Residentes en Espana,2022M12_Residentes en el Extranjero
Provincias,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1
A CORUÑA,51283,10804,72223,13320,82649,24794,119875,57536,119893,97410,132289,94573,194874,82142,232843,80681,150900,105761,131666,94199,94029,28034,79982,18050
ALBACETE,15963,1525,20754,2755,25686,2440,33808,3040,31837,3871,31137,3350,29234,3624,33219,4218,34265,3715,32825,3847,26850,3848,23932,2356
ALICANTE,75778,49765,133494,78422,135526,124360,221231,168677,209441,196679,253485,195961,319351,217146,341418,219568,209071,210661,186149,187378,169490,123020,163532,97349
ALMERIA,22290,9007,39146,10284,42511,13274,70416,19025,90422,28431,153172,32084,189343,39566,206936,41392,142904,34974,71229,26150,38622,12693,33013,10226
ARABA/ALAVA,14076,4006,18289,4280,23209,6003,26586,8969,25469,11329,24420,13411,28057,20638,31811,20632,26529,14493,28037,10666,24043,6280,24316,5299


In [250]:
total22_viajeros.drop(columns=['Comunidades_Ciudades_Autonomas', 'Provincias'], inplace=True)
total22_viajeros

Unnamed: 0,Totales_Territoriales,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total
0,Total Nacional,Viajero,Total,,2022M12,6054556
1,Total Nacional,Viajero,Total,,2022M11,6284698
2,Total Nacional,Viajero,Total,,2022M10,9743259
3,Total Nacional,Viajero,Total,,2022M09,11050305
4,Total Nacional,Viajero,Total,,2022M08,12889916
5,Total Nacional,Viajero,Total,,2022M07,12292936
6,Total Nacional,Viajero,Total,,2022M06,10990468
7,Total Nacional,Viajero,Total,,2022M05,9920671
8,Total Nacional,Viajero,Total,,2022M04,8689822
9,Total Nacional,Viajero,Total,,2022M03,6061398


In [251]:
total22_viajeros['Residentes_en_Espana'] = pd.to_numeric(total22_viajeros['Total']).where(total22_viajeros['Residencia_Nivel_2'] == 'Residentes en EspaÃ±a')
total22_viajeros['Residentes_en_el_Extranjero'] = pd.to_numeric(total22_viajeros['Total']).where(total22_viajeros['Residencia_Nivel_2'] == 'Residentes en el Extranjero')
total22_viajeros

Unnamed: 0,Totales_Territoriales,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total,Residentes_en_Espana,Residentes_en_el_Extranjero
0,Total Nacional,Viajero,Total,,2022M12,6054556,,
1,Total Nacional,Viajero,Total,,2022M11,6284698,,
2,Total Nacional,Viajero,Total,,2022M10,9743259,,
3,Total Nacional,Viajero,Total,,2022M09,11050305,,
4,Total Nacional,Viajero,Total,,2022M08,12889916,,
5,Total Nacional,Viajero,Total,,2022M07,12292936,,
6,Total Nacional,Viajero,Total,,2022M06,10990468,,
7,Total Nacional,Viajero,Total,,2022M05,9920671,,
8,Total Nacional,Viajero,Total,,2022M04,8689822,,
9,Total Nacional,Viajero,Total,,2022M03,6061398,,


In [252]:
valores= [3567132, 3541109, 4657750, 5178258, 6526507, 6075062, 5422886, 4672236, 4733976, 3432900, 3164177, 2342492]
posicion_inicial=0
for i in valores:
    total22_viajeros.at[posicion_inicial, 'Residentes_en_Espana']= i
    posicion_inicial +=1
total22_viajeros

Unnamed: 0,Totales_Territoriales,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total,Residentes_en_Espana,Residentes_en_el_Extranjero
0,Total Nacional,Viajero,Total,,2022M12,6054556,3567132.0,
1,Total Nacional,Viajero,Total,,2022M11,6284698,3541109.0,
2,Total Nacional,Viajero,Total,,2022M10,9743259,4657750.0,
3,Total Nacional,Viajero,Total,,2022M09,11050305,5178258.0,
4,Total Nacional,Viajero,Total,,2022M08,12889916,6526507.0,
5,Total Nacional,Viajero,Total,,2022M07,12292936,6075062.0,
6,Total Nacional,Viajero,Total,,2022M06,10990468,5422886.0,
7,Total Nacional,Viajero,Total,,2022M05,9920671,4672236.0,
8,Total Nacional,Viajero,Total,,2022M04,8689822,4733976.0,
9,Total Nacional,Viajero,Total,,2022M03,6061398,3432900.0,


In [253]:
valores= [2487423, 2743589, 5085510, 5872047, 6363409, 6217875, 5567582, 5248435, 3955846, 2628498, 1969784, 1428086]
posicion_inicial=0
for i in valores:
    total22_viajeros.at[posicion_inicial, 'Residentes_en_el_Extranjero']= i
    posicion_inicial +=1
total22_viajeros

Unnamed: 0,Totales_Territoriales,Viajeros_Pernoctaciones,Residencia_Nivel_1,Residencia_Nivel_2,Periodo,Total,Residentes_en_Espana,Residentes_en_el_Extranjero
0,Total Nacional,Viajero,Total,,2022M12,6054556,3567132.0,2487423.0
1,Total Nacional,Viajero,Total,,2022M11,6284698,3541109.0,2743589.0
2,Total Nacional,Viajero,Total,,2022M10,9743259,4657750.0,5085510.0
3,Total Nacional,Viajero,Total,,2022M09,11050305,5178258.0,5872047.0
4,Total Nacional,Viajero,Total,,2022M08,12889916,6526507.0,6363409.0
5,Total Nacional,Viajero,Total,,2022M07,12292936,6075062.0,6217875.0
6,Total Nacional,Viajero,Total,,2022M06,10990468,5422886.0,5567582.0
7,Total Nacional,Viajero,Total,,2022M05,9920671,4672236.0,5248435.0
8,Total Nacional,Viajero,Total,,2022M04,8689822,4733976.0,3955846.0
9,Total Nacional,Viajero,Total,,2022M03,6061398,3432900.0,2628498.0


In [254]:
total22_viajeros = total22_viajeros.head(12)
total22_viajeros.reset_index(drop=True, inplace=True)
total22_viajeros.drop(columns=['Residencia_Nivel_1','Residencia_Nivel_2'], inplace=True)

In [255]:
total22_viajeros

Unnamed: 0,Totales_Territoriales,Viajeros_Pernoctaciones,Periodo,Total,Residentes_en_Espana,Residentes_en_el_Extranjero
0,Total Nacional,Viajero,2022M12,6054556,3567132,2487423
1,Total Nacional,Viajero,2022M11,6284698,3541109,2743589
2,Total Nacional,Viajero,2022M10,9743259,4657750,5085510
3,Total Nacional,Viajero,2022M09,11050305,5178258,5872047
4,Total Nacional,Viajero,2022M08,12889916,6526507,6363409
5,Total Nacional,Viajero,2022M07,12292936,6075062,6217875
6,Total Nacional,Viajero,2022M06,10990468,5422886,5567582
7,Total Nacional,Viajero,2022M05,9920671,4672236,5248435
8,Total Nacional,Viajero,2022M04,8689822,4733976,3955846
9,Total Nacional,Viajero,2022M03,6061398,3432900,2628498
