# XLS and XLSX files. 

Pandas documentation: https://pandas.pydata.org/docs/index.html

Pandas API reference: https://pandas.pydata.org/docs/reference/index.html#api

In [7]:
# import pandas library
import pandas as pd

### Educational facilities in Galicia

**Source**: Portal Open Data abert@s - Xunta de Galicia

https://abertos.xunta.gal/catalogo/ensino-formacion/-/dataset/0257/centros-educativos-galicia

In [46]:
# Sample dataset in XLS format built from educational facilities data in Galicia
# (only Coruña and Lugo)

df = pd.read_excel('../datasets/centros_educativos_galicia.xls')

In [None]:
# Another way of opening files and load data into a new dataframe
ficheiro = '../datasets/centros_educativos_galicia.xls'
df = pd.read_excel(ficheiro)

In [10]:
# show the dataframe
df

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
0,15000016,CEIP Plurilingüe San Marcos,Campo da Feira s/n,Abegondo,A Coruña,15318,881880201,CEIP,43.229183,-8.286580,Pública,Non,Si
1,15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002,CEIP,42.867485,-8.657342,Pública,Non,Si
2,15000132,CPR Plurilingüe Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103,CPR,42.846325,-8.600729,Privada,Si,Non
3,15000338,CPI As Mirandas,Avenida Celso Emilio Ferreiro 4,Ares,A Coruña,15624,881930020,CPI,43.429363,-8.246173,Pública,Non,Si
4,15000363,CEIP Ponte dos Brozos,"Avenida Arsenio Iglesias, 34 (Sabon)",Arteixo,A Coruña,15142,881960506,CEIP,43.306940,-8.510333,Pública,Non,Si
...,...,...,...,...,...,...,...,...,...,...,...,...,...
611,15033198,CRA de Coristanco - Santa Comba,Lugar Esfarrapa 52,Coristanco,A Coruña,15147,881880552,CRA,43.181217,-8.747868,Pública,Non,Si
612,15033204,CEDA Profesional Druida,Rúa Fernando Macías 26 Baixo,A Coruña,A Coruña,15004,,CEDA,43.366430,-8.413181,Privada,Non,Non
613,15033216,CPREX Semente Trasancos,Aldea Roxal 36,Neda,A Coruña,15510,717779077,CPREX,43.496060,-8.123106,Privada,Non,Non
614,15033228,CEIP Novo Mesoiro,Rúa Fragas do Eume s/n,A Coruña,A Coruña,15190,881961235,CEIP,43.324470,-8.439917,Pública,Non,Si


In [11]:
# some functions to learn about the dataframe
#df.head()
#df.tail()
#df.describe()
df.sample()

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
95,15005579,IES Plurilingüe Elviña,Rúa San José de Calasanz 6,A Coruña,A Coruña,15008,881961061,IES,43.345146,-8.410672,Pública,Non,Si


In [12]:
# info about column data types
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 616 entries, 0 to 615
Data columns (total 13 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   Código             616 non-null    int64  
 1   Nome               616 non-null    object 
 2   Enderezo           616 non-null    object 
 3   Concello           616 non-null    object 
 4   Provincia          616 non-null    object 
 5   Cód. postal        616 non-null    int64  
 6   Teléfono           585 non-null    object 
 7   Tipo de centro     616 non-null    object 
 8   COORDENADA_X       616 non-null    float64
 9   COORDENADA_Y       616 non-null    float64
 10  TITULARIDADE       616 non-null    object 
 11  ENSINO_CONCERTADO  616 non-null    object 
 12  DEPENDENTE         616 non-null    object 
dtypes: float64(2), int64(2), object(9)
memory usage: 62.7+ KB


In [13]:
# show column names
df.columns

Index(['Código', 'Nome', 'Enderezo', 'Concello', 'Provincia', 'Cód. postal',
       'Teléfono', 'Tipo de centro', 'COORDENADA_X', 'COORDENADA_Y',
       'TITULARIDADE', 'ENSINO_CONCERTADO', 'DEPENDENTE'],
      dtype='object')

In [14]:
# Select some random names
df.Nome.sample(5)

10               CPI de Cruz do Sar
460               CEIP das Fontiñas
470        CEE Manuel López Navalón
140                   IES de Melide
433    CMUS Profesional de Carballo
Name: Nome, dtype: object

In [15]:
# Select municipality name and coordenates: first 10
df[['Concello','COORDENADA_X','COORDENADA_Y']].head(10)

Unnamed: 0,Concello,COORDENADA_X,COORDENADA_Y
0,Abegondo,43.229183,-8.28658
1,Ames,42.867485,-8.657342
2,Ames,42.846325,-8.600729
3,Ares,43.429363,-8.246173
4,Arteixo,43.30694,-8.510333
5,A Coruña,43.35442,-8.40064
6,Arteixo,43.345356,-8.447119
7,Arzúa,42.926342,-8.164634
8,Arzúa,42.929714,-8.15723
9,Bergondo,43.30938,-8.278413


In [16]:
# Select a column
df.Concello
# Note the type!!! <- Series
#df.Concello.unique()
# Note the type!!! <- array

# Look for the unique function in Pandas API reference

0        Abegondo
1            Ames
2            Ames
3            Ares
4         Arteixo
          ...    
611    Coristanco
612      A Coruña
613          Neda
614      A Coruña
615         Narón
Name: Concello, Length: 616, dtype: object

In [17]:
# Count elements
# Counting the elements of a series is not the same as counting the elements of an array.

#df.Concello.count()
#len(df.Concello.unique())

In [18]:
# Assign columns to new variables (Series)
concellos = df.Concello
concellos

0        Abegondo
1            Ames
2            Ames
3            Ares
4         Arteixo
          ...    
611    Coristanco
612      A Coruña
613          Neda
614      A Coruña
615         Narón
Name: Concello, Length: 616, dtype: object

In [19]:
# Apply conditions to Series
df.Concello == 'Ames'

0      False
1       True
2       True
3      False
4      False
       ...  
611    False
612    False
613    False
614    False
615    False
Name: Concello, Length: 616, dtype: bool

In [20]:
# Select rows by their index
#df.iloc[[0,1,3,5]]
df.loc[[0,1,3,5]]

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
0,15000016,CEIP Plurilingüe San Marcos,Campo da Feira s/n,Abegondo,A Coruña,15318,881880201,CEIP,43.229183,-8.28658,Pública,Non,Si
1,15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002,CEIP,42.867485,-8.657342,Pública,Non,Si
3,15000338,CPI As Mirandas,Avenida Celso Emilio Ferreiro 4,Ares,A Coruña,15624,881930020,CPI,43.429363,-8.246173,Pública,Non,Si
5,15000545,EMUSPR Presto Vivace,"Rúa Posse, 37, 1º",A Coruña,A Coruña,15009,981131545,EMUSPR,43.35442,-8.40064,Privada,Non,Non


In [21]:
# Select the rows that meet a condition
df[df.Concello == 'Ames']

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
1,15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002.0,CEIP,42.867485,-8.657342,Pública,Non,Si
2,15000132,CPR Plurilingüe Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103.0,CPR,42.846325,-8.600729,Privada,Si,Non
269,15019542,EEI da Igrexa,A Tarroeira,Ames,A Coruña,15034,981884459.0,EEI,42.85296,-8.638422,Pública,Non,Si
279,15020659,EEI de Covas,Covas s/n,Ames,A Coruña,15864,981884850.0,EEI,42.879627,-8.643236,Pública,Non,Si
386,15025220,CEP Plurilingüe de Ventín,Ventin,Ames,A Coruña,15895,881867490.0,CEP,42.85087,-8.588841,Pública,Non,Si
430,15026637,CEIP de Barouta,Ames (San Tomé),Ames,A Coruña,15229,881867455.0,CEIP,42.91031,-8.654732,Pública,Non,Si
485,15027721,IES Plurilingüe de Ames,"Rúa Peregrina, s/n (Bertamirans)",Ames,A Coruña,15220,881866729.0,IES,42.86812,-8.658323,Pública,Non,Si
526,15032224,CEMU Elemental Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103.0,CEMU,42.846436,-8.600529,Privada,Non,Non
558,15032625,CEIP Agro do Muíño,Lugar As Cortes s/n,Ames,A Coruña,15228,881866010.0,CEIP,42.84386,-8.642227,Pública,Non,Si
560,15032649,EEI do Milladoiro,Travesa do Porto (Milladoiro) s/n,Ames,A Coruña,15895,881866037.0,EEI,42.84677,-8.579979,Pública,Non,Si


In [22]:
# Select the centers with type IES ('Tipo de centro')
serie_indices = df['Tipo de centro'] == 'IES'
df[serie_indices]

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
13,15001136,IES Francisco Aguiar,Avenida Da Coruña 15,Betanzos,A Coruña,15300,881960165,IES,43.282490,-8.217094,Pública,Non,Si
14,15001148,IES As Mariñas,Avenida da Coruña s/n,Betanzos,A Coruña,15300,881880254,IES,43.283478,-8.215625,Pública,Non,Si
33,15002581,IES Alfredo Brañas,Rúa Vila de Corcubión s/n,Carballo,A Coruña,15100,981700911,IES,43.217155,-8.685111,Pública,Non,Si
34,15002591,IES Monte Neme,Rúa Nacente 29,Carballo,A Coruña,15106,881960050,IES,43.212290,-8.704391,Pública,Non,Si
41,15003212,IES Agra de Raíces,Rúa Buenaventura Castro Rial,Cee,A Coruña,15270,881880486,IES,42.957993,-9.186319,Pública,Non,Si
...,...,...,...,...,...,...,...,...,...,...,...,...,...
520,15032145,IES de Pastoriza,"Rúa do Lagarto, esq. Furoca s/n",Arteixo,A Coruña,15140,981647517,IES,43.333690,-8.463442,Pública,Non,Si
562,15032662,IES O Mosteirón,Rúa Esperela S/N,Sada,A Coruña,15168,881880949,IES,43.349600,-8.292017,Pública,Non,Si
575,15032807,IES do Milladoiro,Rúa Paseo da Igualdade (O Milladoiro) 5,Ames,A Coruña,15895,881867863,IES,42.845753,-8.582285,Pública,Non,Si
585,15032923,IES de Carral,Costa do Pincho s/n,Carral,A Coruña,15175,881960480,IES,43.180490,-9.037006,Pública,Non,Si


In [23]:
# Create a new Dataframe with all the language schools
eois = df[df['Tipo de centro'] == 'EOI']
eois

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
347,15023132,EOI da Coruña,Rúa da Educación s/n,A Coruña,A Coruña,15011,981279100,EOI,43.370686,-8.423161,Pública,Non,Si
429,15026546,EOI de Ferrol,Rúa Real 29,Ferrol,A Coruña,15402,981324025,EOI,43.485313,-8.22964,Pública,Non,Si
524,15032194,EOI de Santiago de Compostela,Rúa Ulpiano Villanueva 1-2,Santiago de Compostela,A Coruña,15705,881867901,EOI,42.8928,-8.543636,Pública,Non,Si


In [24]:
# Create a new DataFrame with all the language schools (EOI) or Conservatories (CMUS)
eois = df[(df['Tipo de centro'] == 'EOI') | (df['Tipo de centro'] == 'CMUS')  ]
eois

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
347,15023132,EOI da Coruña,Rúa da Educación s/n,A Coruña,A Coruña,15011,981279100,EOI,43.370686,-8.423161,Pública,Non,Si
427,15026492,CMUS Superior da Coruña,Rúa Manuel Murguía s/n,A Coruña,A Coruña,15011,981141295,CMUS,43.368923,-8.423391,Pública,Non,Si
429,15026546,EOI de Ferrol,Rúa Real 29,Ferrol,A Coruña,15402,981324025,EOI,43.485313,-8.22964,Pública,Non,Si
432,15026650,CMUS Elemental de Betanzos,Praza de Galicia,Betanzos,A Coruña,15300,981773696,CMUS,43.282352,-8.211901,Pública,Non,Non
433,15026662,CMUS Profesional de Carballo,Rúa do Pan s/n,Carballo,A Coruña,15100,981704300,CMUS,43.211384,-8.695722,Pública,Non,Non
437,15026728,CMUS Profesional de Culleredo,Avd.de la Coruña s/n,Culleredo,A Coruña,15670,981667798,CMUS,43.316315,-8.36507,Pública,Non,Non
439,15026741,CMUS Profesional das Pontes de G.Rodríg.,Avenida das Veigas s/n,As Pontes de García Rodríguez,A Coruña,15320,981440024,CMUS,43.45081,-7.862783,Pública,Non,Non
448,15027022,CMUS Profesional Federico Paz Carbajal,Rúa Frai Xosé Dos Santos 7,Noia,A Coruña,15200,981824885,CMUS,42.77871,-8.891314,Pública,Non,Non
453,15027162,CMUS Profesional de Melide,Rúa Galicia s/n,Melide,A Coruña,15800,981507929,CMUS,42.916096,-8.014419,Pública,Non,Non
477,15027617,CMUS Profesional Xan Viaño,Avenida DO MAR - CARANZA 2-4,Ferrol,A Coruña,15406,981333317,CMUS,43.48465,-8.21067,Pública,Non,Si


In [25]:
# Select and show all the IES in Santiago
df[(df['Tipo de centro'] == 'IES') & (df['Concello'] == 'Santiago de Compostela') ]


Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
232,15015743,IES Arcebispo Xelmírez I,Rúa Poza de Bar s/n,Santiago de Compostela,A Coruña,15705,881866962,IES,42.878258,-8.552691,Pública,Non,Si
233,15015755,IES Plurilingüe Rosalía de Castro,Rúa San Clemente 3,Santiago de Compostela,A Coruña,15705,881866556,IES,42.877575,-8.546718,Pública,Non,Si
238,15015861,IES Eduardo Pondal,Rúa Doctor Maceira 9,Santiago de Compostela,A Coruña,15706,881866367,IES,42.87106,-8.554419,Pública,Non,Si
300,15021482,IES San Clemente,Rúa San Clemente s/n,Santiago de Compostela,A Coruña,15705,881867501,IES,42.878563,-8.547453,Pública,Non,Si
359,15023466,IES Lamas de Abade,Rúa Raiola 8,Santiago de Compostela,A Coruña,15702,881866611,IES,42.854702,-8.524084,Pública,Non,Si
391,15025301,IES Arcebispo Xelmírez II,Rúa Irmandiños 15,Santiago de Compostela,A Coruña,15704,881867055,IES,42.8929,-8.534361,Pública,Non,Si
408,15025712,IES Antonio Fraguas Fraguas,Rúa Londres 10,Santiago de Compostela,A Coruña,15703,981588498,IES,42.881245,-8.530136,Pública,Non,Si
440,15026753,IES A Pontepedriña,Rúa Amor Ruibal (A Pontepedriña),Santiago de Compostela,A Coruña,15702,881867152,IES,42.86785,-8.546486,Pública,Non,Si
450,15027058,IES As Fontiñas,Rúa ESTOCOLMO 5,Santiago de Compostela,A Coruña,15707,881866661,IES,42.886105,-8.523109,Pública,Non,Si
459,15027319,IES de Sar,Rúa BERNARDO BARREIRO DE V.V. s/n,Santiago de Compostela,A Coruña,15702,881867162,IES,42.87447,-8.540165,Pública,Non,Si


In [26]:
# Create a DataFrame with Name, Address and center type of all centers in Ferrol
centros_ferrol = df[df.Concello == 'Ferrol']
centros_ferrol = centros_ferrol[['Nome','Enderezo','Tipo de centro']]
# or directly
# centros_ferrol = df[df.Concello == 'Ferrol'][['Nome','Enderezo','Tipo de centro']]
centros_ferrol

Unnamed: 0,Nome,Enderezo,Tipo de centro
104,CPR Plurilingüe Jesús Maestro,Rúa EMILIO ANTON N.9,CPR
105,CPR Plurilingüe La Salle,Rúa Pardo Bazan s/n,CPR
106,CPR Tirso de Molina,Arce s/n,CPR
107,CPR Plurilingüe Sagrado Corazón,Estrada de Castilla 160,CPR
108,CPR Plurilingüe Compañía de María,Rúa SAN AMARO 18,CPR
109,CPR Plurilingüe Cristo Rey,"A Coruña, 35 - 37",CPR
110,CPR Plurilingüe Santa Juana de Lestonnac,Rúa Nai Lestonnac s/n,CPR
111,CPR Plurilingüe San Rosendo,Rúa Pintor Maximo Ramos 11,CPR
113,CPR Belén,"Praza do Tronco, 1-3",CPR
114,CPR Ludy,Rúa Rio Lambre 6-8,CPR


In [27]:
# select a row attending to its position
#centros_ferrol.iloc[0]
centros_ferrol.iloc[1]

Nome              CPR Plurilingüe La Salle
Enderezo               Rúa Pardo Bazan s/n
Tipo de centro                         CPR
Name: 105, dtype: object

In [28]:
# select a row attending to its index
#centros_ferrol.loc[104]
centros_ferrol.loc[105]

Nome              CPR Plurilingüe La Salle
Enderezo               Rúa Pardo Bazan s/n
Tipo de centro                         CPR
Name: 105, dtype: object

In [29]:
# Maybe it could be interesting to use center code as index
df = pd.read_excel(ficheiro,index_col='Código')
df.head()

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15000016,CEIP Plurilingüe San Marcos,Campo da Feira s/n,Abegondo,A Coruña,15318,881880201,CEIP,43.229183,-8.28658,Pública,Non,Si
15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002,CEIP,42.867485,-8.657342,Pública,Non,Si
15000132,CPR Plurilingüe Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103,CPR,42.846325,-8.600729,Privada,Si,Non
15000338,CPI As Mirandas,Avenida Celso Emilio Ferreiro 4,Ares,A Coruña,15624,881930020,CPI,43.429363,-8.246173,Pública,Non,Si
15000363,CEIP Ponte dos Brozos,"Avenida Arsenio Iglesias, 34 (Sabon)",Arteixo,A Coruña,15142,881960506,CEIP,43.30694,-8.510333,Pública,Non,Si


In [30]:
# Select the first row
df.iloc[0]
#df.loc[15000016]

Nome                 CEIP Plurilingüe San Marcos
Enderezo                      Campo da Feira s/n
Concello                                Abegondo
Provincia                               A Coruña
Cód. postal                                15318
Teléfono                               881880201
Tipo de centro                              CEIP
COORDENADA_X                           43.229183
COORDENADA_Y                            -8.28658
TITULARIDADE                             Pública
ENSINO_CONCERTADO                            Non
DEPENDENTE                                    Si
Name: 15000016, dtype: object

In [31]:
# Select the four first rows
df.iloc[0:4]

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15000016,CEIP Plurilingüe San Marcos,Campo da Feira s/n,Abegondo,A Coruña,15318,881880201,CEIP,43.229183,-8.28658,Pública,Non,Si
15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002,CEIP,42.867485,-8.657342,Pública,Non,Si
15000132,CPR Plurilingüe Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103,CPR,42.846325,-8.600729,Privada,Si,Non
15000338,CPI As Mirandas,Avenida Celso Emilio Ferreiro 4,Ares,A Coruña,15624,881930020,CPI,43.429363,-8.246173,Pública,Non,Si


In [32]:
# Select the last row
df.iloc[[-1]]
#df.tail(1)

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15033231,EMUSPR Rockschoolcenter,Rúa Neda 2,Narón,A Coruña,15570,,EMUSPR,43.490913,-8.201881,Privada,Non,Non


In [33]:
# Select the two last rows
df.iloc[-2:]

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15033228,CEIP Novo Mesoiro,Rúa Fragas do Eume s/n,A Coruña,A Coruña,15190,881961235.0,CEIP,43.32447,-8.439917,Pública,Non,Si
15033231,EMUSPR Rockschoolcenter,Rúa Neda 2,Narón,A Coruña,15570,,EMUSPR,43.490913,-8.201881,Privada,Non,Non


In [34]:
# Select the center 15033204
# use the index

df.loc[[15033204]]

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15033204,CEDA Profesional Druida,Rúa Fernando Macías 26 Baixo,A Coruña,A Coruña,15004,,CEDA,43.36643,-8.413181,Privada,Non,Non


In [35]:
# Select the next centers: 15033150, 15033162
df.loc[[15033150, 15033162]]

Unnamed: 0_level_0,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
Código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
15033150,CPREX Semente Compostela,Rúa do Ceo 3 Baixo,Santiago de Compostela,A Coruña,15707,,CPREX,42.89081,-8.529286,Privada,Non,Non
15033162,ESMU Municipal de Negreira,Carreira de San Mauro 11,Negreira,A Coruña,15830,,ESMU,42.909138,-8.736795,Pública,Non,Non


In [36]:
# Sometimes we choose to use loc and sometimes iloc
# loc <- traballa con index/labels
# iloc <- traballa con posicións

In [39]:
# Write a XLS file with CEIP centers
centros_ceip = df[df['Tipo de centro'] == 'CEIP']
#centros_ceip.head()
#centros_ceip.to_excel('output/ceip_ferrol.xls')
centros_ceip.to_excel('output/ceip_ferrol.xlsx')

In [41]:
# Give a name to the sheet
centros_ceip.to_excel('output/ceip_ferrol.xlsx',sheet_name='A Coruña')

In [42]:
# We must to select the sheet to work with during the open operation
ficheiro = '../datasets/centros_educativos_galicia.xls'
df_corunha = pd.read_excel(ficheiro,sheet_name='A Coruña')
df_lugo = pd.read_excel(ficheiro,sheet_name='Lugo')

In [43]:
df_corunha.sample()
#df_lugo.sample()

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
177,15013059,EEI de Vilariño,Vilariño,A Pobra do Caramiñal,A Coruña,15940,636485076,EEI,42.59402,-8.933745,Pública,Non,Si


In [44]:
# Concat dataframes (similar to concat Series)
df_total = pd.concat([df_corunha,df_lugo])
df_total

Unnamed: 0,Código,Nome,Enderezo,Concello,Provincia,Cód. postal,Teléfono,Tipo de centro,COORDENADA_X,COORDENADA_Y,TITULARIDADE,ENSINO_CONCERTADO,DEPENDENTE
0,15000016,CEIP Plurilingüe San Marcos,Campo da Feira s/n,Abegondo,A Coruña,15318,881880201,CEIP,43.229183,-8.286580,Pública,Non,Si
1,15000107,CEIP A Maía,"Rúa Peregrina, s/n (Bertamiráns)",Ames,A Coruña,15220,881866002,CEIP,42.867485,-8.657342,Pública,Non,Si
2,15000132,CPR Plurilingüe Alca,Lugar Biduído de Arriba 36,Ames,A Coruña,15895,981531103,CPR,42.846325,-8.600729,Privada,Si,Non
3,15000338,CPI As Mirandas,Avenida Celso Emilio Ferreiro 4,Ares,A Coruña,15624,881930020,CPI,43.429363,-8.246173,Pública,Non,Si
4,15000363,CEIP Ponte dos Brozos,"Avenida Arsenio Iglesias, 34 (Sabon)",Arteixo,A Coruña,15142,881960506,CEIP,43.306940,-8.510333,Pública,Non,Si
...,...,...,...,...,...,...,...,...,...,...,...,...,...
220,27020975,EMUSPR Casa da Música de Chantada,Praza de Galicia 1,Chantada,Lugo,27500,,EMUSPR,0.000000,0.000000,Privada,Non,Non
221,27020987,CAD Drocer,Calzada Xián 8,Lugo,Lugo,27003,,CAD,43.021520,-7.581664,Privada,Non,Non
222,27020999,CPR A Mariña,Avenida Arcadio Pardiñas 44,Burela,Lugo,27880,,CPR,0.000000,0.000000,Privada,Non,Non
223,27021001,CPR Fundación Laboral de la Construcción,Lugar San Xoán do Alto s/n,Lugo,Lugo,27232,,CPR,42.984690,-7.590076,Privada,Non,Non


In [45]:
# Save CPR centers from the two provinces in an only file
# Only the next fields: Código, nome, enderezo, concello, provincia, código postal e teléfono
df_total[df_total['Tipo de centro'] == 'CPR'][['Código','Nome', 'Enderezo', 'Concello', 'Provincia', 'Cód. postal', 'Teléfono']].to_excel('output/centros_CPR.xlsx',sheet_name='CPR',index='Código')