# Lectura de archivos en Python 

## Índice
1. [Manejo de archivos en Python](#manejo)
2. [Datos estructurados](#estru)
3. [Datos semiestructurados](#semi)
4. [Datos desestructurados](#deses)
5. [FTP](#ftp)

<a id="manejo"></a>
## Manejo de archivos en Python

Las principales funciones para el manejo de archivos en python son: `open()`, `close()`, `read()` y `write()`.  

`open()` permite leer y escribir archivos. El primer argumento es el nombre del archivo y el segundo puede tomar los siguientes valores:
* `r`: abre el fichero en modo de solo lectura (modo por defecto)
* `r+`: abre el fichero en modo lectura y escritura
* `w`: abre el fichero en modo de solo escritura
* `a`: abre el fichero para incluir nueva información sobre él 
* `w+` y `a+`: Lectura y escritura (`a+` añade datos al final del archivo mientras que `w+` sobreescribe)


In [2]:
# Abro el fichero archivo.txt, que en caso de no existir, será creado en el directorio actual
f = open("archivo.txt", "w")

NOTA: Para conocer el directorio actual, podemos utilizar el comando `pwd`

In [3]:
pwd

'C:\\Users\\diego\\MASTER_EOI\\_02_CRAWLERS_APIS_ETL'

`write()` 

In [4]:
# Escritura de datos con la función write()
f.write("Texto de prueba")

15

In [5]:
# Cierre del archivo
f.close()

<a id="estru"></a>
## Datos estructurados

Los archivos de datos estructurados consisten principalmente en archivos csv y Excel 

### CSV
Los archivos **CSV** (comma-separated values) contienen información organizada por separadores. La librería pandas permite leer fácilmente este tipo de archivos  
<img src = "https://www.todavianose.com/wp-content/uploads/2018/04/file-icon-csv.png" width=10%>

In [1]:
import pandas as pd

In [12]:
# Leemos el fichero csv_example.csv
datos = pd.read_csv('files/csv_example.csv',
                    sep=";",
                    header=None,
                    names=['fecha','evento','idpais','idUsuario','fuente','tema'])
datos.head()

Unnamed: 0,fecha,evento,idpais,idUsuario,fuente,tema
0,2018-01-01 00:01:01,read,country_7,2458151261,SEO,North America
1,2018-01-01 00:03:20,read,country_7,2458151262,SEO,South America
2,2018-01-01 00:04:01,read,country_7,2458151263,AdWords,Africa
3,2018-01-01 00:04:02,read,country_7,2458151264,AdWords,Europe
4,2018-01-01 00:05:03,read,country_8,2458151265,Reddit,North America


Podemos conocer los valores únicos de una columna con la función `unique()`

In [13]:
datos.fuente.unique()

array(['SEO', 'AdWords', 'Reddit'], dtype=object)

### Excel

Para leer archivos Excel, podemos utilizar la función `read_excel()` de la librería pandas. Para ello necesitamos instalar la librería `xlrd`:  
`conda install -c anaconda xlrd`


[DIEGO] Adicionalmente he tenido que instalar también esto:
`conda install openpyxl`

In [18]:
# Leemos el fichero excel_example.xlsx
usuarios = pd.read_excel('files/excel_example.xlsx')
usuarios.head()

Unnamed: 0,id_user,age
0,2458151261,22
1,2458151262,34
2,2458151263,22
3,2458151264,57
4,2458151265,28


In [21]:
# Unión de dataframes
datos_all = datos.merge(usuarios, left_on=['idUsuario'], right_on=['id_user'])
datos_all.head()

Unnamed: 0,fecha,evento,idpais,idUsuario,fuente,tema,id_user,age
0,2018-01-01 00:01:01,read,country_7,2458151261,SEO,North America,2458151261,22
1,2018-01-01 00:03:20,read,country_7,2458151262,SEO,South America,2458151262,34
2,2018-01-01 00:04:01,read,country_7,2458151263,AdWords,Africa,2458151263,22
3,2018-01-01 00:04:02,read,country_7,2458151264,AdWords,Europe,2458151264,57
4,2018-01-01 00:05:03,read,country_8,2458151265,Reddit,North America,2458151265,28


In [23]:
# Calculamos la edad media en función del Tema
edad_media = datos_all[['tema','age']].groupby('tema', as_index=False).agg('mean')
edad_media

Unnamed: 0,tema,age
0,Africa,42.64
1,Asia,43.11994
2,Australia,43.619835
3,Europe,43.099379
4,North America,44.030675
5,South America,43.688034


In [24]:
# Guardamos el resultado en csv
edad_media.to_csv('edad_media_calculado.csv', index=0)

<a id="semi"></a>
## Datos semiestructurados

Los formatos más utilizados son XML y JSON

### XML
El formato **XML** (eXtensible Markup Language) es parecido al HTML, pero es más estructurado.
<img src="https://docs.adaptive-vision.com/current/studio/img/manual/XmlDescription.png">

 Los archivos XML forman una estructura de tipo árbol
<img src="https://www.cdn.geeksforgeeks.org/wp-content/uploads/parsing-XML.gif">


Vamos a leer el archivo XML cd_catalog con la librería `ElementTree`

In [1]:
import xml.etree.ElementTree as et

Esta librería trata el XML como si fuese un árbol. En este formato de árbol, disponemos de diversos métodos con los que podemos extraer partes del XML. 

* `tag` muestra el texto dentro de la etiqueta
* `attrib` muestra los atributos de la etiqueta
* `text` muestra el texto del nodo
* La función `iter()` permite conocer la estructura del XML
* La función `find()` busca en el XML y devuelve el elemento que coincide con la etiqueta especificada.  
* La función `findall()` devuelve todos los elementos con cierta etiqueta

In [2]:
tree = et.parse('files/cd_catalog.xml')
raiz = tree.getroot()
print (raiz.tag)

CATALOG


In [3]:
# Para conocer todos los elementos del árbol
for elem in raiz.iter():
    print(elem.tag)

CATALOG
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD
TITLE
ARTIST
COUNTRY
COMPANY
PRICE
YEAR
CD


In [4]:
for hijo in raiz:
    print(hijo.tag, hijo.attrib)

CD {'id': '1'}
CD {'id': '2'}
CD {'id': '3'}
CD {'id': '4'}
CD {'id': '5'}
CD {'id': '6'}
CD {'id': '7'}
CD {'id': '8'}
CD {'id': '9'}
CD {'id': '10'}
CD {'id': '11'}
CD {'id': '12'}
CD {'id': '13'}
CD {'id': '14'}
CD {'id': '15'}
CD {'id': '16'}
CD {'id': '17'}
CD {'id': '18'}
CD {'id': '19'}
CD {'id': '20'}
CD {'id': '21'}
CD {'id': '22'}
CD {'id': '23'}
CD {'id': '24'}
CD {'id': '25'}
CD {'id': '99'}


In [5]:
# Saber el numero de registros que hay en el xml
lst = tree.findall('CD')
print ('Número de registros: ', len(lst))

Número de registros:  26


In [7]:
tree

<xml.etree.ElementTree.ElementTree at 0x1d5d5e48640>

In [31]:
for item in lst:
    print ("\r")
    print ("Id: ", item.attrib['id'])
    print ("Título: ", item.find('TITLE').text)
    print ("Artista: ", item.find('ARTIST').text)
    print ("Precio: ", item.find('PRICE').text)


Id:  1
Título:  Empire Burlesque
Artista:  Bob Dylan
Precio:  10.90

Id:  2
Título:  Hide your heart
Artista:  Bonnie Tyler
Precio:  9.90

Id:  3
Título:  Greatest Hits
Artista:  Dolly Parton
Precio:  9.90

Id:  4
Título:  Still got the blues
Artista:  Gary Moore
Precio:  10.20

Id:  5
Título:  Eros
Artista:  Eros Ramazzotti
Precio:  9.90

Id:  6
Título:  One night only
Artista:  Bee Gees
Precio:  10.90

Id:  7
Título:  Sylvias Mother
Artista:  Dr.Hook
Precio:  8.10

Id:  8
Título:  Maggie May
Artista:  Rod Stewart
Precio:  8.50

Id:  9
Título:  Romanza
Artista:  Andrea Bocelli
Precio:  10.80

Id:  10
Título:  When a man loves a woman
Artista:  Percy Sledge
Precio:  8.70

Id:  11
Título:  Black angel
Artista:  Savage Rose
Precio:  10.90

Id:  12
Título:  1999 Grammy Nominees
Artista:  Many
Precio:  10.20

Id:  13
Título:  For the good times
Artista:  Kenny Rogers
Precio:  8.70

Id:  14
Título:  Big Willie style
Artista:  Will Smith
Precio:  9.90

Id:  15
Título:  Tupelo Honey
Artista:

### <span style="color:red">**Do it yourself**</span> 
Lee el archivo `movies.xml`. ¿Cuál es la estructura del XML en forma de árbol? ¿Cuántas películas hay? ¿Qué generos distintos hay? ¿Cuáles es la película más antigua y la más reciente?

In [76]:
movies = et.parse('files/movies.xml')
lst = movies.findall('movie')

for item in lst:
    print ("\r")
    print ("Title: ", item.find('title').text)
    print ("Year: ", item.find('year').text)
    print ("Country: ", item.find('country').text)
    print ("Genre: ", item.find('genre').text)


Title:  A History of Violence
Year:  2005
Country:  USA
Genre:  Crime

Title:  Heat
Year:  1995
Country:  USA
Genre:  Crime

Title:  Unforgiven
Year:  1992
Country:  USA
Genre:  Western

Title:  Match Point
Year:  2005
Country:  USA
Genre:  Crime

Title:  Lost in Translation
Year:  2003
Country:  USA
Genre:  Drama

Title:  Marie Antoinette
Year:  2006
Country:  USA
Genre:  Drama

Title:  Spider-Man
Year:  2002
Country:  USA
Genre:  Action


In [77]:
print ('Número de peliculas: ', len(lst))

Número de peliculas:  7


In [78]:
import numpy as np
genres = np.array([])
for item in lst:
    genres = np.append(genres, item.find('genre').text)
print ('Generos distintos: ', len(np.unique(genres)))

Generos distintos:  4


In [100]:
temp = []
for item in lst:
    temp.append([item.find('title').text, int(item.find('year').text)])

df = pd.DataFrame(temp, columns=['Title','year'])

print ('La pelicula más nueva es: ', df[df.year == df.year.max()].values[0][0], ', del año ', df[df.year == df.year.max()].values[0][1])
print ('La pelicula más antigua es: ', df[df.year == df.year.min()].values[0][0], ', del año ', df[df.year == df.year.min()].values[0][1])

La pelicula más nueva es:  Marie Antoinette , del año  2006
La pelicula más antigua es:  Unforgiven , del año  1992


### JSON


<img src='https://image.flaticon.com/icons/svg/136/136525.svg' width=10%>

**JSON** (JavaScript Object Notation) es un formato para el intercambios de datos. Un objeto json se forma con pares atributo-valor, éstos deben estar encerrados entre llaves { , } que es lo que definen el inicio y el fin del objeto.
Una de las mayores ventajas que tiene el uso de JSON es que puede ser leído por cualquier lenguaje de programación. En Python podemos utilizar la librería `json`, que trata los ficheros como combinaciones de listas y diccionarios

In [1]:
import json

#Leemos el fichero
f = open('files/data.json')
fichero = f.read()

info = json.loads(fichero)
print(json.dumps(info,indent=4))

[
    {
        "id": 1,
        "president": 1,
        "nm": "George Washington",
        "pp": "None, Federalist",
        "tm": "1789-1797"
    },
    {
        "id": 2,
        "president": 2,
        "nm": "John Adams",
        "pp": "Federalist",
        "tm": "1797-1801"
    },
    {
        "id": 3,
        "president": 3,
        "nm": "Thomas Jefferson",
        "pp": "Democratic-Republican",
        "tm": "1801-1809"
    },
    {
        "id": 4,
        "president": 4,
        "nm": "James Madison",
        "pp": "Democratic-Republican",
        "tm": "1809-1817"
    },
    {
        "id": 5,
        "president": 5,
        "nm": "James Monroe",
        "pp": "Democratic-Republican",
        "tm": "1817-1825"
    },
    {
        "id": 6,
        "president": 6,
        "nm": "John Quincy Adams",
        "pp": "Democratic-Republican",
        "tm": "1825-1829"
    },
    {
        "id": 7,
        "president": 7,
        "nm": "Andrew Jackson",
        "pp": "Democrat",
  

In [6]:
import json

#Leemos el fichero
f = open('files/data.json')
fichero = f.read()

info = json.loads(fichero)
#print(json.dumps(info,indent=4))

for item in info:
    print ('\r')
    print ('Nombre: ', item['nm'])
    print ('Patido: ', item['pp'])
    print ('Años: ', item['tm'])


Nombre:  George Washington
Patido:  None, Federalist
Años:  1789-1797

Nombre:  John Adams
Patido:  Federalist
Años:  1797-1801

Nombre:  Thomas Jefferson
Patido:  Democratic-Republican
Años:  1801-1809

Nombre:  James Madison
Patido:  Democratic-Republican
Años:  1809-1817

Nombre:  James Monroe
Patido:  Democratic-Republican
Años:  1817-1825

Nombre:  John Quincy Adams
Patido:  Democratic-Republican
Años:  1825-1829

Nombre:  Andrew Jackson
Patido:  Democrat
Años:  1829-1837

Nombre:  Martin van Buren
Patido:  Democrat
Años:  1837-1841

Nombre:  William H. Harrison
Patido:  Whig
Años:  1841

Nombre:  John Tyler
Patido:  Whig
Años:  1841-1845

Nombre:  James K. Polk
Patido:  Democrat
Años:  1845-1849

Nombre:  Zachary Taylor
Patido:  Whig
Años:  1849-1850

Nombre:  Millard Fillmore
Patido:  Whig
Años:  1850-1853

Nombre:  Franklin Pierce
Patido:  Democrat
Años:  1853-1857

Nombre:  James Buchanan
Patido:  Democrat
Años:  1857-1861

Nombre:  Abraham Lincoln
Patido:  Republican
Años:  

### <span style="color:red">**Do it yourself**</span> 
Transforma el json anterior a formato csv y guarda el archivo. Compara los tamaños de ambos formatos

In [22]:
id = []
presidente = []
nombre = []
partido = []
tiempo = []

for item in info:
    id.append(item['id'])
    presidente.append(item['president'])
    nombre.append(item['nm'])
    partido.append(item['pp'])
    tiempo.append(item['tm'])
    
df = pd.DataFrame({'id':id,
                 'presidente':presidente,
                 'nombre': nombre,
                 'partido': partido,
                 'tiempo': tiempo})
df.head()

Unnamed: 0,id,presidente,nombre,partido,tiempo
0,1,1,George Washington,"None, Federalist",1789-1797
1,2,2,John Adams,Federalist,1797-1801
2,3,3,Thomas Jefferson,Democratic-Republican,1801-1809
3,4,4,James Madison,Democratic-Republican,1809-1817
4,5,5,James Monroe,Democratic-Republican,1817-1825


In [23]:
#df = pd.read_json('files/data.json')
df.to_csv('files/data_csv.csv', index=None)
df.head()

Unnamed: 0,id,presidente,nombre,partido,tiempo
0,1,1,George Washington,"None, Federalist",1789-1797
1,2,2,John Adams,Federalist,1797-1801
2,3,3,Thomas Jefferson,Democratic-Republican,1801-1809
3,4,4,James Madison,Democratic-Republican,1809-1817
4,5,5,James Monroe,Democratic-Republican,1817-1825


In [24]:
from pathlib import Path
print ('Size Json: ', Path('files/data.json').stat().st_size)
print ('Size CSV: ', Path('files/data_csv.csv').stat().st_size)

Size Json:  5350
Size CSV:  2012


NOTA: Los formatos CSV y JSON/XML son complementarios

<img src='https://aukera.es/blog/imagenes/tabla-codigo.png' width=55%>

Los formatos CSV son en general más compactos que los formatos XML y JSON, siendo esta su principal ventaja. Por otro lado, CSV es el formato menos versátil y no permite crear jerarquías en los datos. Por ejemplo, los siguientes datos contienen jerarquías y es más difícil de plasmar en una tabla:

```json
[
 {
  "student_id":1,
  "age":12,
  "subjects":{
   "mathematics":{
    "scores":[7,8,7,10],
    "final_score":8
   },
   "biology":{
    "scores":[6,6,5,7],
    "final_score":6
   }
  }
 }
]
```

En general, cuando trabajemos con datos tabulares, es recomendable utilizar el formato CSV 

La estructura de un JSON puede ser bastante compleja. Es recomendable el uso de webs como [codebeautify.org](http://codebeautify.org) para representar los JSON en forma de árbol.  

Ejemplo: Accede al príncipe Harry en el archivo `data2.json`

In [25]:
f = open('files/data2.json','r')
fichero = f.read()
info = json.loads(fichero)
info['person']['children'][0]['children'][1]['name']

'Harry'

<a id="deses"></a>
## Datos desestructurados

Los datos no estructurados se caracterizan por no tener un formato específico.
Se almacenan en múltiples formatos como documentos PDF o Word, correos electrónicos, ficheros multimedia de imagen, audio o video...

### TXT

In [26]:
text_file = open('files/mbox.txt','r')
lines = text_file.read()
lines



Una forma de procesar cadenas de texto es a través de expresiones regulares. En python podemos utilizar la librería `re` y la función `findall()`
```
BASIC SYNTAX

.             One character except new line
\.            A period. \ escapes a special character.
\d            One digit
\D            One non-digit
\w            One word character including digits
\W            One non-word character
\s            One whitespace
\S            One non-whitespace
\b            Word boundary
\n            Newline
\t            Tab

MODIFIERS

$             End of string
^             Start of string
ab|cd         Matches ab or de.
[ab-d]	    One character of: a, b, c, d
[^ab-d]	   One character except: a, b, c, d
()            Items within parenthesis are retrieved
(a(bc))       Items within the sub-parenthesis are retrieved

REPETITIONS

[ab]{2}       Exactly 2 continuous occurrences of a or b
[ab]{2,5}     2 to 5 continuous occurrences of a or b
[ab]{2,}      2 or more continuous occurrences of a or b
+             One or more
*             Zero or more
?             0 or 1
(?:           group but don't capture
```

In [30]:
import re

# Obtenemos las cuentas de email del archivo txt
pattern = '([a-z0-9]\S*)@(\S*[a-z])'
extract = re.findall(pattern, lines, flags=re.IGNORECASE)
extract

[('stephen.marquard', 'uct.ac.za'),
 ('postmaster', 'collab.sakaiproject.org'),
 ('200801051412.m05ECIaH010327', 'nakamura.uits.iupui.edu'),
 ('source', 'collab.sakaiproject.org'),
 ('source', 'collab.sakaiproject.org'),
 ('source', 'collab.sakaiproject.org'),
 ('apache', 'localhost'),
 ('source', 'collab.sakaiproject.org'),
 ('stephen.marquard', 'uct.ac.za'),
 ('source', 'collab.sakaiproject.org'),
 ('stephen.marquard', 'uct.ac.za'),
 ('stephen.marquard', 'uct.ac.za'),
 ('louis', 'media.berkeley.edu'),
 ('postmaster', 'collab.sakaiproject.org'),
 ('200801042308.m04N8v6O008125', 'nakamura.uits.iupui.edu'),
 ('source', 'collab.sakaiproject.org'),
 ('source', 'collab.sakaiproject.org'),
 ('source', 'collab.sakaiproject.org'),
 ('apache', 'localhost'),
 ('source', 'collab.sakaiproject.org'),
 ('louis', 'media.berkeley.edu'),
 ('source', 'collab.sakaiproject.org'),
 ('louis', 'media.berkeley.edu'),
 ('louis', 'media.berkeley.edu'),
 ('zqian', 'umich.edu'),
 ('postmaster', 'collab.sakaiproj

In [31]:
# Lo guardamos en una tabla con dos columnas: nombre y dominio
pd.DataFrame(extract, columns=['nombre','dominio'])


Unnamed: 0,nombre,dominio
0,stephen.marquard,uct.ac.za
1,postmaster,collab.sakaiproject.org
2,200801051412.m05ECIaH010327,nakamura.uits.iupui.edu
3,source,collab.sakaiproject.org
4,source,collab.sakaiproject.org
...,...,...
331,cwen,iupui.edu
332,source,collab.sakaiproject.org
333,cwen,iupui.edu
334,cwen,iupui.edu


### <span style="color:red">**Do it yourself**</span> 
Obtén los valores de confianza y probabilidad de spam con otra expresión regular
```
X-DSPAM-Confidence: 0.8475  
X-DSPAM-Probability: 0.0000
```

Calcula el valor medio

In [66]:
pattern = '(X-DSPAM-\S+)(?: )(\d+.\d+)'
extract = re.findall(pattern, lines, flags=re.IGNORECASE)
df = pd.DataFrame(extract, columns=['tipo','valor'])


In [67]:
# Obtenemos el valor medio
df['valor'] = df['valor'].astype(float)
df.groupby('tipo', as_index=False).agg('mean')

Unnamed: 0,tipo,valor
0,X-DSPAM-Confidence:,0.750719
1,X-DSPAM-Probability:,0.0


<a id="ftp"></a>
## FTP

FTP (*File Transfer Protocol*) es un protocolo que permite traspasar archivos online. En Python, podemos utilizar FTP con la librería `ftplib`. Vamos a conectarnos a un servidor FTP utilizando la función `FTP()`, cuyos argumentos son:  
* Nombre del servidor: `f25-preview.runhosting.com` 
* Usuario:  `3185129_EOI`
* Contraseña: `FTP_EOI1920`

In [68]:
import ftplib

In [69]:
ftp = ftplib.FTP('f25-preview.runhosting.com','3185129_EOI','FTP_EOI1920')

In [70]:
ftp.dir()

drwxr-xr-x   2 3185129_EOI 1111           58 Nov 24  2019 .
drwxr-xr-x   2 3185129_EOI 1111           58 Nov 24  2019 ..
-rw-r--r--   1 3185129_EOI 1111        33182 Nov 24  2019 books.xml
-rw-r--r--   1 3185129_EOI 1111         3841 Oct 20  2019 colors.json
-rw-r--r--   1 3185129_EOI 1111       763509 Oct 20  2019 OptaF24.xml


In [72]:
# Descargamos el archivo colors.json
filename = 'colors.json'
ftp.retrbinary("RETR "+filename,open(filename,'wb').write)

'226 Transfer complete'

In [74]:
import json
f = open('./colors.json','r').read()
colores = json.loads(f)

In [75]:
import pandas as pd
colores_df = pd.DataFrame(list(colores.items()), columns=['color','code'])
colores_df.head()

Unnamed: 0,color,code
0,aliceblue,#f0f8ff
1,antiquewhite,#faebd7
2,aqua,#00ffff
3,aquamarine,#7fffd4
4,azure,#f0ffff


In [87]:
colores_df.style.applymap(lambda x: "background-color: %s" %x, subset=['code'])

Unnamed: 0,color,code
0,aliceblue,#f0f8ff
1,antiquewhite,#faebd7
2,aqua,#00ffff
3,aquamarine,#7fffd4
4,azure,#f0ffff
5,beige,#f5f5dc
6,bisque,#ffe4c4
7,black,#000000
8,blanchedalmond,#ffebcd
9,blue,#0000ff


Otras funciones:  
`FTP.getwelcome()` – Obtiene el mensaje de bienvenida.  
`FTP.mkd(ruta)` – Crea un directorio, se le pasa como argumento de entrada la ruta.  
`FTP.rmd(ruta)` – Elimina el directorio que le pasemos.  
`FTP.delete(fichero)` – Elimina el fichero que le pasamos como parámetro de entrada.  
`FTP.pwd()` – (Print Working Directory) Devuelve el directorio actual donde se encuentra.  
`FTP.cwd(ruta)` – (Change Working Directory) Cambia de directorio.  
`FTP.dir(ruta)` – Devuelve un listado de directorios.  
`FTP.nlst(ruta)` – Devuelve un listado con los nombres de arcivo del directorio.  
`FTP.size(archivo)` – Devuelve el tamaño del fichero que le pasamos.  
`FTP.rename(oringen, destino)` – Renombra un fichero.  