# Introducción a la Ciencia de los Datos, CIDE (Profesor Gonzalo Castañeda)

# P4. Funciones y archivos

#### Basado en: McKinney, Wes. 2018. “Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython”, 2a edición, California USA: O’Reilly Media, Inc.
Cap. 3. Secciones 3.2 y 3.3  

## 1. Funciones

### Muy convenientes cuando un conjunto de instrucciones se repiten varias veces en un código

In [2]:
def my_function(x, y, z=1.5):          #los dos primeros argumentos son posicionales, 
     if z > 1:                         # el tercer argumento es una palabra clave (tiene un valor, van al final)
          return z * (x + y)
     else:
          return z / (x + y)           # Si no se define un ‘return’, la función regresa None


Formas de invocar la función:


In [3]:
my_function(5, 6, z=0.7)  

0.06363636363636363

In [4]:
my_function(3.14, 7, 3.5)    

35.49

In [5]:
my_function(x=5, y=6, z=7)


77

## 2. Alcance de las funciones: Local vs global

### Las variables que se definen dentro de una función solo tienen alcance local
### Cuando las instrucciones de la función terminan, su valor se extingue


In [8]:
def func():
      a = []                # se crea una lista y se le asignan números consecutivos:  ‘a’ es local
      for i in range(5):
        a.append(i)
func()

In [9]:
a                           # debe marcar error ya que a lista a se define afuera de la función 

NameError: name 'a' is not defined

In [15]:
a = []                       # como ‘a’ está fuera de la función su valor es global, no se destruye

def func():
    for i in range(5):
       a.append(i)
    
func()

In [16]:
a

[0, 1, 2, 3, 4]

### Una variable puede definirse como global en una función con ‘global a’ antes de invocarla
### En general, no es conveniente usar muchas variables globales 

In [17]:
a = None
def bind_a_variable():
    global a
    a = []
bind_a_variable()


In [18]:
a

[]

## 3. Regresar varias variables

### En una función se pueden regresar distintas variables al mismo tiempo


In [20]:
def f():
     a = 5
     b = 6
     c = 7
     return a, b, c

In [21]:
a, b, c = f()       # en realidad lo que se regresa es una tupla que se desempaca en tres variable

In [23]:
b

6

### Si se quiere regresar como diccionario, habría que escribir


In [25]:
def f():
    a = 5
    b = 6
    c = 7
    return {'a' : a, 'b' : b, 'c' : c}

In [26]:
f()   

{'a': 5, 'b': 6, 'c': 7}

In [27]:
T = f()   
T

{'a': 5, 'b': 6, 'c': 7}

## 4. Las funciones como objetos

### A las funciones se les da un tratamiento de objetos, como a las estructuras de datos 
### Supón que queremos limpiar una lista de 'strings' que presenta 'typos':

In [30]:
states = ['  Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda', 'south carolina##', 'West virginia? ']  

### En este caso conviene importar métodos de la librería de 'expresiones regulares' que ayuda a trabajar con textos.


In [33]:
import re
def clean_strings(strings):
         result = []
         for value in strings:
              value = value.strip()                # quita espacios en blanco
              value = re.sub('[!#?]', '', value)   # remueve símbolos raros
              value = value.title()                # usa formato de título, primera letra con mayúscula
              result.append(value)
         return result

In [34]:
clean_strings(states)  


['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

## 5. Funciones anónimas (lambda) 

### Forma de construir funciones en una sola línea usando el comando lambda
### Se tiene que especificar la variable a la que se regresa el valor:


In [36]:
def short_function(x):
  return x * 2

### Puede reescribirse (Ejemplo 1):
Se llama anónima porque a la función no se le da un 					   nombre


In [37]:
equiv_anon = lambda x: x * 2           # se especifica la variable a la que se aplica la operación
equiv_anon(3)                          # se pueden usar varios argumentos antes del signo de igualdad

6

### Ejemplo 2: 

In [6]:
ints = [4, 0, 1, 5, 6]  
al_cuadrado = lambda x: [x * 2 for x in ints]  

In [7]:
al_cuadrado(ints)                   # al_cuadrado no es una función como tal porque no se declara su nombre con def:         

[8, 0, 2, 10, 12]

## 6. Generadores

### En Python existe un protocolo para iterar sobre secuencias (objetos en lista, líneas en un archivo, etc)

In [41]:
some_dict = {'a': 1, 'b': 2, 'c': 3}   
for key in some_dict:
        print(key)
dict_iterator = iter(some_dict)  ;                  # los key son los iteradores de un diccionario
list(dict_iterator)                                 # los definimos en una lista

a
b
c


['a', 'b', 'c']

### Un generador es una forma concisa de obtener un objeto iterable, mediante el comando: yield


In [43]:
def squares(n=10):
      print('Generating squares from 1 to {0}'.format(n ** 2))     # linea no se imprime cuando sea crea el iterador
      for i in range(1, n + 1):
          yield i ** 2              
gen = squares()                            # el iterador se crea en memoria, pero no se usa o imprime hasta que sea invocado
for x in gen:
       print(x, end=' ')                   # el segundo argumento es para imprimir en la misma línea

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

## 6.a Expresiones del generador

### Una manera más rápida de obtener generadores sería mediante una expresión:

In [49]:
gen = (x ** 2 for x in range(15))

In [50]:
list(gen)                                 # si no lo transformo en una lista no lo puedo usar

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196]

### Las expresiones de generadores también pueden usarse como compresiones:


In [51]:
sum(x ** 2 for x in range(100))

328350

In [52]:
dict((i, i **2) for i in range(5))

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

### La librería itertools  tiene una colección de generadores


In [56]:
import itertools  
first_letter = lambda x: x[0]  
names = ['Alan', 'Adam', 'Wes', 'Will', 'Robert', 'Richard']
for letter, names in itertools.groupby(names, first_letter):   # va creando listas de nombres de acuerdo con letra inicial
     print(letter, list(names))                                # se le pone list, ya que names es un generador
                                     # va formando la lista hasta que aparezca una letra diferente (cambia Robert por Albert)

A ['Alan', 'Adam']
W ['Wes', 'Will']
R ['Robert', 'Richard']


## 7. Manejo de errores y excepciones

### Cuando hay un error en el código y no queremos que se detenga  la corrida, hay que usar el esquema de excepciones. Por ejemplo:


In [60]:
def attempt_float(x):      # si se puede poner el valor real hace la operación, de lo  contrario lo mantiene
    try:
        return float(x)
    except:
       return x
attempt_float('1.2345')       

1.2345

In [61]:
attempt_float('something')   

'something'

## 8. Lectura y escritura de archivos

### ¿Cómo trabajar con archivos en Phyton?
### Si queremos abrir un archivo para su lectura y posterior escritura, primero hay que establecer en Spyder la dirección en la que se ubica el archivo


In [67]:
f = open('segismundo.txt ', encoding='utf-8' )           # el archivo 'segismundo.txt'  debe subirse jupyter dashboard
                                                         # con este código se puede leer acentos y ñ 

### Por default, el archivo abre en modo de lectura ‘r’, podemos iterar sobre las líneas de f


In [68]:
for line in f:
    print(line)         # imprime línea por línea

Sueña el rico en su riqueza,

que más cuidados le ofrece;



sueña el pobre que padece

su miseria y su pobreza;



sueña el que a medrar empieza,

sueña el que afana y pretende,

sueña el que agravia y ofende,



y en el mundo, en conclusión,

todos sueñan lo que son,

aunque ninguno lo entiende.





### Si quiero poner las líneas como un argumento de una lista:


In [69]:
lines = [x.rstrip() for x in open('segismundo.txt', encoding='utf-8')]   

In [70]:
lines

['Sueña el rico en su riqueza,',
 'que más cuidados le ofrece;',
 '',
 'sueña el pobre que padece',
 'su miseria y su pobreza;',
 '',
 'sueña el que a medrar empieza,',
 'sueña el que afana y pretende,',
 'sueña el que agravia y ofende,',
 '',
 'y en el mundo, en conclusión,',
 'todos sueñan lo que son,',
 'aunque ninguno lo entiende.',
 '']

### Siempre conviene cerrar el archivo una vez que se extrae la información deseada


In [80]:
f.close()                          # se cierra el archivo por precaución