# Funciones

Los lenguajes de programación [procedimental](https://es.wikipedia.org/wiki/Programaci%C3%B3n_por_procedimientos) permiten estructurar el código mediante la creación de bloques de código denominados funciones (también denominados subrutinas o procedimientos).

Las funcionen suelen utilizarse con dos objetivos principales:

  - Evitar la duplicación del código. Si en un programa hay dos secciones que repiten el mismo código podemos crear una función que realice esa tarea y llamarla desde ambos lugares.
  - Encapsular una funcionalidad. Por ejemplo, si tenemos una sección de un programa que calcula la serie de Fibonacci, incluso aunque la llamemos una sola vez, quedará más claro el programa si aislamos, encapsulamos, ese código dentro de una función.

## Definición

En Python las funciones se definen con la sentencia def.

In [3]:
def nombre_funcion(saludo):
    print(saludo)
    
nombre_funcion('Hola')


Hola


## return

Las funciones pueden devolver valores utilizando la sentencia return.

In [4]:
def suma(numero1, numero2):
    suma = numero1 + numero2
    return suma
    
suma(1, 1)

2

return puede devolver varios valores.

In [6]:
def dobla_el_rectangulo(lado1, lado2):
    return lado1 * 2, lado2 * 2

lado1, lado2 = dobla_el_rectangulo(1, 2)
print(lado1, lado2)

2 4


En el caso de devolver varios valores implícitamente lo que está haciendo la función es devolver una tupla.

In [7]:
resultado = dobla_el_rectangulo(2, 3)
print(resultado)
lado1, lado2 = resultado
print(lado1, lado2)

(4, 6)
4 6


Cuando una función no termina sin un return devolverá None.

In [8]:
def saluda(saludo):
    print(saludo)
    
resultado = saluda('hola')
print(resultado)

hola
None


## Ámbito de las variables

El uso de las variables está restringido a ciertas partes de el programa, su ámbito y las funciones son uno de los ámbitos en los que las variables están definidas.
Una variable definida dentro de una función no está disponible fuera de ella, es local de esa función.

In [11]:
def suma(num1, num2):
    total = num1 + num2
    print(total)
    return total
suma(1, 2)
print(total)

3


NameError: name 'total' is not defined

También se pueden definir funciones globales fuera de las funciones. Estas variables estarán disponibles para ser leídas dentro de cualquier función.

In [12]:
VARIABLE_GLOBAL = 'cuidado con las variables globales'
def saluda():
    print(VARIABLE_GLOBAL)
saluda()

cuidado con las variables globales


Las variables globales suelen escribirse en letras mayúsculas.

Es una mala práctica intentar modificar una variable global dentro de una función.
Sólo deberíamos modificar una variable cuando se la hemos pasado a la función o cuando se ha creado localmente.
Modificar una variable global puede causar fallos de programación difíciles de detectar.
Además, podemos tener problemas con las variables globales que no sean de solo lectura si programamos utilizando threads.

En Python, por defecto, si intentamos modificar una variable global Python obtendremos un error.

In [4]:
GLOBAL = 'hola'

def saluda():
    print(GLOBAL)

saluda()

def saluda2():
    print(GLOBAL)
    GLOBAL = 'adios'

saluda2()


hola


UnboundLocalError: local variable 'GLOBAL' referenced before assignment

## Argumentos con valores por defecto

En Python podemos asignar valores por defecto a los argumentos que pasamos a una función.
Estos argumentos pasan a ser opcionales.

In [13]:
def saluda(saludo='Hola'):
    print(saludo)
saluda()
saluda('Adiós')

Hola
Adiós


## Argumentos por clave (keyword arguments)

Las llamadas a las funciones en Python admiten argumentos pasados según el orden en el que se escriben en la llamada o según su nombre.

In [15]:
def saluda_mucho(saludo, veces):
    print(saludo * veces)
saluda_mucho('Hola', 3)

HolaHolaHola


In [16]:
saluda_mucho(veces=3, saludo='Hola')

HolaHolaHola


Las llamadas a las funciones admiten muchas más posibilidades que siendo este un tutorial de introducción ignoraremos.

## Documentación

Si deseamos documentar una función podemos hacerlo incluyendo una cadena de texto como su primera línea.

In [1]:
def saluda(saludo):
    '''Esta función saluda'''
    print(saludo)

help(saluda)

Help on function saluda in module __main__:

saluda(saludo)
    Esta función saluda



## lambda

En Python podemos crear funciones anónimas utilizando la expresión lambda.

In [6]:
numeros = range(10)
cuadrados = list(map(lambda x: x**2, numeros))
print(cuadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


lamba permite crear funciones tal y como nos permite crearlas def. El código anterior se podría haber escrito utilizando def, pero si la función es pequeña y sólo se va a utilizar en un lugar a veces se utiliza lambda.

In [7]:
def eleva_al_cuadrado(numero):
    return numero**2

cuadrados = list(map(eleva_al_cuadrado, numeros))
print(cuadrados)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


lamba permite incluir una sola instrucción y no tendrá un return, se devuelve el resultado de la instrucción.

## Pasando argumentos por valor, referencia y por asignación

Dado que las funciones definen un ámbito si queremos pasarles un objeto utilizando uno de los argumentos de la función debemos decidir cómo exactamente se pasa este objeto ¿se hace una copia y se le pasa, nos referimos al mismo objeto?
Distintos lenguajes de programación, cuando hacen una llamada a una función, pasan los objetos a la función de distintos modos:

  - [Por valor](https://en.wikipedia.org/wiki/Evaluation_strategy#Call_by_value). Se hace una copia del objeto y este nuevo objeto copiado es asignado a la variable definida dentro del ámbito de la función. En este caso si modificamos la variable definida dentro de la función la de fuera no se verá alterada ya que es sólo una copia de la de fuera.
  - [Por referencia](https://en.wikipedia.org/wiki/Evaluation_strategy#Call_by_reference). La variable es un puntero a la dirección de la memoria que ocupa el objeto. La nueva variable creada dentro de la función es otro puntero a la misma posición de la memoria. En este caso si modificamos la variable dentro de la función la de fuera también se verá alterada puesto que ambos punteros, el de dentro y el de fuera, apuntan a la misma posición de la memoria y, por lo tanto, al mismo objeto.
  - Por asignación (también llamada por [compartición](https://en.wikipedia.org/wiki/Evaluation_strategy#Call_by_sharing)). La variable es una etiqueta que se le asigna a un objeto. Cuando se crea la variable dentro de la función es otra etiqueta al mismo objeto. En este caso si asignamos la variable a un nuevo objeto ni la variable externa a la función, ni el objeto al que se refería se verán afectados.
  
En C y C++ se pueden pasar argumentos por valor o por referencia y, sin embargo, en Python se hace por asignación.
En la wikipedia hay una introducción más teórica a la [evaluación de los argumentos](https://en.wikipedia.org/wiki/Evaluation_strategy) y en la documentación de Python hay información extra sobre cómo pasar variables [por referencia](https://docs.python.org/3/faq/programming.html#how-do-i-write-a-function-with-output-parameters-call-by-reference).

Estas distintas estrategias tienen profundas consecuencias en el comportamiento de los programas en los distintos lenguajes de programación y es muy importante entender qué estamos haciendo exactamente cuando pasamos un objeto a una función.
Si no lo tenemos claro podemos enfrertarnos a comportamientos que nos parecerán paradójicos.
Veamos un ejemplo en el que la función comparte el mismo objeto con quien la llama y lo modifica.

In [3]:
def eleva_al_cuadrado(numeros):
    for idx, numero in enumerate(numeros):
        numeros[idx] = numero ** 2

algunos_numeros = [2, 3]
print(algunos_numeros)
eleva_al_cuadrado(algunos_numeros)
print(algunos_numeros)

[2, 3]
[4, 9]


Sin embargo, también podemos escribir la función para que no altere la lista original.

In [4]:
def eleva_al_cuadrado(numeros):
    numeros_al_cuadrado = []
    for idx, numero in enumerate(numeros):
        numeros_al_cuadrado.append(numero ** 2)
    return numeros_al_cuadrado

algunos_numeros = [2, 3]
print(algunos_numeros)
numeros_al_cuadrado = eleva_al_cuadrado(algunos_numeros)
print(algunos_numeros)
print(numeros_al_cuadrado)

[2, 3]
[2, 3]
[4, 9]


Este comportamiento no será un problema si los objetos son inmutables, como las cadenas de texto o las tuplas porque la función no podrá modificarlos.
En general es una mala idea que la función modifique los parámetros que se le pasan porque quien se los pasa no tiene por qué tener esta modificación en cuenta.
Evitaremos muchos errores inesperados si nos exigimos no modificar nunca los objetos que se pasan a una función.
En algunos casos, por motivos de eficiencia, será necesario hacerlo, pero deberíamos avisar al usuario de la función de ese comportamiento para que lo tenga en cuenta. Pero recuerda que [la optimización prematura es el origen de muchos males](https://en.wikiquote.org/wiki/Donald_Knuth#Computer_Programming_as_an_Art_(1974)) y, por lo tanto, debes evitarla.

## Ejercicios

### 1

Corrige el siguiente programa para calcular el área de un triángulo.

In [10]:
from math import sqrt
def calcular_area_triangulo(lado1, lado2, lado3):
    semiperimetro = (lado1 + lado2 + lado3) / 2.0
    area2 = semiperimetro * (semiperimetro - lado1) * (semiperimetro - lado2) * (semiperimetro - lado3)
    area = sqrt(area2)

print(calcular_area_triangulo(4, 5, 3))
calcular_area_triangulo(1, 2, 3)

None


### 2

Escribe un programa que calcule el área de un triángulo utilizando la fórmula: base * altura / 2.

### 3

Corrige el siguiente programa para calcular el factorial.

In [2]:
def factorial(numero):
    acumulado = 1
    for indice in range(1, numero + 1):
        acumulado = indice
    return acumulado

print(factorial(10))

10


### 4

Escribe un programa que sume los números de una lista.

### 5

Corrige el siguiente programa que busca palabras comunes entre dos frases.

In [3]:
def palabras_comuns(frase1, frase2):
    set1 = set(frase1.strip().split())
    set2 = set(frase2.strip())
    comunes = set1.union(set2)

print(palabras_comunes('Hola caracola', 'La caracola enterrada'))

NameError: name 'palabras_comunes' is not defined

### 6

Escribe una función que cuente las palabras dada una lista de frases.

### 7

Crea un programa que contenga una función a la que podamos darle el nombre de un fichero, una lista de palabras y que imprima las líneas que contengan una de esas palabras.

### 8

Disponemos tres medidas de expresión génica para una serie de genes en dos muestras.
Escribie un programa que calcule la media entre triplicados el experimento de microarrays utilizando funciones.

El contenido del fichero de texto de entrada debe ser el siguiente:

```
nombre_gen muestra_1_1 muestra_1_2 muestra_1_3 muestra_2_1 muestra_2_2 muestra_2_3
gen1 1.2 1.3 1.4 7.6 6.5 8.7
gen2 4.5 3.4 3.9 2.5 3.2 3.3
gen3 9.6 8.7 8.3 5.5 5.4 4.5
gen4 2.3 3.2 2.1 3.1 2.9 3.2
```

### 9

Dado el siguiente fichero de genotipado masivo:

```
marcador padre madre f1 hib1 hib2 hib3
snp1 GG CC GC GG GC CC
snp2 AA TT AT    AT TT
snp3 AA CC AC CC AC AC
```

Crea un fichero en el que el genotipo del padre sea A, el de la madre B y los híbridos sean H (heterocigoto), A, B o X (desconocido):

```
marcador hib1 hib2 hib3
snp1 A H B
snp2 X H B
snp3 B H H
```

La estructura del programa debe ser parecida a:

In [None]:
def transformar_formato(genotipo):
  return formato arreglado

def cambiar_formato_genotipo(fichero):
  for linea in fichero:
    Si primera linea:
      imprimir
    else:
      marcador, genotipo = linea.split
      genotipo = transformar_formato(genotipo)
      imprimir marcador y genotipo

cambiar_formato_genotipo(fichero)

### 10

Dado el fichero con el conjunto de datos [Iris](../datos/iris.data), calcula la media para el largo y el ancho del sépalo y el ancho y el largo del pétalo por especie.

Divide el programa en funciones, una que lea los datos, otra que haga las medias y otra que llame a las anteriores.

### 11

Escribe un programa al que le podamos dar una tabla, como la de los datos Iris, y que nos permita filtrar filas dado el nombre de una columna y el contenido de la fila.
Por ejemplo, que podamos decirle que filtre las filas que tienen en la columna "especie" los valores "Iris-setosa" o "Iris-versicolor".

Además, queremos poder darle una lista con las columnas que deseamos mantener en el fichero de salida.

## Soluciones

### 1

Corrige el siguiente programa para calcular el área de un triángulo.

In [16]:
from math import sqrt
def calcular_area_triangulo(lado1, lado2, lado3):
    semiperimetro = (lado1 + lado2 + lado3) / 2.0
    area2 = semiperimetro * (semiperimetro - lado1) * (semiperimetro - lado2) * (semiperimetro - lado3)
    area = sqrt(area2)
    return area

print(calcular_area_triangulo(4, 5, 3))
print(calcular_area_triangulo(1, 2, 3))

6.0
0.0


### 2

Escribe un programa que calcule el área de un triángulo utilizando la fórmula: base * altura / 2.

In [19]:
def calcular_area_triangulo(base, altura):
    area = base * altura / 2.0
    return area

print(calcular_area_triangulo(3, 5))
print(calcular_area_triangulo(7, 3))


7.5
10.5


### 3

Corrige el siguiente programa para calcular el factorial.

In [20]:
def factorial(numero):
    acumulado = 1
    for indice in range(1, numero + 1):
        acumulado *= indice
    return acumulado

print(factorial(10))

3628800


### 4

Escribe un programa que sume los números de una lista.

In [22]:
def suma_lista(lista):
     acumulado = 0
     for numero in lista:
         acumulado += numero
     return acumulado

print(suma_lista([1, 2, 3, 4]))

10


### 5

Corrige el siguiente programa que busca palabras comunes entre dos frases.

In [23]:
def palabras_comunes(frase1, frase2):
    set1 = set(frase1.strip().split())
    set2 = set(frase2.strip().split())
    comunes = set1.intersection(set2)
    return comunes

print(palabras_comunes('Hola caracola', 'La caracola enterrada'))

{'caracola'}


### 6

Escribe una función que cuente las palabras dada una lista de frases.

In [24]:
def contar_palabras(lista_frases):
    contador = {}
    for frase in lista_frases:
        palabras = frase.strip().split()
        for palabra in palabras:
            if palabra not in contador:
                contador[palabra] = 0
            contador[palabra] += 1
    return contador

print(contar_palabras(['Hola caracola', 'La caracola enterrada']))

{'La': 1, 'enterrada': 1, 'Hola': 1, 'caracola': 2}


### 7

Crea un programa que contenga una función a la que podamos darle el nombre de un fichero, una lista de palabras y que imprima las líneas que contengan una de esas palabras.

In [32]:
from io import StringIO
def imprimir_lineas_coincidentes(fichero, patrones):
    '''Dado un fichero y unos patrones imprime las lineas coincidentes
    Para cada linea del fichero se evaluara si incluye uno de los patrones
    o no. Si uno de los patrones esta presente la linea se imprimira.

    Los patrones deben ser una lista de cadenas de texto.
    '''

    #este bucle se ejecutara una vez por cada linea
    for linea in fichero:
        #hemos de comprobar si algun patron esta en la lista
        #hacemos un bucle que recorra todos los patrones
        algun_patron_en_linea = False   #por defecto asumimos que
                                        #ningun patron se encuentra
                                        #en la linea
        for patron in patrones:
            if patron in linea:
                algun_patron_en_linea = True
                #como hemos encontrado al menos un patron
                #no es necesario continuar con el bucle
                break

        #una vez sabemos si para la presente linea hay algun
        #patron coincidente o no podemos imprimirla
        if algun_patron_en_linea:
            print(linea)

contenido_fichero = 'Un texto1\nSeguido de otro texto\n'
fichero = StringIO(contenido_fichero)
patrones = ['texto1', 'texto2']
imprimir_lineas_coincidentes(fichero, patrones)

Un texto1



### 8

Disponemos tres medidas de expresión génica para una serie de genes en dos muestras.
Escribie un programa que calcule la media entre triplicados el experimento de microarrays utilizando funciones.

El contenido del fichero de texto de entrada debe ser el siguiente:

```
nombre_gen muestra_1_1 muestra_1_2 muestra_1_3 muestra_2_1 muestra_2_2 muestra_2_3
gen1 1.2 1.3 1.4 7.6 6.5 8.7
gen2 4.5 3.4 3.9 2.5 3.2 3.3
gen3 9.6 8.7 8.3 5.5 5.4 4.5
gen4 2.3 3.2 2.1 3.1 2.9 3.2
```

In [37]:
from io import StringIO

def calcular_media(valores):
    '''Dada una lista de valores devuelve la media.

    Los valores pueden ser cadenas de texto, int o float.
    '''
    #pasamos todos los valores a float
    valores = list(map(float, valores))

    media = sum(valores) / len(valores)
    return media


def calcular_medias(fichero):
    'Calcula las medias para los triplicados de un microarray'

    for linea in fichero:
        linea = linea.strip()   #eliminamos el retorno de carro

        #La primera linea solo hay que imprimirla
        if 'nombre_gen' in linea:
            #para esta linea no hay que ejecutar nada
            #mas en el bucle for
            continue

        items = linea.split()
        nombre_gen = items[0]
        valores1 = items[1:4]
        valores2 = items[4:7]

        media1 = calcular_media(valores1)
        media2 = calcular_media(valores2)

        print(nombre_gen, media1, media2)

fichero = StringIO('''nombre_gen muestra_1_1 muestra_1_2 muestra_1_3 muestra_2_1 muestra_2_2 muestra_2_3
gen1 1.2 1.3 1.4 7.6 6.5 8.7
gen2 4.5 3.4 3.9 2.5 3.2 3.3
gen3 9.6 8.7 8.3 5.5 5.4 4.5
gen4 2.3 3.2 2.1 3.1 2.9 3.2
''')
calcular_medias(fichero)

gen1 1.3 7.599999999999999
gen2 3.9333333333333336 3.0
gen3 8.866666666666665 5.133333333333334
gen4 2.533333333333333 3.0666666666666664


### 9

Dado el siguiente fichero de genotipado masivo:

```
marcador padre madre f1 hib1 hib2 hib3
snp1 GG CC GC GG GC CC
snp2 AA TT AT    AT TT
snp3 AA CC AC CC AC AC
```

Crea un fichero en el que el genotipo del padre sea A, el de la madre B y los híbridos sean H (heterocigoto), A, B o X (desconocido):

```
marcador hib1 hib2 hib3
snp1 A H B
snp2 X H B
snp3 B H H
```

In [43]:
from io import StringIO

def transformar_genotipo(linea_genotipo):
    '''Transforma una linea de genotipo

    desde:
       snp1 GG CC GC GG GC CC
    a:
       snp1 A H B
    '''

    #no podemos hacer:
    #items = linea_genotipo.split()
    #
    #porque los datos faltantes estan codificados
    #por espacios

    marcador, genotipos = linea_genotipo.split(' ', 1)

    #dividimos el resto de genotipos
    #los genotipos ahora son -> GG CC GC GG GC CC
    genotipos_separados = []
    for posicion in range(0, len(genotipos), 3):
        genotipo = genotipos[posicion: posicion + 2]
        genotipos_separados.append(genotipo)
    #los genotipos ahora son una lista:
    # ['GG ', 'CC ', 'GC ', 'GG ', 'GC ', 'CC ']


    genotipo_padre = genotipos_separados.pop(0)
    # ['CC ', 'GC ', 'GG ', 'GC ', 'CC ']
    genotipo_madre = genotipos_separados.pop(0)
    # ['GC ', 'GG ', 'GC ', 'CC ']
    genotipo_hib   = genotipos_separados.pop(0)
    # ['GG ', 'GC ', 'CC ']

    #ahora debemos transformar cada uno de los genotipos
    #de los hibridos
    genotipos_transformados = []
    for genotipo in genotipos_separados:
        if genotipo == '  ':
            genotipo = 'X'
        elif genotipo == genotipo_padre:
            genotipo = 'A'
        elif genotipo == genotipo_madre:
            genotipo = 'B'
        elif genotipo == genotipo_hib:
            genotipo = 'H'
        else:
            print('Ha habido un fallo, genotipo desconocido', genotipo)
        genotipos_transformados.append(genotipo)

    #los items de la linea transformada
    items = [marcador] + genotipos_transformados
    #la linea tiene los items separados por comas
    linea = ' '.join(items)

    return linea


def cambiar_formato_genotipos(fichero):
    '''Transforma un fichero de genotipado a otro formato.

    El formato de entrada debe ser:

       marcador padre madre f1 hib1 hib2 hib3
       snp1 GG CC GC GG GC CC
       snp2 AA TT AT    AT TT
       snp3 AA CC AC CC AC AC

    Y el de salida:

       marcador hib1 hib2 hib3
       snp1 A H B
       snp2 X H B
       snp3 B H H

    A -> Homocigoto como el padre
    H -> heterocigoto
    B -> Homocigoto como la madre
    X -> Dato faltante
    '''

    for linea in fichero:
        linea = linea.strip()
        if 'padre' in linea:    #es la primera linea
            items = linea.split()
            print(items[0], ' '.join(items[4:]))
                                 #items[0] sera marcador
                                 #items[4:] imprime el nombre
                                 #de los hibridos
            continue    #En esta iteracion abandonamos el bucle aqui

        #esto se ejecutara para cada linea excepto
        #la de la cabecera
        print(transformar_genotipo(linea))

fichero_genotipos = StringIO('''marcador padre madre f1 hib1 hib2 hib3
snp1 GG CC GC GG GC CC
snp2 AA TT AT    AT TT
snp3 AA CC AC CC AC AC''')
cambiar_formato_genotipos(fichero_genotipos)
    

marcador hib1 hib2 hib3
snp1 A H B
snp2 X H B
snp3 B H H


### 10

Dado el fichero con el conjunto de datos [Iris](../datos/iris.data), calcula la media para el largo y el ancho del sépalo y el ancho y el largo del pétalo por especie.

Divide el programa en funciones, una que lea los datos, otra que haga las medias y otra que llame a las anteriores.

In [59]:
from pathlib import Path
from csv import DictReader
from collections import defaultdict


def lee_fichero_iris(fichero):
    lector = DictReader(fichero)
    
    for fila in lector:
        datos_planta = {}
        # Tenemos que pasar los numeros a float
        for clave, valor in fila.items():
            if valor.replace('.', '').isdigit():
                valor = float(valor)
            datos_planta[clave] = valor
        yield datos_planta


def calcula_medias_por_especie(datos_iris):
    datos_por_especie_y_caracter = defaultdict(dict)
    for planta in datos_iris:
        especie = planta['especie']
        for caracter, valor in planta.items():
            if not caracter in datos_por_especie_y_caracter[especie]:
                datos_por_especie_y_caracter[especie][caracter] = []
            datos_por_especie_y_caracter[especie][caracter].append(valor)
            
    medias = defaultdict(dict)
    for especie, datos_por_caracter in datos_por_especie_y_caracter.items():
        for caracter, valores in datos_por_caracter.items():
            if caracter == 'especie':
                continue
            media = sum(valores) / len(valores)
            medias[especie][caracter] = media
    return medias
        
ruta = Path('../datos/iris.data')
datos_iris = lee_fichero_iris(ruta.open('rt'))
calcula_medias_por_especie(datos_iris)

defaultdict(dict,
            {'Iris-setosa': {'ancho_petalo': 0.2439999999999999,
              'ancho_sepalo': 3.4180000000000006,
              'largo_petalo': 1.464,
              'largo_sepalo': 5.005999999999999},
             'Iris-versicolor': {'ancho_petalo': 1.3259999999999998,
              'ancho_sepalo': 2.7700000000000005,
              'largo_petalo': 4.26,
              'largo_sepalo': 5.936},
             'Iris-virginica': {'ancho_petalo': 2.026,
              'ancho_sepalo': 2.9739999999999998,
              'largo_petalo': 5.552,
              'largo_sepalo': 6.587999999999998}})

### 11

Escribe un programa al que le podamos dar una tabla, como la de los datos Iris, y que nos permita filtrar filas dado el nombre de una columna y el contenido de la fila.
Por ejemplo, que podamos decirle que filtre las filas que tienen en la columna "especie" los valores "Iris-setosa" o "Iris-versicolor".

Además, queremos poder darle una lista con las columnas que deseamos mantener en el fichero de salida.

In [60]:
from pathlib import Path
from csv import DictReader

def filtra_fichero_csv(fichero, columna_filtro, valores_filtro, columnas_fichero_salida):
    
    lector = DictReader(fichero)
    
    yield columnas_fichero_salida

    for fila in lector:
        if fila[columna_filtro] not in valores_filtro:
            continue
        valores_salida = [fila[columna] for columna in columnas_fichero_salida]
        yield valores_salida

ruta = Path('../datos/iris.data')
resultado = filtra_fichero_csv(ruta.open('rt'), columna_filtro='especie', valores_filtro=['Iris-setosa'], columnas_fichero_salida=['largo_sepalo'])
print(list(resultado))

[['largo_sepalo'], ['5.1'], ['4.9'], ['4.7'], ['4.6'], ['5.0'], ['5.4'], ['4.6'], ['5.0'], ['4.4'], ['4.9'], ['5.4'], ['4.8'], ['4.8'], ['4.3'], ['5.8'], ['5.7'], ['5.4'], ['5.1'], ['5.7'], ['5.1'], ['5.4'], ['5.1'], ['4.6'], ['5.1'], ['4.8'], ['5.0'], ['5.0'], ['5.2'], ['5.2'], ['4.7'], ['4.8'], ['5.4'], ['5.2'], ['5.5'], ['4.9'], ['5.0'], ['5.5'], ['4.9'], ['4.4'], ['5.1'], ['5.0'], ['4.5'], ['4.4'], ['5.0'], ['5.1'], ['4.8'], ['5.1'], ['4.6'], ['5.3'], ['5.0']]
