# Normalizando
[Pablo A. Haya](https://pablohaya.com)

Ya hemos comentado que *no* es posible en `Python` cambiar el contenido de una cadena de caracteres. Lo que si podemos es generar una nueva cadena. El sigui`ente conjunto de métodos nos permiten crean nuevas cadenas que reflejan un cambio sobre la original. Por ejemplo, para cambiar todos los caracteres a minúsculas. 

In [1]:
poeta = "Garcilaso de la Vega"
print(poeta.lower())

garcilaso de la vega


El resultado de llamar al método `lower()` es una nueva cadena que contiene los caracteres en minúsculas de la cadena original. La mayor parte de los métodos se pueden también llamar como funciones.

**Prueba tú mismo** el método `upper()` que es el equivalente a `lower()` pero para pasar a mayúsculas

El método `lower()` se puede utilizar cuando se quiere comparar dos cadenas, de manera que la comparación no sea insensible a si están escritas en mayúsculas o minúsculas.

In [2]:
poeta1 = "Garcilaso de la Vega"
poeta2 = "Garcilaso De La Vega"
poeta1.lower() == poeta2.lower()

True

Existen lenguajes que tiene grafemas que solo tienen una tipo de representación, como `ß` en alemán que  tiene versión alternativa. En este caso se puede emplear el método `casefold()` que realiza una normalización más agresiva.

In [3]:
print("Straße".casefold())
print("Straße".lower())

strasse
straße


Es posible que nos interese sólo pasar a mayúsculas el primer caracter `capitalize()`, o modificar los primeros caracteres de cada palabra `title()`.

In [4]:
nombre = "gabriel"
print(nombre.capitalize())

titulo = "cien años de soledad"
print(titulo.title())

Gabriel
Cien Años De Soledad


Otra normalización bastante habitual es eliminar caracteres de una palabra al principio o al final que no forman parte de la misma. Por ejemplo, símbolos de puntuación o espacios en blanco.

El método `strip()` permite realizar esta funcionalidad especificación la lista de caracteres que se quiere eliminar.

In [5]:
" ¡hola!. ".strip("!¡. ,")

'hola'

**Prueba tu mismo** las versiones `lstrip()` y `rstrip()` del método anterior.

**Prueba tu mismo** Prueba a eliminar los puntos con `strip()` de "R.A.E."

También es posible sustituir un caracter, o conjunto de caracteres por otro con el método `replace()`.

In [6]:
"alcarena".replace("al", "ma")

'macarena'

**Prueba tú mismo** si es posible sustituir más de una aparición a la vez. Por ejemplo, cambiar todas las apariciones de una letra por otra.

**Prueba tú mismo** a normalizar el acrónimo "R.A.E." eliminando los puntos.

## Ejercicios

**1. Ejercicio** Realiza dos funciones `es_plural()` y `es_singular()` que devuelvan verdadero o falso dependiendo de si la función termina en `s` o no. Construir las funciones de manera que una llame a la otra.

```
print(es_plural("palabras"))
print(es_plural("PALABRAS"))
print(es_singular("palabras"))
```

debería devolver `True`, `True` y `False` respectivamente.

In [2]:
def es_plural(s):
    return s.lower().endswith("s")

def es_singular(s):
    return not es_plural(s)

print(es_plural("palabras"))
print(es_plural("PALABRAS"))
print(es_singular("palabras"))

True
True
False


**2. Ejercicio** Realizar una función alternativa a `startswith()` que sea indepediente de que la palabra empiece por minúscula o mayúscula. 

Por ejemplo:

```
print(comienza_por("Octavio", "oct"))
print(comienza_por("paz", "P"))
```

In [3]:
def comienza_por(s, c):
    return s.lower().startswith(c.lower())

print(comienza_por("Octavio", "oct"))
print(comienza_por("paz", "P"))

True
True


**3. Ejercicio** Realizar una función `normaliza()` que elimine los caracteres antes y después. Usar las constantes `whitespace` y `punctuation` del módulo `string`.

Ejemplo:

```
print(normaliza("¡¿lugar?!, "))
```

In [4]:
from string import whitespace
from string import punctuation

def normaliza(s):
    return s.strip(punctuation + whitespace + "¿¡")
        
print(normaliza("¡¿lugar?!, "))

lugar


**4. Ejercicio** Implementar una función que `vocal_o_consonante(s)` que devuelva "v" si es vocal, y "c" si es consonante. En cualquier otro caso, tendrá que devolver " ".

La siguiente ejecución:

```
print(vocal_o_consonante("B"))
print(vocal_o_consonante("á"))
```

debería devolver:

```
c
v
```

In [8]:
consonants_lowercase = "bcdfghjklmnñpqrstvwxyz"
consonants = consonants_lowercase + consonants_lowercase.upper()

def es_vocal(c):
    return c.lower() in "aeiouáéíóúü"

def es_consonante(s):
    return s in consonants

def vocal_o_consonante(s):
    if es_vocal(s):
        return "v"
    elif es_consonante(s):
        return "c"
    else:
        return " " 

print(vocal_o_consonante("B"))
print(vocal_o_consonante("á"))

c
v


**5. Ejercicio** Definir una función `siglas(w)` que dado una palabra elimine los puntos y blancos de separación que pueda tener en cualquier posición.

In [None]:
def siglas(s):
    return s.replace(".","").replace(" ","")

print(siglas("O.N.U."))
print(siglas("O N U "))

**6. Ejercicio** Define una función `elimina_acento(s)` que reciba una cadena de caracteres, y devuelva la misma cadena reemplazando las vocales acentuadas por no acentuadas (si hubiera alguna). 

In [10]:
def elimina_acento(s):
    acento = {"á":"a", "é":"e", "í":"i", "ó":"o", "ú":"u", "ü":"u",
              "Á":"A", "É":"E", "Í":"I", "Ó":"O", "Ú":"U", "Ü":"U"}
    sn = ""
    for c in s:
        if c in acento.keys():
            sn = sn + acento[c]
        else:
            sn = sn + c
    return(sn)

print(elimina_acento("Camión"))
print(elimina_acento("Enredo"))
print(elimina_acento("ESDRÚJULA"))
print(elimina_acento("ESDRÚJULA"))
print(elimina_acento("Penélope"))

Camion
Enredo
ESDRUJULA
ESDRUJULA
Penelope
