# Cadenas
Son tipos compuestos de datos, a las cadenas las conforman unidades más pequeñas que llamamos caracteres, por lo tanto pueden tomarse como una colección de caracteres.
Ejemplo:

In [None]:
cadena = "Esta es una cadena de caracteres"
nombre_completo = "Pepito Perez"
saludo = "Hola mundo!!!"

# Indexación
Como colecciones, las cadenas, pueden se accedidas a través de la posición que ocupan los caracteres en ella. Se utilizan corchetes [] y entre ellos se escribe un número entero que denota la posición a la que se quiere acceder con una operación de lectura, pues las cadenas en python son inmutables entonces no se puede cambiar directamente (cadena[posicion]=elemento)
Ejemplo:

In [None]:
print(cadena)
print(cadena[1])
print(nombre_completo[5])
print(saludo[5])

# Operaciones
## Concatenar
El proceso de concatenación se realiza mediante el operador de suma (+).
Ejemplo:

In [None]:
saludo = saludo + nombre_completo
print(saludo)

## Multiplicar
Si se quuieren varias copias de una cadena de caracteres se utiliza el operador de multiplicación (*).
Ejemplo:

In [None]:
cadena = cadena * 3
print(cadena)

## Calcular la longitud
La longitud de una cadena corresponde a la cantidad de caracteres que la conforman
Ejemplo:

In [None]:
longitud = len(nombre_completo)
print(nombre_completo+" tiene "+str(longitud) +" caracteres")

## Buscar y encontrar (find)
Se puede buscar una sub-cadena en una cadena de caracteres utilizando el método find, de manera que se indicará el índice del inicio de la subcadena en la cadena. Si la sub-cadena no se encuentra en la cadena, se retornará un -1
Ejemplo:

In [None]:
print(saludo)
indice_busqueda = saludo.find("mundo")
print(indice_busqueda)
indice_busqueda = saludo.find("Cadena")
print(indice_busqueda)

## Reemplazar
Si se necesita cambiar una sub-cadena de una cadena se puede utilizar el método replace
Ejemplo:

In [None]:
nombre_completo=nombre_completo.replace("Pepito","Carlitos")
print(nombre_completo)

## Cortar - slicing
Si se necesita cortar partes que no se quieran del principio o del final de la cadena, se puede hacer creando una sub-cadena. El mismo tipo de técnica permite separar una cadena muy larga en componentes más manejables.
Ejemplo:

In [None]:
#Muestra los caracteres desde la posición 1 hasta la 9
print(cadena)
print(cadena[1:10])
#Invierte la cadena
print(cadena[::-1])

# Listas, Diccionarios
## Listas
Son listados de datos en los que hay un orden, por lo que tiene en cuenta la posición en la que está el elemento (índice). Debe tenerse en cuenta que, como en cualquier estructura de datos indexada, el primer elemento tiene índice = 0. Al contrario que en las cadenas, las listas no son inmutables, por lo que se pueden modificar sus elementos, y puede haber elementos duplicados. 

Las operaciones más habituales que se realizan en Python son las siguientes:

* lista[i]: Devuelve el elemento que está en la posición i de la lista.
* lista.pop(i): Devuelve el elemento en la posición i de una lista y luego lo borra.
* lista.append(elemento): Añade elemento al final de la lista.
* lista.insert(i, elemento): Inserta elemento en la posición i.
* lista.extend(lista2): Fusiona lista con lista2.
* lista.remove(elemento): Elimina la primera vez que aparece elemento.

Ejemplos:

In [None]:
#Configurar la lista
equipo = ['Jugador 1','Jugador 2','Jugador 3',9,True]
print(equipo)

#sacar de la lista al jugador 2
equipo.pop(1)
print(equipo)

#Agregar nuevamente el Jugador 2. Nótese que lo agrega al final de la lista
equipo.append('Jugador 2')
print(equipo)

#Borrar el Jugador 3
del(equipo[1])
print(equipo)

#Insertar el Jugador 3 entre el Jugador 1 y el Jugador 2
equipo.insert(1,'Jugador 3')
print(equipo)

print(equipo[1:3])

## Diccionarios
Un diccionario en Python es una clave que tiene asociado un valor. Al contrario de lo que sucedía en las listas, los diccionarios no tienen orden, se crean poniendo sus elementos entre llaves {}. Se componen de un par de valores: las claves y los valores asociados a las vlaves. Lógicamente, no puede haber dos claves iguales, aunque sí dos values iguales.

Las operaciones más habituales son:

* diccionario.get('clave'): Devuelve el valor que corresponde con la clave introducida.
* diccionario.pop('clave'): Devuelve el valor que corresponde con la clave introducida, y luego borra la clave y el valor.
* diccionario.update({'clave':valor}): Inserta una determinada clave o actualiza su valor si la clave ya existe.
* 'clave' in diccionario: Devuelve verdadero o falso si la clave (no los valores) existe en el diccionario.
* valor in diccionario.values(): Devuelve verdadero o falso si valor existe en el diccionario (no como clave).

Ejemplos:

In [2]:
#definición del diccionario: se trata de un diccionario de empleados de los que se tiene el id 
#y asociado a éste el nombre y los años que lleva trabajando en la empresa
diccionario={'id1':['Juan',5],
             'id2':['Pedro',1],
             'id3':['Luis',3]
            }
print(diccionario)

#Sacar id2 y su valor asociado(la lista) del diccionario
diccionario.pop('id2')
print(diccionario)

#Modificar la cantidad de años que Juan lleva en la empresa 
diccionario.update({'id1':['Juan',6]})
print(diccionario)

#Verificar si id2 está registrado en el diccionario
print('id2' in diccionario)

#Verificar si Luis está en el diccionario
v = diccionario.values()
encontrado = False
for x in v:
    if x[0] is 'Luis':
        encontrado = True
        break
print(encontrado)


{'id1': ['Juan', 5], 'id2': ['Pedro', 1], 'id3': ['Luis', 3]}
{'id1': ['Juan', 5], 'id3': ['Luis', 3]}
{'id1': ['Juan', 6], 'id3': ['Luis', 3]}
False
True


# Expresiones Regulares
Una expresión regular RegEx es una cadena que define un patrón de búsqueda. Python tiene un módulo (re) que permite trabajar con expresiones regulares.

### Componentes de las Expresiones Regulares
Las expresiones regulares son un mini lenguaje en sí mismo, por lo que para poder utilizarlas eficientemente primero debemos entender los componentes de su sintaxis; ellos son:

Literales: Cualquier caracter se encuentra a sí mismo, a menos que se trate de un metacaracter con significado especial. Una serie de caracteres encuentra esa misma serie en el texto de entrada, por lo tanto la plantilla "raul" encontrará todas las apariciones de "raul" en el texto que procesamos.

Secuencias de escape: La sintaxis de las expresiones regulares nos permite utilizar las secuencias de escape que ya conocemos de otros lenguajes de programación para esos casos especiales como ser finales de línea, tabs, barras diagonales, etc. Las principales secuencias de escape que podemos encontrar, son:

Secuencia de escape	Significado
\n	                Nueva línea (new line). El cursor pasa a la primera posición de la línea siguiente.
\t	                Tabulador. El cursor pasa a la siguiente posición de tabulación.
\\	                Barra diagonal inversa
\v	                Tabulación vertical.
\ooo	            Carácter ASCII en notación octal.
\xhh	            Carácter ASCII en notación hexadecimal.


Ejemplo:

In [None]:
import re

patron = '^a...s$'
cadena = 'armando'
resultado = re.match(patron, cadena)

if resultado:
  print("se encontraron coincidencias")
else:
  print("No hubo coincidencias")

## Metacaracteres
Python reconoce los siguientes caracteres como componentes sintácticos de una expresión regular.

. ^ $ * + ? { } [ ] \ | ( )

# Parámetros de búsqueda
* re.A ó ASCII
* re.I ó IGNORECASE
* re.L ó LOCALE
* re.M ó MULTILINE
* re.S ó DOTALL
* re.X ó VERBOSE
* re.U ó UNICODE

## Función re.search()
Busca un patrón desde el principio de la cadena de caracteres. Al encontrar la primera conicidencia, retorna un objeto.

Sintaxis:

re.search(<patrón>, <cadena de caracteres>, <parámetros>)
Ejemplo:

In [None]:
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"
patron = "car"
busqueda = re.search(patron, texto)
print(busqueda.string)


## Función re.findall().
Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres. Retorna una lista con todas las coincidencias.

Sintaxis:

re.findall(<patrón>, <cadena de caracteres>, <parámetros>)
    
Ejemplo:

In [None]:
lst = re.findall(patron, texto)
print(lst)

## Función re.finditer()
Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres. Retorna un iterador con todas las coincidencias.

Sintaxis:

re.finditer(<patrón>, <cadena de caracteres>, <parámetros>)

Ejemplo:

In [None]:
for i in re.finditer(patron, texto):
    print(i)

## Función re.split()
Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres y separa los elementos utilizando al patrón como separador. Retorna una lista de cadenas de caracteres con los textos separados. En caso de no encontrar coincidencias, regresa un objeto de tipo list con el texto original.

Sintaxis:

re.split(<patrón>, <cadena de caracteres>, <parámetros>)

Ejemplo:

In [None]:
lst = re.split(patron, texto)
print(lst)

## Función re.sub()
Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres y dichas coincidencias serán sustituida con un nuevo texto. Retorna una cadena de caracteres con el texto modificado.

Sintaxis:

re.sub(<patrón>, <texto a sustituir>, <texto>, <parámetros>) 
    
Ejemplo:

In [None]:
print(re.sub(patron, 'dulce', texto))

## Función re.match()
Evalúa si el patron ingresado coincide con el inicio de una cadena de caracteres. En caso de que se encuentre el patrón, retorna un objeto con la información de la coincidencia.

Sintaxis:

re.match(<patrón>, <texto>, <parámetros>)
Ejemplos:

In [None]:
print(texto)
print(patron)
print(re.match(patron, texto))

patron = "azu"
print(texto)
print(patron)
print(re.match(patron, texto))

# Los Metacaracteres

## Metacaracteres - delimitadores
Esta clase de metacaracteres nos permite delimitar dónde queremos buscar los patrones de búsqueda. Ellos son:

Metacaracter	Descripción
^	            inicio de línea.
$	            fin de línea.
\A	            inicio de texto.
\Z	            fin de texto.
.	            cualquier caracter en la línea.
\b	            encuentra límite de palabra.
\B	            encuentra distinto a límite de palabra.

## Metacaracteres - clases predefinidas
Estas son clases predefinidas que nos facilitan la utilización de las expresiones regulares. Ellos son:

Metacaracter	Descripción
\w	            un caracter alfanumérico (incluye "_").
\W	            un caracter no alfanumérico.
\d	            un caracter numérico.
\D	            un caracter no numérico.
\s	            cualquier espacio (lo mismo que [ \t\n\r\f]).
\S	            un no espacio.

## Metacaracteres - iteradores
Cualquier elemento de una expresion regular puede ser seguido por otro tipo de metacaracteres, los iteradores. Usando estos metacaracteres se puede especificar el número de ocurrencias del caracter previo, de un metacaracter o de una subexpresión. Ellos son:

Metacaracter	Descripción
*	            cero o más, similar a {0,}.
+	            una o más, similar a {1,}.
?	            cero o una, similar a {0,1}.
{n}	            exactamente n veces.
{n,}	        por lo menos n veces.
{n,m}	        por lo menos n pero no más de m veces.
*?	            cero o más, similar a {0,}?.
+?	            una o más, similar a {1,}?.
??	            cero o una, similar a {0,1}?.
{n}?	        exactamente n veces.
{n,}?	        por lo menos n veces.
{n,m}?	        por lo menos n pero no más de m veces.

En estos metacaracteres, los dígitos entre llaves de la forma {n,m}, especifican el mínimo número de ocurrencias en n y el máximo en m.

## El metacaracter "."
Indica que debe de haber un caracter en lugar del punto.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "c.ar"
print(re.findall(patron, texto, re.I))

patron = "ca..r"
print(re.findall(patron, texto, re.I))

patron = "..ar"
print(re.findall(patron, texto, re.I))

## El metacaracter "^"
Indica que el principio de la cadena de caracteres debe de coincidir con la expresión. 

In [None]:
patron = "^car"
print(re.findall(patron, texto, re.I))

texto = "Cuenta cuentos cuenta cuentas cuantas cuentas cuenta"
patron = "^.ue"
print(re.findall(patron, texto, re.I))

## El metacaracter "$"
Indica que el final de la cadena de caracteres debe de coincidir con la expresión.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "rranza$"
print(re.findall(patron, texto, re.I))

## El metacaracter "*"
Indica que puede haber 0 o más caracteres en la posición indicada.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "ca*r"
print(re.findall(patron, texto, re.I))

## El metacaracter "+"
Indica que puede haber 1 o más caracteres en la posición indicada.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza caaar"
patron = "ca+"
print(re.findall(patron, texto, re.I))

## El metacarcter "?"
Indica que pueden haber cero o una coincidencia con el caracter de la izquierda.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza, caaar"
patron = "ca?r"
print(re.findall(patron, texto, re.I))

## El uso de corchetes "[...]"
Indica un conjunto de caracteres.

In [None]:
texto = "Azucar azu azecarado zucarita, asucar azurca azicar"
patron = "az[aeiou]car"
print(re.findall(patron, texto, re.I))

## El uso de llaves "{m_, _n}"
indica un rango de coincidencias del caracter. 

In [None]:
texto = "1211111111 11111 1111 11111 11 11 13"
patron = "1{2,4}"
print(re.findall(patron, texto, re.I))

## Un ejemplo para tener en cuenta...
Validar una dirección de correo con expresiones regulares

![image.png](attachment:image.png)

# Ejercicios
