# String

Esta lecci√≥n es una r√°pida introducci√≥n a t√©cnicas de manipulaci√≥n de cadenas de caracteres (o strings) en Python. Saber c√≥mo manipular cadenas de caracteres juega un papel fundamental en la mayor√≠a de las tareas de procesamiento de texto. Si quieres experimentar con las siguientes lecciones puedes escribir y ejecutar peque√±os programas tal como lo hicimos en lecciones previas, o puedes abrir tu int√©rprete de comandos de Python / Terminal para probarlos ah√≠.

Una string es una secuencia de caracteres. Puede acceder a los caracteres de uno en uno con el operador de par√©ntesis: 

In [None]:
fruta = 'fresa'

In [None]:
letra = fruta[1]

La segunda afirmaci√≥n extrae el car√°cter en la posici√≥n 1 del √≠ndice de la variable de la fruta y lo asigna a la variable de la letra. La expresi√≥n entre par√©ntesis se llama √≠ndice. El √≠ndice indica el car√°cter de la secuencia que se desea (de ah√≠ el nombre). Pero puede que no consigas lo que esperas: 

In [None]:
print(letra)

Para la mayor√≠a de la gente, la primera letra de "banana" es "b", no "a". Pero en Python, el √≠ndice es un desplazamiento del principio de la cadena, y el desplazamiento de la primera letra es cero (0).  

In [None]:
letra = fruta[0]
print(letra)

As√≠ que "b" es la letra en la posici√≥n 0 de la palabra "banana", "a" es la letra en la posici√≥n 1, y "n" seria la letra en la posici√≥n 2. 


Se puede usar cualquier expresi√≥n, incluyendo variables y operadores, como un √≠ndice, pero el valor del √≠ndice tiene que ser un n√∫mero entero. De lo contrario, se obtiene: 

In [None]:
letra = fruta[1,5]

<img src="https://i.imgur.com/Tpj7CQC.png">

# Obtener la longitud de un string usando len()

len es una funci√≥n incorporada que devuelve el n√∫mero de caracteres de una cadena:_

In [None]:
fruta = 'banana'
len(fruta)

Para obtener la √∫ltima letra de un string, podr√≠as estar tentado de intentar algo como esto: 

In [None]:
longitud = len(fruta)
ultimo = fruta[longitud]

La raz√≥n del IndexError es que no hay ninguna letra en "banana" con el √≠ndice 6. Desde que empezamos a contar en el cero, las seis letras est√°n numeradas del 0 al 5. Para obtener el √∫ltimo car√°cter, hay que restarle 1 a la longitud: 

In [None]:
ultimo = fruta[longitud-1]
print(ultimo)

Alternativamente, puedes usar √≠ndices negativos, que cuentan hacia atr√°s desde el final de la cuerda. La expresi√≥n fruta[-1] da la √∫ltima letra, fruta[-2] da la el pen√∫ltimo, y as√≠ sucesivamente. 

# Rebanas de String

Un segmento de un string se llama un trozo. Seleccionar una rebanada es similar a seleccionar una caracter:

In [None]:
s = 'Monty Python'
print(s[:5])

In [None]:
print(s[6:12])

El operador devuelve la parte de la cadena del "n-√©simo" car√°cter "m-√©simo" al car√°cter, incluyendo el primero pero excluyendo el √∫ltimo [n,m). Si se omite el primer √≠ndice (antes de los dos puntos), el trozo comienza al principio de la cadena. Si se omite el segundo √≠ndice, la rebanada va al final de la cadena: 

In [None]:
fruta = 'banana'
fruta[:3]

In [None]:
fruta[3:]

Si el primer √≠ndice es mayor o igual que el segundo el resultado es una cadena vac√≠a, representada por dos comillas:

In [None]:
fruta = 'banana'
fruta[7:7]

Una cadena vac√≠a no contiene caracteres y tiene una longitud de 0, pero aparte de eso, es igual a cualquier otra cadena. 

# Ejercicio 1: ¬ø Qu√© ocurre cuando se utiliza fruta[:]?

In [None]:
fruta[:]

# ¬øLos string son inmutables?

Es tentador utilizar el operador del lado izquierdo de una asignaci√≥n, con la intenci√≥n de cambiar un caracter en un string. Por ejemplo: 

In [None]:
saludo = '¬°Hola, mundo!'
saludo[0] = 'J'

El "objeto" en este caso es la cadena y el "√≠tem" es el caracter que trataste de asignar. Por ahora, un objeto es lo mismo que un valor, pero afinaremos esa definici√≥n m√°s adelante. Un √≠tem es uno de los valores de una secuencia. La raz√≥n del error es que las cadenas son **INMUTABLES**, lo que significa que no se puede cambiar una cadena existente. Lo mejor que puedes hacer es crear una nueva cadena que sea una variaci√≥n de la original:

In [None]:
saludo = '¬°Hola, mundo!'
nuevo_saludo = saludo[:6]+" M"+saludo[8:]
print(nuevo_saludo)

Este ejemplo concatena una nueva primera letra en un trozo de saludo. No tiene ning√∫n efecto en la cadena original. 

# El operador "in"

La palabra "in" es un operador booleano que toma dos cadenas y devuelve True si la primera aparece como una subcadena en la segunda:

In [None]:
'a' in 'banana'

In [None]:
"bna" in "banana"

# Comparaci√≥n de string


Los operadores de comparaci√≥n trabajan con strings. Para ver si dos cuerdas son iguales:

In [None]:
palabra = 'Banana'
if palabra == 'banana':
    print('Est√° bien, bananas')

Otras operaciones de comparaci√≥n son √∫tiles para poner las palabras en orden alfab√©tico:

In [32]:
palabra = 345
if palabra < 'banana':
    print('Tu palabra,' + palabra + ', viene antes de banana')
elif palabra > 'banana':
    print('Su palabra ' + palabra +', viene despu√©s de banana.')
else:
    print('Est√° bien, su palabra es banana')

TypeError: '<' not supported between instances of 'int' and 'str'

Python no maneja las may√∫sculas y min√∫sculas de la misma manera como lo hace la gente. Todas las may√∫sculas vienen antes que las min√∫sculas, as√≠ que: 

La palabra, **Pi√±a**, viene antes que **banana**.

Una forma com√∫n de abordar este problema es convertir las cadenas a un formato est√°ndar, como todas las min√∫sculas, antes de realizar la comparaci√≥n. Tengan eso en cuenta en caso de que tienes que defenderte de un hombre armado con una pi√±a. 

# M√©todos de un string

Los string son un ejemplo de los objetos de Python. Un objeto contiene tanto datos (la cadena propiamente dicha) como m√©todos, que son en realidad funciones que est√°n incorporadas en el objeto y que est√°n disponibles para cualquier instancia del mismo. 

Python tiene una funci√≥n llamada dir que enumera los m√©todos disponibles para un objeto. La funci√≥n type muestra el tipo de un objeto y la funci√≥n dir muestra los m√©todos disponibles. 

In [33]:
Cadena = 'Hola mundo'

In [34]:
type(Cadena)

str

In [35]:
dir(Cadena)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'removeprefix',
 'removesuffix',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',


In [37]:
help(str.capitalize)

Help on method_descriptor:

capitalize(self, /)
    Return a capitalized version of the string.
    
    More specifically, make the first character have upper case and the rest lower
    case.



Si bien la funci√≥n dir enumera los m√©todos, y se puede utilizar la ayuda para obtener una documentaci√≥n sencilla sobre un m√©todo, una mejor fuente de documentaci√≥n para los m√©todos de cuerda ser√≠a 

https://docs.python.org/library/stdtypes.html#string-methods. 

Llamar a un m√©todo es similar a llamar a una funci√≥n (toma argumentos y devuelve un valor) pero la sintaxis es diferente. Llamamos a un m√©todo a√±adiendo el nombre del m√©todo al nombre de la variable utilizando el punto como delimitador. 

Por ejemplo, el m√©todo upper toma un string y devuelve un nuevo string con todas las letras may√∫sculas:

En lugar de la funci√≥n sintaxis upper(palabra), utiliza el m√©todo sintaxis palabra.upper().

In [38]:
palabra = 'BANANA'
palabra_nueva = palabra.format_map()
print(palabra_nueva)

TypeError: str.format_map() takes exactly one argument (0 given)

Esta forma de notaci√≥n puntual especifica el nombre del m√©todo, **upper**, y el nombre de la cadena a la que se aplica el m√©todo, **palabra**. Los par√©ntesis vac√≠os indican que este m√©todo no toma ning√∫n argumento. 

La llamada a un m√©todo se llama una **invocation**; en este caso, dir√≠amos que estamos invocando upper sobre **palabra**. 

Por ejemplo, hay un m√©todo de cadena llamado **find** que busca la posici√≥n de una cadena dentro de otra: 

In [40]:
palabra = 'banana'
index = palabra.upper()
print(index)

BANANA


En este ejemplo, invocamos a find sobre palabra y pasamos la letra que buscamos como par√°metro.

El m√©todo find puede encontrar subcadenas as√≠ como caracteres:

In [41]:
palabra.find('na')

2

Puede tomar como segundo argumento el √≠ndice donde debe comenzar: 

In [42]:
palabra.find('a', 3)

3

Una tarea com√∫n es eliminar los espacios en blanco (espacios, tabulaciones o nuevas l√≠neas) del principio y el final de una cadena utilizando el m√©todo de la tira: 

In [43]:
linea = '        Aqu√≠ vamos            '
linea.strip()

'Aqu√≠ vamos'

Algunos m√©todos como el de empezar con valores booleanos de retorno. 

In [48]:
linea = 'Que Tengas Un Buen D√≠a'
linea.startswith('Que Tengas')

True

In [47]:
linea.startswith('Q')

True

Notar√°n que el comienzo requiere que el caso coincida, as√≠ que a veces tomamos una l√≠nea y lo mapeamos todo a min√∫sculas antes de hacer cualquier verificaci√≥n usando el m√©todo de abajo. 

In [55]:
linea = 'Que Tengas Un Buen D√≠a'
linea.startswith('Tengas')

False

In [50]:
linea.lower() #que tendas un buen dia

'que tengas un buen d√≠a'

In [56]:
linea.startswith('q')

False

En el √∫ltimo ejemplo, se llama el m√©todo "lower" y luego usamos "startswith" para ver si la cadena de min√∫sculas resultante comienza con la letra "Q". Siempre que seamos cuidadosos con el orden, podemos hacer m√∫ltiples llamadas al m√©todo en una sola expresi√≥n. 

# Analizar los string

A menudo, queremos mirar en una cadena y encontrar una subcadena. Por ejemplo, si estuvi√©ramos present√≥ una serie de l√≠neas con el siguiente formato: 

De stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008 

y quer√≠amos sacar s√≥lo la segunda mitad de la direcci√≥n (es decir, uct.ac.za) de cada l√≠nea, podemos hacer esto usando el m√©todo **find** y corte de cadenas. 

Primero, encontraremos la palabra que se encuentra en la posici√≥n anterior. Luego encontraremos la posici√≥n del primer espacio de la palabra que se encuentra en la posici√≥n anterior Y luego usaremos el corte de la cadena para extraer la porci√≥n de la palabra que estamos buscando. 

In [57]:
data = 'De stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008'
enlaposicion = data.find('@')
print(enlaposicion)

19


In [58]:
espacioenlaposicion = data.find(' ',enlaposicion)
print(espacioenlaposicion)

29


In [60]:
host = data[enlaposicion+1:espacioenlaposicion]
print(host)

uct.ac.za


Utilizamos una versi√≥n del m√©todo de b√∫squeda que nos permite especificar una posici√≥n en la cadena donde queremos encontrar para empezar a buscar. Cuando cortamos, extraemos la personajes desde "uno m√°s all√° de la se√±al de "@" hasta, pero sin incluir, el espacio del caracter". 

La documentaci√≥n para el m√©todo de b√∫squeda **find** est√° disponible en https://docs.python.org/library/stdtypes.html#string-methods.

# Operador de formato

El operador de formato, % nos permite construir cadenas, reemplazando partes de las cadenas con los datos almacenados en las variables. Cuando se aplica a n√∫meros enteros, % es el operador de m√≥dulo. Pero cuando el primer operando es una cadena, % es el operador de formato. 

El primer operando es la cadena de formato, que contiene una o m√°s secuencias de formato que especifican c√≥mo se formatea el segundo operando. El resultado es una cadena.

Por ejemplo, la secuencia de formato %d significa que el segundo operando debe formatearse como un n√∫mero entero ("d" significa "decimal"): 

In [61]:
camellos = 42
'%d' % camellos

'42'

El resultado es la cadena "42", que no debe confundirse con el valor entero 42. 

Una secuencia de formato puede aparecer en cualquier parte de la cadena, de modo que se puede incrustar un valor en una frase:

In [63]:
camellos = 45
'He visto %d camellos' % camellos

'He visto 45 camellos'

# Caracteres especiales en el string

Como en otros lenguajes, Python tiene caracteres especiales que interpreta dentro de los string. Por ejemplo \n es un retorno de carro (nueva l√≠nea), \t es un tabulador. En string and bytes literals tienes una tabla completa con todos los caracteres de escape de los string de Python.

Podemos, al definir una cadena, usar una r justo delante de la apertura de las comillas. Esto evitar√° que Python interprete los caracteres especiales y los tratar√° como caracteres normales.

In [64]:
# Saldr√°n dos l√≠neas en pantalla, una con Hola, la otra con Mundo
cadena = "Hola\nMundo"  
print(cadena)

Hola
Mundo


In [65]:
# Saldr√° una √∫nica l√≠nea en pantalla y la \ y la n ser√° visibles como caracteres normales.
cadena2 = r"Hola\nMundo"
print(cadena2)

Hola\nMundo


# Contar n√∫mero de veces que el substring aparece en el string : count

El m√©todo count nos dice cu√°ntas veces aparece el substring dentro del string. Admite un par√°metro que es el substring a buscar, y opcionalmente otros dos, los √≠ndices de inicio y fin de b√∫squeda. Veamos ejemplos

In [66]:
cadena = "un uno, un dos, un tres"

print (cadena.count("un"))        # Saca 4, hay 4 "un" en cadena.
print (cadena.count("un",10))     # Saca 1, hay 1 "un" a partir de la posici√≥n 10 de cadena.
print (cadena.count("un",5,10))   # Saca 3, hay 3 "un" entre la posici√≥n 0 y la 10.

4
1
1


# Reemplazar substring en string : replace

El m√©todo replace nos permite obtener una copia de la cadena original (no reemplaza en la cadena original) en la que se reemplaza el substring que se le indique por uno nuevo. Admite tres par√°metros, el primero es el substring que tiene que buscar, el segundo es el nuevo substring que tiene que poner y el tercero, opcional, es cu√°ntas veces tiene que hacer el reemplazo. Veamos ejemplos

In [69]:
cadena = "un uno, un dos, un tres"

print (cadena.replace("un", "XXX"))        # saca por pantalla "XXX XXXo, XXX dos, XXX tres"
print (cadena.replace("un", "XXX", 3))     # S√≥lo reemplaza 2 "un", as√≠ que saca por pantalla "XXX XXXo, un dos, un tres"

XXX XXXo, XXX dos, XXX tres
XXX XXXo, XXX dos, un tres


# el m√©todo format() de string

Se pueden definir variables y poner llaves {} en el string donde van a ir los n√∫meros o caracteres. Entre par√©ntesis pasamos los valores. Unos ejemplos sencillos

In [70]:
# saca "El valor es 12
print ("El valor es {}".format(12))

# saca "El valor es 12.3456
print ("El valor es {}".format(12.3456))

# Tres conjuntos {}, el primero para el primer par√°metro de format(), el segundo para el segundo
# y as√≠ sucesivamente.
# saca "Los valores son 1, 2 y 3"
print ("Los valores son {}, {} y {}".format(1,2,3))

# Entre las llaves podemos poner la posici√≥n del par√°metro. {2} es el tercer par√°metro de format()
# {0} es el primer par√°metro de format.
# saca "Los valores son 3, 2 y 1"
print ("Los valores son {2}, {1} y {0}".format(1,2,3))

El valor es 12
El valor es 12.3456
Los valores son 1, 2 y 3
Los valores son 3, 2 y 1


Si a los par√°metros les damos nombre, podemos usar ese nombre en vez de su n√∫mero de posici√≥n

In [71]:
# saca "2 y 1"
print ("{pepe} y {juan}".format(juan=1, pepe=2))

2 y 1


Podemos dar formato a los n√∫meros para indicar cu√°ntas cifras y decimales queremos, siguiendo una sintaxis similar al operador % que acabamos de ver. Tambi√©n podemos mezclar este formato con el n√∫mero o nombre de posici√≥n del par√°metro.

# Concatenar

Este t√©rmino significa juntar cadenas de caracteres. El proceso de concatenaci√≥n se realiza mediante el operador de suma (+). Ten en cuenta que debes marcar expl√≠citamente d√≥nde quieres los espacios en blanco y colocarlos entre comillas.

En este ejemplo, la cadena de caracteres ‚Äúmensaje1‚Äù tiene el contenido ‚ÄúHola Mundo‚Äù

In [72]:
mensaje1 = 'Hola' + ' ' + 'Mundo'
print(mensaje1)

Hola Mundo


# Multiplicar
Si quieres varias copias de una cadena de caracteres utiliza el operador de multiplicaci√≥n (*). En este ejemplo, la cadena de caracteres mensaje2a lleva el contenido ‚ÄúHola‚Äù tres veces, mientras que la cadena de caracteres mensaje2b tiene el contenido ‚ÄúMundo‚Äù. Ordenemos imprimir las dos cadenas.

In [73]:
mensaje2a = 'Hola ' * 3
mensaje2b = 'Mundo'
print(mensaje2a + mensaje2b)

Hola Hola Hola Mundo


# A√±adir
¬øQu√© pasa si quieres a√±adir material de manera sucesiva al final de una cadena de caracteres? El operador especial para ello es compuesto (+=).

In [74]:
mensaje3 = 'Hola'
mensaje3 += ' '
mensaje3 += 'Mundo'
print(mensaje3)

Hola Mundo


 # Uso de las funciones split y join
 Como parte de la manipulaci√≥n de strings y listas, en este post ilustraremos el uso de las funciones split y join en Python. La funci√≥n join convierte una lista en una cadena formada por los elementos de la lista separados por comas. Por otro lado, split convierte una cadena de texto en una lista. Por defecto, los elementos de dicha lista ser√°n las palabras de la cadena.

 

Ejemplos del uso de join
Para empezar, consideremos la siguiente lista:

In [75]:
paises = [ 'Argentina', 'Uruguay', 'Chile', 'Paraguay', 'Brasil', 'Bolivia' ]

Si deseamos convertir esta lista en una cadena de texto, utilizaremos la funci√≥n join de la siguiente manera:


In [78]:
'-'.join(paises)

'Argentina-Uruguay-Chile-Paraguay-Brasil-Bolivia'

donde sep representa el o los caracteres que deseamos utilizar como delimitador.

En concreto,

In [79]:
paisesString = ','.join(paises)


devolver√° el siguiente resultado

In [80]:
print(paisesString)

Argentina,Uruguay,Chile,Paraguay,Brasil,Bolivia


Si deseamos utilizar los caracteres === como separador, tendremos que hacer

In [81]:
paisesString = '==='.join(paises)


obteniendo como resultado

In [82]:
print(paisesString)

Argentina===Uruguay===Chile===Paraguay===Brasil===Bolivia


# Ejemplo del uso de split
Ahora consideremos la siguiente cadena:

In [83]:
nombreString = 'Mi nombre es Gabriel'

Al utilizar la funci√≥n split de la siguiente manera

In [84]:
nombreLista = nombreString.split()

obtendremos lo siguiente:

In [85]:
print(nombreLista)

['Mi', 'nombre', 'es', 'Gabriel']


Como sucede en el caso de join, tambi√©n es posible especificar un distinto separador para split. Si en la cadena de texto que deseamos convertir a lista las palabras estuvieran separadas por un salto de l√≠nea, como por ejemplo:

In [86]:
nombreString = '''Fulano
Mengano
Suntano'''

En este caso,

In [91]:
nombreLista = nombreString.split(sep='n')

devolver√°

In [90]:
print(nombreLista)

['Fulano', 'Mengano', 'Suntano']


# Qu√© es el tipo set en Python

El tipo set en Python es utilizado para trabajar con conjuntos de elementos. La principal caracter√≠stica de este tipo de datos es que es una colecci√≥n cuyos elementos no guardan ning√∫n orden y que adem√°s son √∫nicos.

Estas caracter√≠sticas hacen que los principales usos de esta clase sean conocer si un elemento pertenece o no a una colecci√≥n y eliminar duplicados de un tipo secuencial (list, tuple o str).

Adem√°s, esta clase tambi√©n implementa las t√≠picas operaciones matem√°ticas sobre conjuntos: uni√≥n, intersecci√≥n, diferencia, ‚Ä¶

Para crear un conjunto, basta con encerrar una serie de elementos entre llaves {}, o bien usar el constructor de la clase set() y pasarle como argumento un objeto iterable (como una lista, una tupla, una cadena ‚Ä¶).

In [94]:
# Crea un conjunto con una serie de elementos entre llaves
# Los elementos repetidos se eliminan
c = {}
c
{1, 2, 3, 9}

# Crea un conjunto a partir de un string
# Los caracteres repetidos se eliminan
a = set()
a
{'a', 'H', 'h', 'y', 'n', 's', 'P', 't', ' ', 'i', 'l', 'o'}

# Crea un conjunto a partir de una lista
# Los elementos repetidos de la lista se eliminan
unicos = set([3, 5, 6, 1, 5])
unicos
{1, 3, 5, 6}

{1, 3, 5, 6}

Para crear un conjunto vac√≠o, simplemente llama al constructor set() sin par√°metros.

‚ùóÔ∏è IMPORTANTE: {} NO crea un conjunto vac√≠o, sino un diccionario vac√≠o. Usa set() si quieres crear un conjunto sin elementos.

üéØ NOTA: Los elementos que se pueden a√±adir a un conjunto deben ser de tipo hashable. Un objeto es hashable si tiene un valor de hash que no cambia durante todo su ciclo de vida. En principio, los objetos que son instancias de clases definidas por el usuario son hashables. Tambi√©n lo son la mayor√≠a de tipos inmutables definidos por Python.

# A√±adir elementos a un conjunto (set) en Python

Para a√±adir un elemento a un conjunto se utiliza el m√©todo add(). Tambi√©n existe el m√©todo update(), que puede tomar como argumento una lista, tupla, string, conjunto o cualquier objeto de tipo iterable.

In [95]:
mi_conjunto = {1, 3, 2, 9, 3, 1}
mi_conjunto
{1, 2, 3, 9}

# A√±ade el elemento 7 al conjunto
mi_conjunto.add(7)
mi_conjunto
{1, 2, 3, 7, 9}

# A√±ade los elementos 5, 3, 4 y 6 al conjunto
# Los elementos repetidos no se a√±aden al conjunto
mi_conjunto.update([5, 3, 4, 6])
mi_conjunto
{1, 2, 3, 4, 5, 6, 7, 9}

{1, 2, 3, 4, 5, 6, 7, 9}

üéØ NOTA: add() y update() no a√±aden elementos que ya existen al conjunto.

# Eliminar un elemento de un conjunto en Python

La clase set ofrece cuatro m√©todos para eliminar elementos de un conjunto. Son: discard(), remove(), pop() y clear(). A continuaci√≥n te explico qu√© hace cada uno de ellos.

discard(elemento) y remove(elemento) eliminan elemento del conjunto. La √∫nica diferencia es que si elemento no existe, discard() no hace nada mientras que remove() lanza la excepci√≥n KeyError.

pop() es un tanto peculiar. Este m√©todo devuelve un elemento aleatorio del conjunto y lo elimina del mismo. Si el conjunto est√° vac√≠o, lanza la excepci√≥n KeyError.

Finalmente, clear() elimina todos los elementos contenidos en el conjunto.

In [96]:
mi_conjunto = {1, 3, 2, 9, 3, 1, 6, 4, 5}
mi_conjunto
{1, 2, 3, 4, 5, 6, 9}

# Elimina el elemento 1 con remove()
mi_conjunto.remove(1)
mi_conjunto
{2, 3, 4, 5, 6, 9}

# Elimina el elemento 4 con discard()
mi_conjunto.discard(4)
mi_conjunto
{2, 3, 5, 6, 9}

# Trata de eliminar el elemento 7 (no existe) con remove()
# Lanza la excepci√≥n KeyError
mi_conjunto.remove(7)


# Trata de eliminar el elemento 7 (no existe) con discard()
# No hace nada
mi_conjunto.discard(7)
mi_conjunto
{2, 3, 5, 6, 9}

# Obtiene y elimina un elemento aleatorio con pop()
mi_conjunto.pop()
2
mi_conjunto
{3, 5, 6, 9}

# Elimina todos los elementos del conjunto
mi_conjunto.clear()
mi_conjunto
set()

KeyError: 7

# C√≥mo saber si un elemento est√° en un conjunto
Con los conjuntos tambi√©n se puede usar el operador de pertenencia in para comprobar si un elemento est√° contenido, o no, en un conjunto:

In [None]:
mi_conjunto = set([1, 2, 5, 3, 1, 5])
print(1 in mi_conjunto)
True
print(6 in mi_conjunto)
False
print(2 not in mi_conjunto)
False