# La clase String

Como dijimos en la última sección, todo en python en un objeto. <br>
En esta sección enumeramos algunos de los métodos estándar de la clase String junto con ejemplos de uso.

Para más información es buena idea saber que existe la documentación oficial de python.
- https://docs.python.org/3/library/stdtypes.html#str

Pero normalmente está mejor usar la web para aprender porque simplifica mucho los conceptos de varios lenguajes:
- https://www.w3schools.com/python/python_ref_string.asp

## Métodos más comunes

### Listado de métodos

In [1]:
for method in dir(str):
    print(method)

__add__
__class__
__contains__
__delattr__
__dir__
__doc__
__eq__
__format__
__ge__
__getattribute__
__getitem__
__getnewargs__
__gt__
__hash__
__init__
__init_subclass__
__iter__
__le__
__len__
__lt__
__mod__
__mul__
__ne__
__new__
__reduce__
__reduce_ex__
__repr__
__rmod__
__rmul__
__setattr__
__sizeof__
__str__
__subclasshook__
capitalize
casefold
center
count
encode
endswith
expandtabs
find
format
format_map
index
isalnum
isalpha
isascii
isdecimal
isdigit
isidentifier
islower
isnumeric
isprintable
isspace
istitle
isupper
join
ljust
lower
lstrip
maketrans
partition
removeprefix
removesuffix
replace
rfind
rindex
rjust
rpartition
rsplit
rstrip
split
splitlines
startswith
strip
swapcase
title
translate
upper
zfill


### Uso de algunos a métodos

In [1]:
string_1 = 'hola'
string_2 = 'AAA'
string_4 = 'Mi nombre es {} y mi edad es {}'
string_5 = 'Mi nombre es {nombre} y mi edad es {edad}'
string_6 = 'A,B,C,D,E,F,G,H,I'
string_7 = ','

print('capitalize():', string_1.capitalize(), end='\n' * 2)
print('center(width[, fillchar]):', string_1.center(9, '_'), 'Longitud total:', len(string_1.center(9, '_')), end='\n' * 2)
print('count(sub[, start[, end]]):', string_1.count('a'), f'count() sobre {string_1[0 : 2]}:', string_1.count('a', 0, 2), end='\n' * 2)
print("endswith(suffix[, start[, end]]):", string_1.endswith(''), string_1.endswith('b'), end='\n' * 2)
print("startswith(suffix[, start[, end]]):", string_1.startswith('-'), string_1.startswith('h'), end='\n' * 2)
print("find(sub[, start[, end]]):", string_1.find('h'), string_1.find('a', 1, 2), end='\n' * 2)
print("format(*args, **kwargs):", string_4.format('Sergio', 25), end='\n' * 2)
print("format_map(mapping):", string_5.format_map({'nombre' : 'Sergio', 'edad' : 25}), end='\n' * 2)
print("lower():", string_2.lower(), end='\n' * 2)
print("upper():", string_1.upper(), end='\n' * 2)
print("split():", string_6.split(','), end='\n' * 2)
print("join(iterable):", string_7.join(['A', 'B', 'C', 'D', 'E']), end='\n' * 2)

capitalize(): Hola

center(width[, fillchar]): ___hola__ Longitud total: 9

count(sub[, start[, end]]): 1 count() sobre ho: 0

endswith(suffix[, start[, end]]): True False

startswith(suffix[, start[, end]]): False True

find(sub[, start[, end]]): 0 -1

format(*args, **kwargs): Mi nombre es Sergio y mi edad es 25

format_map(mapping): Mi nombre es Sergio y mi edad es 25

lower(): aaa

upper(): HOLA

split(): ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']

join(iterable): A,B,C,D,E



Estos métodos tienen una peculiaridad interesante además de útil. No son **inplace**. Es decir, cuando hacemos str.método(), ese método devuelve un string con la modicación.
<br>Lo que permite concatenar varias llamadas a funciones en una misma línea sin necesidad de crear variables intermedias o cosas de ese estilo.

In [8]:
string = 'aaaaA_bCsasddede'

print( string.lower().capitalize().replace('_', '').replace('a', '').replace('s', '') )

Abcddede


### Consultar la documentación

No olvidemos que existe la función **help(obj)** que nos devuelve el docstring (documentación) de un obj, función, ...

In [11]:
# Help __add__
help(str.__add__)

print('-' * 50 + '\n')

# Help capitalize
help(str.capitalize)

print('-' * 50 + '\n')

# Help __getitem__
help(str.__getitem__)

print('-' * 50 + '\n')

# Help format
help(str.format)

Help on wrapper_descriptor:

__add__(self, value, /)
    Return self+value.

--------------------------------------------------

Help on method_descriptor:

capitalize(self, /)
    Return a capitalized version of the string.
    
    More specifically, make the first character have upper case and the rest lower
    case.

--------------------------------------------------

Help on wrapper_descriptor:

__getitem__(self, key, /)
    Return self[key].

--------------------------------------------------

Help on method_descriptor:

format(...)
    S.format(*args, **kwargs) -> str
    
    Return a formatted version of S, using substitutions from args and kwargs.
    The substitutions are identified by braces ('{' and '}').



## Caracteres especiales

Cuando usamos strings, a veces necesitamos algo más que letras del abecedario. A veces es necesario añadir algún formato concreto como dividir un texto en varias lineas pero usando la misma cadena de texto, ...

In [24]:
tab_string = 'Inicio\tHola'
new_line_string = 'Hola\nMundo'
quote_string = 'It\'s'
backslash_string = '\\AA'
format_string = f'{1} - {2}' # En vez de usar str.format podemos hacer f'{}' e ir rellenando con la variables que necesitemos

print(tab_string, end = f'\n{"-" * 50}\n')
print(new_line_string, end = f'\n{"-" * 50}\n')
print(quote_string, end = f'\n{"-" * 50}\n')
print(backslash_string, end = f'\n{"-" * 50}\n')
print(format_string, end = f'\n{"-" * 50}\n')

Inicio	Hola
--------------------------------------------------
Hola
Mundo
--------------------------------------------------
It's
--------------------------------------------------
\AA
--------------------------------------------------
1 - 2
--------------------------------------------------


## prefijos

### f-strings

Son una alternativa a la función format(*arg, **kwargs). <br>
Actualmente se recomienda más usar f-strings porque se crearon para hacer un código más potente y a su vez más corto

In [1]:
variable = 1

print( f'{variable}' ) # Mostrar valor de una variable
print( f'{variable=}' ) # Mostrar valor de una variable y el nombre de la variable

f"newline: {ord('\n')}" # No podemos usar una backslash

1
variable=1


### r raw-strings

Raw (crudo), significa que no que cada caracter se interpreta como lo que es, un caracter. <br>
Es decir, la expresión **\n** genera una nueva línea dentro del string, **\t** genera el resultado de pulsar la tecla **tabulador**. <br>
Sin embargo, si ponemos una **r** delante del string, lo mencionado arriba no ocurre, cada caracter se interpreta como lo que es.

In [15]:
print( '\ta', end = f'\n{"-" * 50}\n')
print( r'\ta', end = f'\n{"-" * 50}\n')
print( '\na', end = f'\n{"-" * 50}\n')
print( r'\na', end = f'\n{"-" * 50}\n')

	a
--------------------------------------------------
\ta
--------------------------------------------------

a
--------------------------------------------------
\na
--------------------------------------------------
