[![imagenes](imagenes/pythonista.png)](https://pythonista.mx)

# Objetos tipo *str* y tipo *bytes*.

## Objetos tipo *str*.

Python cuenta con varios tipos de objetos relacionados con cadenas de caracteres. El más común es el tipo _str_, el cual puede incluir cualquier tipo de caracter, incluyendo caracteres de escape.

### Los objetos de tipo _str_ son inmutables.

Los elementos contenidos en un objeto de tipo _str_ no pueden ser modificados ni eliminados con _del_.

**Ejemplos:**

In [None]:
saludo = "Hola, amigos."

In [None]:
saludo[1]

In [None]:
saludo[1] = 'a'                         

In [None]:
del saludo[1]

El tipo _str_ cuenta con una enorme cantidad de métodos de diversas índoles que son de gran utilidad cuando se manipulan cadenas de texto.

### Métodos de ajuste de mayúsculas y minúsculas.

#### _lower()_ 
Convierte la cadena de caracteres en minúsculas.

**Ejemplo:**

In [None]:
'Hola, amigos.'.lower()

#### _upper()_ 
Convierte la cadena de caracteres en mayúsculas.

**Ejemplo:**

In [None]:
'Hola, amigos.'.upper()

#### _capitalize()_ 
Convierte al primer caracter del texto en mayúscula y el resto en minúsculas.

**Ejemplo:**

In [None]:
'hola, amigos.'.capitalize()

####  _title()_ 
Convierte al primer caracter de cada palabra en mayúsculas y los otros en minúsculas. 

**Ejemplo:**

In [None]:
'hola, amigos.'.title()

####  _swapcase()_
Transforma los caracteres que están en minúsculas a mayúsculas y los que están en mayúsculas a minúsculas.

**Ejemplo:**

In [None]:
'Hola, amigos.'.swapcase()

#### _casefold()_ 
Transforma el texto en un formato que permita compararlo con otro texto.

**Ejemplo:**

In [None]:
'HoLA, amiGoS.'.casefold()

### Métodos de ajuste del texto.

####  _center()_

Centra el texto en una cadena del tamaño que se ingresa como argumento. Si se añade un caracter como segundo argumento, se sustituyen los espacios en blanco por dicho caracter.

**Ejemplos:**

In [None]:
'Hola, amigos.'.center(30)

In [None]:
'Hola, amigos.'.center(30, 'x')

#### _ljust()_
Ajusta el texto a la izquierda dentro de una cadena del tamaño que se ingresa como argumento. Si se añade un caracter como segundo argumento, se sustituyen los espacios en blanco por dicho caracter.

**Ejemplos:**

In [None]:
'Hola, amigos.'.ljust(30)

In [None]:
'Hola, amigos.'.ljust(30, 'x')

#### _rjust()_
Ajusta el texto a la derecha dentro de una cadena del tamaño que se ingresa como argumento. Si se añade un caracter como segundo argumento, se sustituyen los espacios en blanco por dicho caracter.

**Ejemplos:**

In [None]:
'Hola, amigos.'.rjust(30)

In [None]:
'Hola, amigos.'.rjust(30, 'x')

#### _strip()_
En el caso de que el objeto de tipo _str_ contenga un texto que se encuentre entre cierto número de espacios vacíos, este método eliminaría dichos espacios. En caso de que se ingrese un caracter como argumento, se eliminarían los caracteres que encierren al texto.

**Ejemplos:**

In [None]:
'                 Hola, amigos.        '.strip()

In [None]:
'xxxxxxxxxxxxxxxxxHola, amigos.xxxxxxxx'.strip('x')

#### _lstrip()_
Elimina los espacios vacíos que se encuentran a la izquierda de un texto. En caso de que se ingrese un caracter como argumento, se eliminarán los caracteres correspondientes a la izquierda.

**Ejemplos:**

In [None]:
'                 Hola, amigos.        '.lstrip()

In [None]:
'xxxxxxxxxxxxxxxxxHola, amigos.xxxxxxxx'.lstrip('x')

#### _rstrip()_
Elimina los espacios vacíos que se encuentran a la derecha de un texto. En caso de que se ingrese un caracter como argumento, se eliminarán los caracteres correspondientes a la derecha.

**Ejemplos:**

In [None]:
'                 Hola, amigos.        '.rstrip()

In [None]:
'xxxxxxxxxxxxxxxxxHola, amigos.xxxxxxxx'.rstrip('x')

#### _expandtabs()_
Sustituye los tabuladores con espacios en blanco. Por defecto se sustituye cada tabulador con 4 espacios en blanco, pero se puede definir el numero si se ingresa como argumento.

**Ejemplos:**

In [None]:
'Hola\tamigos'.expandtabs()

In [None]:
'Hola\tamigos'.expandtabs(2)

#### _zfill()_
Genera una cadena de caracteres del tamaño indicado por el argumento y justifica el texto a la derecha, llenando el resto con ceros.
**Ejemplos:**

In [None]:
'Hola'.zfill(6)

In [None]:
'504'.zfill(7)

#### _format()_
Este método permite crear un nuevo objeto de tipo _str_ al que se le insertan elementos de forma similar a como lo hace la función _print()_. La sustitución se realiza mediante el usos de llaves ( _{ }_ ). Los elementos a sustituir se ingresan como argumentos separados por comas.

**Ejemplo:**

In [None]:
'Contrato de prestacion de servicios entre {} y {}.'.format("Juan", "Pedro")

Si no se especifica, cada elemento será sustituido de forma sucesiva de izquierda a derecha. Pero también es posible indicar cual elemento sustituir por su índice. Los argumentos entonces son tratados como objetos de tipo _tuple_ o de tipo _dict_.

**Ejemplos:**

In [None]:
'Contrato de prestacion de servicios entre {1} y {0}.'.format("Juan", "Pedro")

In [None]:
'Contrato de servicios entre {comprador} y {vendedor}.'.format(comprador="Juan",
                                                               vendedor="Pedro")

Este método permite formatear y alinear los elementos a los que sustituye de muchas maneras. 
En el sitio [https://pyformat.info/](https://pyformat.info/) es posible explorar las distintas formas en las que se puede utilizar dicho método.

#### *format\_map()*
Este método es similar a _format()_ con la diferencia de que acepta exclusivamente objetos mapeables, tales como los objetos tipo _dict_.

**Ejemplos:**

In [None]:
'Contrato de servicios entre {comprador} y {vendedor}.'.format_map({'comprador': "Juan",
                                                                    "vendedor":"Pedro"})

In [None]:
'Contrato de servicios entre {comprador} y {vendedor}.'.format_map(dict(comprador="Juan",
                                                                   vendedor="Pedro"))

In [None]:
'Contrato de servicios entre {} y {}.'.format_map(("Juan", "Pedro"))

### Métodos de separación y unión.

#### _join()_
Permite concatenar una secuencia de objetos de tipo _str_ agrupados al ser ingresados como un objeto iterable, utilizando el objeto de tipo _str_ como separador.

**Ejemplos:**

In [None]:
", ".join(["Hugo", "Paco", "Luis"])

In [None]:
" + ".join(("1", "2", "3", "4"))

#### _partition()_
Este método busca de izquierda a derecha el patrón que se ingresa como parámetro dentro del objeto tipo _str_ y al encontrar la primera coincidencia, divide en tres partes al texto. Regresa la parte de la izquierda, el patrón y la parte de la derecha dentro de un objeto tipo _tuple_. En caso de no encontrar coincidencia, el objeto tipo _tuple_ se compondrá del texto original y dos cadenas de caracteres vacías.

**Ejemplos:**

In [None]:
"Hugo, Paco, Luis".partition(", ")

In [None]:
"Hugo, Paco, Luis".partition("+")

#### _rpartition()_
Este método busca de derecha a izquierda el patrón que se ingresa como parámetro dentro del objeto tipo _str_ y al encontrar la primera coincidencia, divide en tres partes al texto. Regresa la parte de la izquierda, el patrón y la parte de la derecha dentro de un objeto tipo _tuple_. En caso de no encontrar coincidencia, el objeto tipo _tuple_ se compondrá del texto dos cadenas de caracteres vacías y el texto original.

**Ejemplos:**

In [None]:
"Hugo, Paco, Luis".rpartition(", ")

In [None]:
"Hugo, Paco, Luis".rpartition("+")

#### _split()_
Este método busca de izquierda a derecha el patrón que se ingresa como parámetro dentro del objeto tipo _str_, identifica a todas las coincidencias y regresa un objeto de tipo _list_ con cada fragmento de texto delimitado por el patrón. En caso de no encontrar al patrón, regresará un objeto de tipo _list_, conteniendo al objeto _str_ original.

**Ejemplos:**

In [None]:
"Hugo, Paco, Luis".split(", ")

In [None]:
"Hugo, Paco, Luis".split("+")

#### _rsplit()_
Este método busca de derecha a izquierda el patrón que se ingresa como parámetro dentro del objeto tipo _str_, identifica a todas las coincidencias y regresa un objeto de tipo _list_ con cada fragmento de texto delimitado por el patrón. En caso de no encontrar al patrón, regresará un objeto de tipo _list_, conteniendo al texto original.

**Ejemplos: **


In [None]:
"Hugo, Paco, Luis".rsplit(", ")

In [None]:
"Hugo, Paco, Luis".rsplit("+")

#### _splitlines()_
Método que identifica retornos de línea _"\n"_ y regresa un objeto de tipo _list_ conteniendo cada línea identificada. en caso de no encontrar un retorno de línea, regresará un objeto de tipo _list_ conteniendo a su vez un objeto de tipo _str_ conteniendo al texto original.

**Ejemplo:**

In [None]:
nombres = "Hugo.\nPaco.\nLuis."
print(nombres)

In [None]:
nombres.splitlines()

### Métodos de búsqueda y reemplazo.

#### _find()_
Método que busca de izquierda a derecha un patrón que es ingresado como argumento y regresa el índice del primero que encuentra. En caso de no encontrarlo regresará el valor _-1_.

**Ejemplos:**

In [None]:
'Luis, Hugo, Paco, Luis'.find('Paco')

In [None]:
'Luis, Hugo, Paco, Luis'.find('Luis')

In [None]:
'Luis, Hugo, Paco, Luis'.find('Juan')

#### _rfind()_
Método que busca de derecha a izquierda un patrón que es ingresado como argumento y regresa el índice del primero que encuentra. En caso de no encontrarlo regresará el valor _-1_.

**Ejemplos:**

In [None]:
'Luis, Hugo, Paco, Luis'.rfind('Paco')

In [None]:
'Luis, Hugo, Paco, Luis'.rfind('Luis')

In [None]:
'Luis, Hugo, Paco, Luis'.rfind('Juan')

#### _index()_
Método que busca de izquierda a derecha un patrón que es ingresado como argumento y regresa el índice del primero que encuentre. En caso de no encontrarlo se generará un mensaje de error.

**Ejemplos:**

In [None]:
'Luis, Hugo, Paco, Luis'.index('Paco')

In [None]:
'Luis, Hugo, Paco, Luis'.index('Luis')

In [None]:
'Luis, Hugo, Paco, Luis'.index('Juan')

#### _rindex()_
Método que busca derecha a izquierda un patrón que es ingresado como argumento y regresa el índice del primero que encuentre. En caso de no encontrarlo se generará un mensaje de error de tipo _ValueError_.

**Ejemplos:**

In [None]:
'Luis, Hugo, Paco, Luis'.rindex('Paco')

In [None]:
'Luis, Hugo, Paco, Luis'.rindex('Luis')

In [None]:
'Luis, Hugo, Paco, Luis'.rindex('Juan')

#### _replace()_
Método al que se le ingresan un patrón y un texto de sustitución. Regresará un objeto tipo _str_ sustituyendo cada coincidencia. En caso de no encontrar coincidencias, regresará un objeto tipo _str_ con el texto original.

**Ejemplos:**

In [None]:
'Luis, Hugo, Paco, Luis'.replace('Luis', 'Juan Antonio')

In [None]:
'Luis, Hugo, Paco, Luis'.replace('Pedro', 'Juan')

### Métodos de evaluación.

#### _count()_
Cuenta el número de veces que aparece un patrón ingresado como argumento dentro del texto.

**Ejemplos:**

In [None]:
"Hola, amigos.". count("a")

In [None]:
"Hola, amigos.". count("la")

In [None]:
"Hola, amigos.". count("z")

#### _startswith()_
Evalúa si el patrón ingresado como argumento corresponde al inicio del texto en el objeto de tipo _str_. Regresa _True_ si hay correspondencia y de lo contrario, regresa _False_.

**Ejemplos:**

In [None]:
"Hola, amigos.".startswith("la")

In [None]:
"Hola, amigos.". startswith("Hola")

#### _endswith()_
Evalúa si el patrón ingresado como argumento corresponde al final del texto en el objeto de tipo _str_. Regresa _True_ si hay correspondencia y de lo contrario, regresa _False_.

**Ejemplos:**

In [None]:
"Hola, amigos.".endswith("Hola")

In [None]:
"Hola, amigos.".endswith("gos.")

#### _isalnum()_
Evalúa si el texto del objeto tipo _str_ contiene exclusivamente caracteres alfanuméricos.

**Ejemplos: **

In [None]:
"@#%&".isalnum()

In [None]:
'Hola 12'.isalnum()

In [None]:
"Hola12".isalnum()

#### _isalpha()_
Evalúa si el texto del objeto tipo _str_ contiene exclusivamente caracteres alfabéticos (en cualquier alfabeto de Unicode).

**Ejemplos: **

In [None]:
"@#%&".isalpha()

In [None]:
'Hola'.isalpha()

In [None]:
'Hola.'.isalpha()

In [None]:
'Ω'.isalpha()

#### _isnumeric()_
Evalúa si el texto del objeto tipo _str_ contiene caracteres exclusivamente con representación numérica.

**Ejemplos:**

In [None]:
'0x1a'.isnumeric()

In [None]:
'-22.1'.isnumeric()

In [None]:
'23'.isnumeric()

In [None]:
'2²'.isnumeric()

In [None]:
'½'.isnumeric()

#### _isdecimal()_
Evalúa si el texto del objeto tipo _str_ contiene caracteres exclusivamente con representación numérica decimal.

**Ejemplos:**

In [None]:
'0x1a'.isdecimal()

In [None]:
'-22.1'.isdecimal()

In [None]:
'23'.isdecimal()

In [None]:
'2²'.isdecimal()

In [None]:
'½'.isdecimal()

#### _isdigit()_
Evalúa si el texto del objeto tipo _str_ contiene caracteres exclusivamente que representen dígitos.

**Ejemplos:**

In [None]:
'0x1a'.isdigit()

In [None]:
'-22.1'.isdigit()

In [None]:
'23'.isdigit()

In [None]:
'2²'.isdigit()

In [None]:
'½'.isdigit()

#### _islower()_
Evalúa si los caracteres alfabéticos contenidos en el texto están solamente en minúsculas.

**Ejemplos:**


In [None]:
'¡hola, amigos!'.islower()

In [None]:
'¡Hola, amigos!'.islower()

#### _isupper()_
Evalúa si los caracteres alfabéticos contenidos en el texto están solamente en mayúsculas.

**Ejemplos:**

In [None]:
'¡HOLA, AMIGOS!'.isupper()

In [None]:
'¡Hola, amigos!'.isupper()

#### _istitle()_
Evalúa si cada palabra del texto contenido en el objeto tipo _str_ comience con mayúsculas y el resto sean minúsculas.

**Ejemplos:**

In [None]:
'¡HOLA, AMIGOS!'.istitle()

In [None]:
'¡Hola, amigos!'.istitle()

In [None]:
'¡Hola, Amigos!'.istitle()

In [None]:
'¡HOla, Amigos!'.istitle()

#### _isprintable()_
Evalúa si el texto contenido en le objeto tipo _str_ incluye sólo caracteres imprimibles.

**Ejemplos:**

In [None]:
nombres = "Hugo.\nPaco.\nLuis."
print(nombres)

In [None]:
nombres.isprintable()

In [None]:
nombres = "Hugo.\tPaco.\tLuis."
print(nombres)

In [None]:
nombres.isprintable()

In [None]:
'Hugo, Paco, Luis.'.isprintable()

#### _isspace()_
Evalúa si el objeto tipo _str_ está compuesto exclusivamente de espacios.

**Ejemplos:**

In [None]:
''.isspace()

In [None]:
'     '.isspace()

In [None]:
'Hola, mundo.'.isspace()

#### _isidentifier()_
Evalúa si el objeto tipo _str_ cumple con las características de un identificador.

**Ejemplos:**

In [None]:
'Nombre'.isidentifier()

In [None]:
'!1nombre'.isidentifier()

In [None]:
'Hola, mundo.'.isidentifier()

### Métodos de mapeo de caracteres.
Es posible generar tablas de caracteres, los cuales puedan sustituir a unos por otros. Este tipo de sustitución se hace generalmente cuando se debe interactuar con aplicaciones que no aceptan caracteres especiales.

#### _maketrans()_
Este método permite crear una tabla de caracteres, la cual consiste en un diccionario que relaciona a un par de caracteres por su número correspondiente en la codificación.

**Ejemplo:**

In [None]:
trans = "".maketrans("áäàéëèíïìóöòúüù", "aaaeeeiiiooouuu")
trans

#### _translate()_
Este método sustituye los caracteres a partir de una tabla de caracteres.

**Ejemplo:**

In [None]:
trans = ''.maketrans("áäàéëèíïìóöòúüù", "aaaeeeiiiooouuu")
'Hólá amïgòs. ¿Cómö éstán?'.translate(trans)

In [None]:
trans = ''.maketrans('oieastg', '0134579')
"Hola, amigos. ¿Como estan?".translate(trans)

### Métodos de codificación.

Como ya se ha mencionado, Python 3 utiliza la codificación de caracteres UTF-8, un subconjunto de la especificación de Unicode; mientras que Python 2 utiliza la codificación ASCII. Los codificaciones estándar soportadas por Python 3 pueden ser consultadas desde [esta liga](https://docs.python.org/3/library/codecs.html#standard-encodings).

Es posible cambiar el tipo de codificación del texto contenido en un objeto tipo _str_ a otra codificación. 

#### _encode()_
Este método permite transformar el contenido de un objeto _str_ de una codificación en otra. El resultado de la transformación es un objetos tipo _bytes_. El formato de codificación se define mediante la asignación del valor de dicha codificación  al identificador _encoding_. El valor por defecto de _encoding_ es _"utf-8"_.

Es común que no todos los caracteres tengan una correspondencia de una codificación a otra, por lo que se pueden generar errores de conversión. Se pueden definir cuatro formas de gestionar estos errores ingresando el valor de la forma relacionado con el identificador _errors_. 

* _'strict'_, el cual emite un error de codificacion. Si no se indica, esta es la forma por defecto de gestionar los errores de codificación.
* _'ignore'_, el cual ignora el caracter en cuestión y prosigue con el siguiente.
* _'replace'_ el cual sustituye al caracter en cuestión por un signo de interrogación ( _?_).
* _'xmlcharrefreplace'_ el cual sustituye el caracter por el valor correspondiente a su [valor de entidad de caracter de XML](https://es.wikipedia.org/wiki/Anexo:Entidades_de_caracteres_XML_y_HTML). 

**Ejemplos:**

In [None]:
'Holåé'.encode(encoding="ascii", errors='ignore')

In [None]:
'Holåé'.encode(encoding="ascii", errors='replace')

In [None]:
'Holåé'.encode(encoding="ascii", errors='xmlcharrefreplace')

In [None]:
'Holåé'.encode(encoding="ascii", errors='strict')

## Objetos tipo _bytes_.

Además de los objetos de tipo _str_ existen diversos tipos de datos que también pueden contener caracteres. 

Son una sucesión ordenada de valores que representan a un caracter conforme a su número correspondiente en el [código ASCII](http://www.asciitable.com/) y se definen anteponiendo la letra _b_ a los apóstrofes o comillas.
```
b'<texto>'
b"<texto>" 
```

Cuando se utiliza un ojbeto de tipo _bytes_ en la función _print()_, no despliega un texto sino el valor del objeto.

**Ejemplos:**

In [None]:
palabra = b"Hola"

In [None]:
type(palabra)

In [None]:
print(palabra)

In [None]:
palabra[0]

In [None]:
palabra[2:4]

In [None]:
palabra[1] = b'm'

### Transformaciones entre objetos _str_ y _bytes_.
Para transformar un objeto de tipo _str_ a _bytes_ se utiliza la función _bytes()_, ingresando al objeto como primer argumento y posteriormente el valor al que corresponde la codificación que se aplicará. 
En el caso de querer transformar un objeto _bytes_ a _str_ se utiliza la función _str()_ ingresando al objeto como primer argumento y posteriormente el valor al que corresponde la codificación que se aplicará.


In [None]:
print(bytes('hola', "utf-8"))

In [None]:
print(str(b'hola'[1:3], 'ascii'))

### Métodos de los objetos tipo _bytes_.

Los objetos de tipo _bytes_ comparten los siguientes métodos con los de tipo _str_: 
* _capitalize()_
* _ center()_
* _ count()_
* _endswith()_
* _expandtabs()_
* _find()_
* _index()_
* _isalnum()_
* _isalpha()_
* _isdigit()_
* _islower()_
* _isspace()_
* _istitle()_
* _isupper()_
* _join()_
* _ljust()_
* _lower()_
* _lstrip()_
* _maketrans()_
* _partition()_
* _replace()_
* _rfind()_
* _rindex()_
* _rjust()_
* _rpartition()_
* _rsplit()_
* _rstrip()_
* _split()_
* _splitlines()_
* _startswith()_
* _strip()_
* _swapcase()_
* _title()_
* _translate()_
* _upper()_
* _zfill()_

#### _decode()_
Este método funciona de manera inversa al método _code()_ de los objetos tipo str. 
Se ingresan como argumentos el valor de codficación ligado al identificador _encoding_ y el valor de manejo de errores de codificación ligado al identificador _errors_.

**Ejemplo:**

In [None]:
b'Hola,'.decode(encoding="utf-8")

#### _hex()_
Regresa un objeto tipo _str_ que contiene la representación en hexadecimal de cada elemento del objeto tipo _bytes_.

**Ejemplo:**

In [None]:
b'Hola'.hex()

#### _fromhex()_
Regresa un objeto tipo _bytes_ a partir de un objeto _str_ que contiene la representación en hexadecimal de uno o más caracteres ASCII.

**Ejemplo:**

In [None]:
b''.fromhex('486f6c61')

## Funciones útiles con los objetos tipo  _str_ y tipo _bytes_.

### La función _len()_.
La función _len()_ devuelve el número de caracteres contenidos en un objeto tipo _str_ o tipo _bytes_ mediante la siguiente sintaxis:
```
len(<objeto>)
```
**Ejemplo:**

In [None]:
len(b'Hola')

### La función _max()_.
La función _max()_ devuelve el elemento de mayor valor contenido en un objeto de tipo _bytes_ o _str_ mediante la siguiente sintaxis:
```
max(<objeto>)
```

**Ejemplo:**

In [None]:
max('Hola')

In [None]:
max(b'Hola')

### La función _min()_.
La función _min()_ devuelve el elemento de mayor valor contenido en un objeto de tipo _bytes_ o _str_ mediante la siguiente sintaxis:
```
min(<objeto>)
```

**Ejemplos:**

In [None]:
min(b'Hola')

In [None]:
min('Hola')

### La función _sum()_ sólo para tipo *bytes*.
La función _sum()_ devuelve la suma de los valores contenido en un objeto de tipo _bytes_ mediante la siguiente sintaxis:
```
sum(<objeto>)
```

**Ejemplos:**

In [None]:
sum(b'Hola')

## Iteraciones con _for_...*in* para objetos tipo _str_ y tipo _bytes_.

Tanto para los objetos tipo _str_ como para los objetos tipo _bytes_, cada caracter se vuelve un elemento iterable.

**Ejemplos:**

In [None]:
for letra in "Hola":
    print(letra)

In [None]:
for caracter in b"Hola":
    print(caracter)

## Objetos tipo  _unicode_ en Python 2.

Python 2 incluye un tipo _unicode_, el cual se identifica con una u, previa a los apóstrofes o comillas. Python 3 no incluye a este tipo de dato.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2018.</p>