# Bytes y Bytearray

### 1. ¿Qué son los bytes en Python?

Un byte es una ubicación de memoria con un tamaño de 8 bits. Un objeto bytes es una secuencia inmutable de bytes, conceptualmente similar a un string.

El objeto bytes es importante porque cualquier tipo de dato que se escribe en disco se escribe como una secuencia de bytes, los enteros o las cadenas de texto son secuencias de bytes. Lo que convierte la cadena de bytes en una cadena de texto o un número entero, es la forma en la que se interpreta.

Los bytes se representan dentro de python con el tipo de dato `bytes`. La sintaxis utilizada para definir bytes es la siguiente: `b'<cadena de bytes>'`

In [1]:
# En Python, una cadena de bytes se representa con números hexadecimales de esta forma:
# b'\x02\x1f' -> 2 bytes que representa el nnúmero 543 en base decimal
cadena_bytes = b'\x02\x1f'

In [3]:
cadena_bytes

b'\x02\x1f'

In [4]:
type(cadena_bytes)

bytes

In [5]:
# Devuelve el número binario, en formato string, de un número en base decimal
bin(543)

'0b1000011111'

In [6]:
type(bin(543))

str

In [None]:
# '0b1000011111' ->  00000001 | 00011111 -> 02 | 1f

In [9]:
# Devuelve el número hexadecimal, en formato string, de un número en base decimal
hex(543)

'0x21f'

In [10]:
num_bytes = b'\x02\x1f'

In [11]:
# Transforma una serie de bytes en un número en base decimal
int.from_bytes(num_bytes, "big")

543

In [12]:
help(bytes)

Help on class bytes in module builtins:

class bytes(object)
 |  bytes(iterable_of_ints) -> bytes
 |  bytes(string, encoding[, errors]) -> bytes
 |  bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer
 |  bytes(int) -> bytes object of size given by the parameter initialized with null bytes
 |  bytes() -> empty bytes object
 |  
 |  Construct an immutable array of bytes from:
 |    - an iterable yielding integers in range(256)
 |    - a text string encoded using the specified encoding
 |    - any object implementing the buffer API.
 |    - an integer
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __getnewargs__

In [13]:
# Crea una cadena de n bytes inicializados en 0
cadena_bytes = bytes(3)

In [14]:
cadena_bytes

b'\x00\x00\x00'

### 2. Transformando tipos de datos en bytes

Una de las cosas que podemos hacer con el tipo de datos bytes es transformar otros tipos de datos, como cadenas de texto o número, a esta representación.

In [15]:
texto = "Hola mundo"

In [16]:
texto_bytes = b'Hola mundo'

In [17]:
texto_bytes

b'Hola mundo'

In [18]:
type(texto_bytes)

bytes

In [19]:
type(texto)

str

Como podemos observar en el caso anterior, aparentemente ambos tipos tienen la misma representación, esto es debido a que si la cadena de bytes puede interpretarse como caracteres ASCII imprimibles, lo saca por pantalla de esta forma. Tabla ASCII: https://ascii.cl/es/

In [21]:
# Por defecto, si un número hexadecimal representa un código ASCII, Python muestra el caracter asociado a ese código ASCII
# Estos bytes se interpretan como A, B y C en ASCII
b'\x41\x42\x43'

b'ABC'

In [22]:
# 65 es el código ASCII del caracter 'A'
int.from_bytes(b'\x41', "big")

65

In [23]:
b'\x20\x19\x61\x62\x39\x40'

b' \x19ab9@'

### 3. Acceso a los elementos de una cadena de bytes

El acceso a los elementos de una cadena de bytes es muy similar al acceso a los elementos de un string y respeta los conceptos de indexing, slicing y stride. Sin embargo, tiene algunas pecualiaridades a la hora de devolver los valores.

In [24]:
cadena_bytes = b'\x20\x19\x61\x62\x39\x40'

In [25]:
# Si accedemos a una posición de una cadena de bytes, en este caso Python nos muestra su represenctación en base decimal
cadena_bytes[0]

32

In [26]:
cadena_bytes[-1]

64

Como podemos observar, cuando indexamos un elemento de una cadena de bytes, se retorna este elemento interpretado como un `int`. Puedes comprobar la equivalencia en la tabla que se mostraba anteriormente: https://ascii.cl/es/

Por otro lado, podemos interpretar el entero como un valor hexadecimal utilizando la función pode defecto de Python `hex()`

In [27]:
hex(cadena_bytes[-1])

'0x40'

Utilizando slicing y stride, nos devuelve un tipo de dato `bytes`

In [28]:
cadena_bytes[2:5]

b'ab9'

In [29]:
cadena_bytes[2::2]

b'a9'

Como veíamos en la introducción, los tipos de datos `bytes` son inmutables y por lo tanto no permiten la modificación de sus elementos.

In [30]:
cadena_bytes[0] = b'4'

TypeError: 'bytes' object does not support item assignment

### 4. Operaciones con bytes

Al igual que con otros tipos de datos, los bytes van a permitir el uso de varios de los operadores presentados en la sección anterior.

In [31]:
cad1 = b'\x20\x19\x61'
cad2 = b'\x62\x39\x41'

In [32]:
print(cad1)
print(cad2)

b' \x19a'
b'b9A'


In [33]:
# Suma
cad1 + cad2

b' \x19ab9A'

In [34]:
# Multiplicación
cad1 * 2

b' \x19a \x19a'

In [35]:
cad1 == cad2

False

In [36]:
cad1 != cad2

True

In [37]:
cad1 is cad2

False

### 5. Bytearray

Este tipo de dato se correponde con una cadena de bytes, similar al tipo `bytes` con la diferencia fundamental de que es un tipo de dato mutable

La creación de este tipo de dato debe hacerse siempre a través de la función por defecto de Python `bytearray()`

In [38]:
cadena_bytes = bytearray(b'\x20\x19\x61\x62\x39\x40')

In [39]:
cadena_bytes

bytearray(b' \x19ab9@')

In [40]:
type(cadena_bytes)

bytearray

#### 5.1. Acceso a los elementos de un bytearray

El acceso a los elementos de un objeto bytearray es igual que a un objeto bytes.

In [41]:
cadena_bytes[3]

98

In [42]:
cadena_bytes[1:5]

bytearray(b'\x19ab9')

#### 5.2. Modificación de los elementos de un bytearray

La diferencia fundamental entre un objeto bytearray y bytes es que el primero permite modificar sus elementos

In [43]:
cadena_bytes

bytearray(b' \x19ab9@')

In [44]:
cadena_bytes[0:1] = b'8'

In [45]:
cadena_bytes

bytearray(b'8\x19ab9@')

Si realizamos la asignación indexando un único elemento del bytearray, debemos proporcionar un valor de tipo `int`.

Podemos transformar un único carácter a su representación en ASCII como número entero utilizando la función por defecto de Python `ord()`

In [46]:
help(ord)

Help on built-in function ord in module builtins:

ord(c, /)
    Return the Unicode code point for a one-character string.



In [47]:
cadena_bytes

bytearray(b'8\x19ab9@')

In [48]:
ord('8')

56

In [49]:
cadena_bytes[0]

56

In [50]:
cadena_bytes[2] = ord('h')

In [51]:
cadena_bytes

bytearray(b'8\x19hb9@')

In [52]:
help(chr)

Help on built-in function chr in module builtins:

chr(i, /)
    Return a Unicode string of one character with ordinal i; 0 <= i <= 0x10ffff.



In [53]:
chr(56)

'8'

#### 5.3. Operaciones con bytearray

Las operaciones que podemos realizar con bytearray son muy similares a las que se realizan con objetos bytes

In [54]:
cad1 = bytearray(b'\x20\x19\x61')
cad2 = bytearray(b'\x62\x39\x41')

In [55]:
cad1 + cad2

bytearray(b' \x19ab9A')

In [56]:
cad1 * 4

bytearray(b' \x19a \x19a \x19a \x19a')

In [57]:
cad1 == cad2

False