# Bytes y Bytearray

### 1. ¿Qué son los bytes en Python?

Un byte es una ubicación de memoria con un tamaño de 8 bits. Un objeto bytes es una secuencia inmutable de bytes, conceptualmente similar a un string.

El objeto bytes es importante porque cualquier tipo de dato que se escribe en disco se escribe como una secuencia de bytes, los enteros o las cadenas de texto son secuencias de bytes. Lo que convierte la cadena de bytes en una cadena de texto o un número entero, es la forma en la que se interpreta.

Los bytes se representan dentro de python con el tipo de dato `bytes`. La sintaxis utilizada para definir bytes es la siguiente: `b'<cadena de bytes>'`

In [1]:
cadena_bytes = b'\x02\x1f'

In [2]:
type(cadena_bytes)

bytes

In [3]:
print(cadena_bytes)

b'\x02\x1f'


In [4]:
bin(543)

'0b1000011111'

In [5]:
type(bin(543))

str

In [6]:
# Hay que añadir el padding de ceros a la izquierda
# 00000010 | 00011111

In [7]:
hex(543)

'0x21f'

In [8]:
num_bytes = b'\x02\x1f'

In [9]:
int.from_bytes(num_bytes, "big")

543

In [10]:
# Otra forma de definir cadenas de bytes con la funcion bytes()
cadena_bytes2 = bytes(3)

In [11]:
cadena_bytes2

b'\x00\x00\x00'

### 2. Transformando tipos de datos en bytes

Una de las cosas que podemos hacer con el tipo de datos bytes es transformar otros tipos de datos, como cadenas de texto o número, a esta representación.

In [12]:
texto = "Hola mundo"

In [13]:
texto_bytes = b'Hola mundo'

In [14]:
texto_bytes

b'Hola mundo'

In [15]:
type(texto)

str

In [16]:
type(texto_bytes)

bytes

Como podemos observar en el caso anterior, aparentemente ambos tipos tienen la misma representación, esto es debido a que si la cadena de bytes puede interpretarse como caracteres ASCII imprimibles, lo saca por pantalla de esta forma. Tabla ASCII: https://ascii.cl/es/

In [17]:
# Estos bytes se interpretan como A, B y C en ASCII
b'\x41\x42\x43'

b'ABC'

In [18]:
int("41", base=16)

65

In [19]:
b'\x20\x19\x61\x62\x39\x40'

b' \x19ab9@'

In [20]:
bytes(1)

b'\x00'

### 3. Acceso a los elementos de una cadena de bytes

El acceso a los elementos de una cadena de bytes es muy similar al acceso a los elementos de un string y respeta los conceptos de indexing, slicing y stride. Sin embargo, tiene algunas pecualiaridades a la hora de devolver los valores.

In [21]:
cadena_bytes = b'\x20\x19\x61\x62\x39\x40'

In [22]:
cadena_bytes[-1]

64

Como podemos observar, cuando indexamos un elemento de una cadena de bytes, se retorna este elemento interpretado como un `int`. Puedes comprobar la equivalencia en la tabla que se mostraba anteriormente: https://ascii.cl/es/

Por otro lado, podemos interpretar el entero como un valor hexadecimal utilizando la función pode defecto de Python `hex()`

In [23]:
hex(cadena_bytes[-1])

'0x40'

Utilizando slicing y stride, nos devuelve un tipo de dato `bytes`

In [24]:
cadena_bytes[-1:]

b'@'

In [25]:
cadena_bytes[0::2]

b' a9'

Como veíamos en la introducción, los tipos de datos `bytes` son inmutables y por lo tanto no permiten la modificación de sus elementos.

In [26]:
cadena_bytes[0] = b'4'

TypeError: 'bytes' object does not support item assignment

### 4. Operaciones con bytes

Al igual que con otros tipos de datos, los bytes van a permitir el uso de varios de los operadores presentados en la sección anterior.

In [27]:
cad1 = b'\x20\x19\x61'
cad2 = b'\x62\x39\x40'

In [28]:
# Suma
cad1 + cad2

b' \x19ab9@'

In [29]:
# Multiplicación
cad1 * 2

b' \x19a \x19a'

In [30]:
cad1 == cad2

False

In [31]:
cad1 != cad2

True

In [32]:
cad1 is cad2

False

In [33]:
cad1 is cad1

True

### 5. Bytearray

Este tipo de dato se correponde con una cadena de bytes, similar al tipo `bytes` con la diferencia fundamental de que es un tipo de dato mutable

La creación de este tipo de dato debe hacerse siempre a través de la función por defecto de Python `bytearray()`

In [34]:
cadena_bytes = bytearray(b'\x20\x19\x61\x62\x39\x40')

In [35]:
cadena_bytes

bytearray(b' \x19ab9@')

In [36]:
type(cadena_bytes)

bytearray

#### 5.1. Acceso a los elementos de un bytearray

El acceso a los elementos de un objeto bytearray es igual que a un objeto bytes.

In [37]:
cadena_bytes[0]

32

In [38]:
cadena_bytes[0:4]

bytearray(b' \x19ab')

#### 5.2. Modificación de los elementos de un bytearray

La diferencia fundamental entre un objeto bytearray y bytes es que el primero permite modificar sus elementos

In [39]:
cadena_bytes

bytearray(b' \x19ab9@')

In [40]:
cadena_bytes[0:1] = b'8'

In [41]:
cadena_bytes

bytearray(b'8\x19ab9@')

Si realizamos la asignación indexando un único elemento del bytearray, debemos proporcionar un valor de tipo `int`.

Podemos transformar un único carácter a su representación en ASCII como número entero utilizando la función por defecto de Python `ord()`

In [42]:
help(ord)

Help on built-in function ord in module builtins:

ord(c, /)
    Return the Unicode code point for a one-character string.



In [43]:
cadena_bytes

bytearray(b'8\x19ab9@')

In [44]:
cadena_bytes[0]

56

In [45]:
ord('8')

56

In [46]:
cadena_bytes

bytearray(b'8\x19ab9@')

In [47]:
cadena_bytes[2]

97

In [55]:
ord('a')

97

In [48]:
help(chr)

Help on built-in function chr in module builtins:

chr(i, /)
    Return a Unicode string of one character with ordinal i; 0 <= i <= 0x10ffff.



In [49]:
chr(97)

'a'

In [50]:
cadena_bytes[2] = ord('c')

In [51]:
cadena_bytes

bytearray(b'8\x19cb9@')

#### 5.3. Operaciones con bytearray

Las operaciones que podemos realizar con bytearray son muy similares a las que se realizan con objetos bytes

In [52]:
cad1 = bytearray(b'\x20\x19\x61')
cad2 = bytearray(b'\x62\x39\x40')

In [53]:
cad1 + cad2

bytearray(b' \x19ab9@')

In [54]:
cad1*2

bytearray(b' \x19a \x19a')