# Tipos de datos


## Su nuevo mejor amigo, antes de empezar: printf

La función `printf`, provista por la librería `stdio.h` de C es la función por defecto que utilizaremos para mostrar mensajes en pantalla. La `f` al final de su nombre viene de "format" o "formatted". Funciona de forma parecida a [la antigua forma de formatear strings en python](https://pyformat.info/). **Nota: es distinto en varios puntos.**

Iremos viendo casos de uso a lo largo de los tutoriales, pero creo que para C tienen hasta página de wikipedia (como casi todo lo de C).


## Tipos de datos básicos:

- int y variaciones: para representar números enteros.
- float: para representar números racionales.
- double: para representar números racionales con más precisión.
- char: para representar caracteres y texto (en el próximo tutorial).

[Aquí](https://en.wikipedia.org/wiki/C_data_types#Basic_types) pueden encontrar todos los posibles tipos de datos básicos.

### Declaración de variables

In [None]:
#include<stdio.h>


int main() {
    // Declarar una variable
    int a;
    // Asignar su valor
    a = 4;
    
    // Declarar y asignar al mismo tiempo
    int b = 5;
    
    // Decarar varias variables del mismo tipo al mismo tiempo
    int c, d;
    // Y asignar 
    c = 3;
    d = 9;
    
    // Declarar y asignar un valor a la vez para cada una
    int e = 46, f = -88;
    
    // Asignar un valor a la última descrita
    int g, h = 14;
    
    printf("A: %i, B: %i, C: %i, D: %i, E: %i, F: %i, G: %i, H: %i\n", a, b, c, d, e, f, g, h);
    
    return 0;
}

### Ints y sus variaciones

Ejemplo:

In [None]:
#include <stdio.h>


int main() {
    // Entero de 32 bits
    int a = -1;
    
    // Entero de 64 bits
    long b = -1;
    
    // Entero de 16 bits
    short c = -1;
    
    // Entero de 32 bits sin signo
    unsigned d = 0xffffffff;
    
    // Entero de 64 bits sin signo
    unsigned long e = 0xffffffffffffffff;
    
    // Entero de 16 bits sin signo
    unsigned short f = 0xffff;
    
    // el clásico entero
    int g = 4;
    
    puts("Valores:");
    puts("");
    printf(
        "\tSigned\nA: %i\nB: %li\nC: %hi\nG: %i\n\n\tUnsigned\nD: %u\nE: %lu\nF: %hu\n", 
        a, 
        b, 
        c, 
        g,
        d, 
        e, 
        f
    );
    
    // La función "puts" imprime algo en pantalla pero sin poder
    // incluir variables ni trabajar con formatos. Lo que sí hace es
    // colocar el salto de línea al final.
    puts("\n\n\n");
    puts("Tamaños:");
    puts("");
    printf(
        "\tSigned\nA: %li bytes\nB: %li bytes\nC: %li bytes\nG: %li bytes\n\n\tUnsigned\nD: %li bytes\nE: %li bytes\nF: %li bytes\n",
        sizeof(a), 
        sizeof(b), 
        sizeof(c),
        sizeof(g),
        sizeof(d), 
        sizeof(e), 
        sizeof(f)
    );
    
    return 0;
}

### Librería stdint.h

Como parte de la librería estándar de C, se encuentra stdint.h, que proporciona definiciones de estos y más tipos de datos enteros de una forma menos verbosa, los estaremos utilizando constantemente a partir de ahora.

La estructura de los tipos de datos que porporciona es:
```
<uint/int><tamaño>_t
```

- `uint` versus `int`: `uint` se usa cuando queremos que no tenga signo, pero `int` se usa cuando queremos que sí lo tenga.
- `tamaño`: son potencias de dos, disponemos de enteros desde 8 hasta 64 bits.
- `_t`: por convención así se llaman.


Vamos con un ejemplo!

In [None]:
#include <stdio.h>
#include <stdint.h>


int main() {
    
    // Imaginen que queremos declarar un entero de 8 bits con signo
    int8_t a = -4;
    
    // ¿Y un entero sin signo de 64 bits?
    uint64_t b = -1;
    
    printf("A: %i\nB: %lu\n", a, b);
    
    puts("\n¿Pero cuánto valdría B si tuviera signo?\n");
    printf("B con signo: %li\n", b);
    
    return 0;
}

Como se podrán dar cuenta, es más breve y sencillo anotar los tipos de datos definidos de esta forma, además, la función printf nos permite imprimir un tipo de dato como si fuera otro. Esto es porque los tipos de datos no existen en los datos en sí, sino en cómo los manipulamos. A continuación un par de ejemplos sobre esto, que es una idea muy potente.

### Operaciones sobre enteros con y sin signo

Lo que propuse arriba es que un mismo dato puede tener diferentes comportamientos según cómo se manipule, probemos con algunas operaciones matemáticas.

In [None]:
#include <stdio.h>
#include <stdint.h>


int main() {
    
    uint32_t a, b, c;
    int32_t d;
    
    a = 4;
    b = 100;
    
    c = a - b;
    d = a - b;
    
    printf("C: %u\nD: %i\n", c, d);
    
    if (c == d) {
        puts("Son iguales!");
    }

    return 0;
}

Ese fue un caso en el que, sin importar si se declaraba con o sin signo, el valor era siempre el mismo, pero cambiando su representación para el usuario.

Ahora veremos un caso en el que "la misma operación" tiene un efecto distinto según el signo, luego explicaremos la razón.

In [None]:
#include <stdio.h>
#include <stdint.h>


int main() {
    uint16_t a = -1;
    int16_t b = -1;
    
    puts("Antes del shift!");
    
    printf("A: ");
    printf("0x%X\n", a);
    printf("B: ");
    printf("0x%X\n", (uint16_t)b);  // el (uint16_t) antes de "b" hace que el compilador "interprete"
                                // el dato como del tipo especificado, en este caso, un entero
                                // sin signo de 16 bits.
    
    a = a >> 1;  // ¿shift right?
    b = b >> 1;  // shift right
    
    puts("Después del shift!");
    printf("A: ");
    printf("0x%X\n", a);
    printf("B: ");
    printf("0x%X\n", (uint16_t)b);
    
    return 0;
}


#### ¿QUÉ PASÓ? ¿EL COMPUTADOR ESTÁ ROTO? ¡PERO SI ES LA MISMA OPERACIÓN! #Panic!

Eso se supone, pero en realidad, existen **dos** tipos de "shift right". Uno con y otro sin signo.

Los shift right que conocemos por el curso son los sin signo, simplemente dividen por dos y rellenan con ceros, mientras que los que causan que ambos valores sean diferentes son los shifts **con** signo: SAR (shift arithmetic right). Lo que hace es que, si el bit más significativo es un 1, al dividir por 2 en lugar de rellenar con un cero, rellenará con un 1 para así preservar el signo.

> Link de la [sección de la isa x86 sobre los shifts](https://c9x.me/x86/html/file_module_x86_id_285.html).<br>
> Link a una [explicación del SAR](http://www.c-jump.com/CIS77/ASM/Flags/F77_0160_sar_instruction.htm).<br>
> Links a los artículos de wikipedia sobre el [shift lógico](https://en.wikipedia.org/wiki/Logical_shift) y el [shift aritmético](https://en.wikipedia.org/wiki/Arithmetic_shift).

¿Pero cómo pasa que son distintos si uso la misma expresión? ¿No puedo controlarlo?

**En resumen: si el dato tiene signo (según cómo está definido), el compilador usará la intrucción SAR, mientras que si es sin signo, usará la instrucción SHR.**

~~Ese es el resúmen de mi pánico haciendo la tarea 1. Tengan cuidado con esto.~~

### Chars

Seguimos con los tipos de datos básicos y ahora toca hablar de los char, que corresponden a los caracteres. Son un byte y típicamente tienen signo. Un ejemplo.

In [None]:
#include <stdio.h>

int main() {
    char a = 'u';  // los char se escriben con comillas simples, los strings con comillas dobles.
    
    printf("A: '%c'\n", a);
    
    return 0;
}

Volvamos un poco a hablar sobre los tipos de datos y compiladores y miremos el siguiente ejemplo:

In [None]:
#include <stdio.h>

int main() {
    int a = 3;
    char b = 'k';
    int c;
    
    printf("A: %i\n", a);
    c = a + b;  // estoy sumando un int con un char
    
    printf("C: %i\n", c);
    
    printf("B como char: %c\nB como int: %i", b, b);
    
    return 0;
}

#### ¿Qué pasó?

Bueno, pueeesssss... un caracter es un entero de 8 bits con signo, por lo que se puede operar con ellos como tal.

Sí reciben un trato especial que amerita el nombre distintivo (además de por sanidad mental) cuando hablamos de strings, pero eso quedará para el siguiente tutorial.


### Floats y Doubles

Estos tipos de datos permiten trabajar con números racionales, sin embargo, poseen la restricción de estar representados no solo en una cantidad finita de bits sino también en base dos, por lo que números que son fácilmente representables en base 10, se convierten en periódicos, semiperiódicos o simplemente decimales infinitos en bae 2.

Ejemplo!

In [None]:
#include <stdio.h>

int main() {
    float a = 44.6;
    double b = 44.6;
    
    
    // Si el cuerpo de una sentencia if tiene una única línea, se pueden omitir las llaves.
    // lo mismo pasa con los ciclos while.
    
    if (a > b)
        puts("A es mayor");
    else if (b > a)
        puts("B es mayor");
    else
        puts("Son iguales");
    
    printf("A: %.25f\n", a);  // imprimimos los valores ocn 25 decimales
    printf("B: %.25f\n", b);
    
    return 0;
}

#### ¿No da exacto? ¿Son distintos?

Yep.

No da exacto porque `446 / 10` en binario es `110111110 / 1010`, que es `101100.10101010...`, es un decimal periódico y, al tener finitos bits, tenemos que truncar.

Y, son distintos, ya que el lugar donde se trunca al tener distinta cantidad de bits en cada caso es diferente.


### Modificando un float con operaciones bitwise.
¿Y cuál es el número inmediatamente superior a A? ¿Es mayor que B?

Probemos!

In [None]:
#include <stdio.h>
#include <stdint.h>

int main() {
    float a = 44.6;
    double b = 44.6;
    
    // Basándonos en la convención IEEE754, vamos a cambiar el bit menos significativo de la fracción de 0 a 1.
    uint32_t aux = *(uint32_t*)&a; // aquí pedimos interpretar los bits de A como si fueran un entero de 32 bits sin signo.
    aux |= 1;                      // aquí hacemos un OR bitwise para setear el bit menos significativo de la parte 
                                   // fraccionaria en 1
    a = *(float*)&aux;             // guardamos los nuevos bits en A, que seguirá interpretándose como float.
    // Fin del proceso. Aquí hago un manejo de punteros que pueden revisar por su cuenta mientras tanto si lo desean,
    // de todos modos lo veremos en el futuro. No lo necesitan entender para la Tarea 1.
    
    if (a > b)
        puts("A es mayor");
    else if (b > a)
        puts("B es mayor");
    else
        puts("Son iguales");
    
    printf("A: %.25f\n", a);  // imprimimos los valores ocn 25 decimales
    printf("B: %.25f\n", b);
    
    return 0;
}

Intentemos ver cuál es la diferencia producida por ese bit modificado, en el valor de A.

In [None]:
#include <stdio.h>
#include <stdint.h>

int main() {
    
    float a = 44.6;
    float b = 44.6;
    
    // Basándonos en la convención IEEE754, vamos a cambiar el bit menos significativo de la fracción de 0 a 1.
    uint32_t aux = *(uint32_t*)&a;
    aux |= 1;
    a = *(float*)&aux;
    // Fin del proceso.

    printf("A: %.25f\n", a);  // imprimimos los valores ocn 25 decimales
    printf("B: %.25f\n", b);
    printf("A - B: %.25f\n", a - b);  // ¿Cuál es la precisión?
    
    return 0;
}

### ¿Y qué pasa con los Bools?

Son un invento del diablo.

...

Ok, me dicen que no puedo decir solo eso. ¿Quieren bools? Aquí tienen bools.

In [None]:
#include <stdio.h>
#include <stdbool.h>

int main() {
    bool x = true;
    
    printf("Tamaño: %li byte(s)\n", sizeof(bool));
    
    if (x)
        puts("SON IGUALES!");
    
    return 0;
}

En un if False se define como 0, cualquier otra cosa se considera como True (solo que por defecto en la librería stdbool.h es 1).

### Conclusión del experimento

![awa](https://i.imgur.com/pwnGACY.jpg "owo")
