# array

arrays são um espaço contíguo em memória de tamanho fixo em que é possível guardar elementos.  
em algumas linguagens é possível colocar elementos de diferentes tipos, em outras o tipo é fixo.

ex: `[0, 3, 4, 5, 7, 1]`

## complexidade

- **acesso por índice:** rápido, `O(1)`, porque você vai direto à posição correta.
- **inserir ou remover no meio:** `O(n)`, porque você precisa deslocar os itens para abrir espaço ou preencher o vazio. talvez seja necessário mover o array inteiro dependendo da disposição da memória.

caso você tenha o seguinte array em memória:

```
[0000 1111 0000 1111]
```

ele pode ser interpretado como 4 elementos de 4 bits.

ou 2 elementos de 8 bits cada:

```
[00001111 00001111]
```

ou 1 elemento de 16 bits:

```
[0000111100001111]
```

diferente de linguagens de alto nível em que as estruturas de dados "array"/"lista", quando se trata de código de baixo nível é necessário que se especifique, o tamanho de cada elemento que será inserido em memória, e também o comprimento do array, veja esse código em rust:

```rust
fn main() {
    let my_array: [i32; 4] = [1, 2, 3, 4];
}
```

esse código cria um array de comprimento 4, com quanto inteiros de 32 bits.

tendo tamanho fixo em tempo de compilação, se torna possível colocar esse array inteiro na stack, já que o tamanho fixo e imutável dele é de 32 bits \* 4 = 128 bits.

pra tirar a prova real, esse é o código assembly gerado pro código acima usando o `rustc 1.91.0` no [compiler explorer](https://godbolt.org/)

```asm
main:
    mov     dword ptr [rsp - 16], 1
    mov     dword ptr [rsp - 12], 2
    mov     dword ptr [rsp - 8], 3
    mov     dword ptr [rsp - 4], 4
    ret
```

`dword` significa _"double word"_ o que significa 4 bytes ou 32 bits.  
`rsp` é o ponteiro da stack.  
`mov` é a instrução de cópia, essa é a sintaxe `mov dest, src`  
quando executa `mov rax, 42`, o valor `42` é copiado no registrador `rax`.


In [7]:
# cria um buffer de 8 bytes
# lembrando que cada 1 byte são 8 bits
buf = bytearray(8)

# cria uma view de unsigned byte (u8) para o buffer
a8 = memoryview(buf).cast("B")
print("[u8 ; 8]:", list(a8))

# cria uma view de unsigned integer (u32) para o buffer
a32 = memoryview(buf).cast("I")
print("[u32; 2]:", list(a32))

# esse é o maior valor possível que cabe em um u32, quer dizer cada bit desse u32 seria 1 ao invés de 0.
# 11111111111111111111111111111111 — 1 repetido 32 vezes é igual a 4294967295
a32[0] = 4294967295

# na view de um array de u32, você verá o número na primeira posição [4294967295, 0]
print("[u32; 2]:", list(a32))

# mas já na view de um array de u8, você verá [255, 255, 255, 255, 0, 0, 0, 0], isso quer dizer que ao ler os bits desse espaço contíguo e memória e interpretar como um array de 8 posições de u8, você verá o maior valor de um u8 repetido quatro vezes.
# 11111111 11111111 11111111 11111111 — o que é [255, 255, 255, 255]
print("1" * 8)
print("[u8; 8]:", list(a8))


[u8 ; 8]: [0, 0, 0, 0, 0, 0, 0, 0]
[u32; 2]: [0, 0]
[u32; 2]: [4294967295, 0]
11111111
[u8; 8]: [255, 255, 255, 255, 0, 0, 0, 0]


# arrays em python

em python, a estrutura mais próxima de um array é a `list`.  
tecnicamente, `list` é um array dinâmico — cresce automaticamente conforme você adiciona elementos.

para arrays de verdade (tamanho fixo, tipo único), python tem o módulo `array` da stdlib.

In [8]:
import array

# array de inteiros signed (i = signed int, 4 bytes)
arr = array.array("i", [1, 2, 3, 4, 5])
print(f"array de inteiros: {arr}")
print(f"tipo: {arr.typecode}, tamanho de cada item: {arr.itemsize} bytes")

# list do python (array dinâmico, aceita tipos mistos)
li = [1, "dois", 3.0, True]
print(f"\nlista python: {li}")

array de inteiros: array('i', [1, 2, 3, 4, 5])
tipo: i, tamanho de cada item: 4 bytes

lista python: [1, 'dois', 3.0, True]


# operações comuns

## acesso por índice — O(1)

acesso direto é muito rápido porque arrays são contíguos em memória.  
dado o endereço base e o tamanho de cada elemento, calcular a posição é trivial:

`endereço = base + (índice * tamanho_elemento)`

In [9]:
nums = [10, 20, 30, 40, 50]

# acesso por índice positivo
print(f"primeiro elemento: nums[0] = {nums[0]}")
print(f"terceiro elemento: nums[2] = {nums[2]}")

# acesso por índice negativo (conta de trás pra frente)
print(f"último elemento: nums[-1] = {nums[-1]}")
print(f"penúltimo elemento: nums[-2] = {nums[-2]}")

primeiro elemento: nums[0] = 10
terceiro elemento: nums[2] = 30
último elemento: nums[-1] = 50
penúltimo elemento: nums[-2] = 40


## slicing — O(k) onde k é o tamanho do slice

slicing cria uma **cópia** da porção selecionada.  
sintaxe: `lista[início:fim:passo]`

In [10]:
nums = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

# slicing básico [início:fim] — fim não incluso
print(f"nums[2:5] = {nums[2:5]}")  # [2, 3, 4]

# omitir início ou fim
print(f"nums[:3] = {nums[:3]}")  # do início até índice 3
print(f"nums[7:] = {nums[7:]}")  # do índice 7 até o fim

# com passo
print(f"nums[::2] = {nums[::2]}")  # pula de 2 em 2
print(f"nums[1::2] = {nums[1::2]}")  # ímpares

# reverter array
print(f"nums[::-1] = {nums[::-1]}")

# cópia do array inteiro
copia = nums[:]
print(f"cópia: {copia}")

nums[2:5] = [2, 3, 4]
nums[:3] = [0, 1, 2]
nums[7:] = [7, 8, 9]
nums[::2] = [0, 2, 4, 6, 8]
nums[1::2] = [1, 3, 5, 7, 9]
nums[::-1] = [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
cópia: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


## inserção

| operação                  | complexidade   | motivo                                                |
| ------------------------- | -------------- | ----------------------------------------------------- |
| `append(x)` — no final    | `O(1)*`        | amortizado, ocasionalmente `O(n)` quando redimensiona |
| `insert(i, x)` — no meio  | `O(n)`         | precisa deslocar todos os elementos após `i`          |
| `insert(0, x)` — no início| `O(n)`         | precisa deslocar todos os elementos                   |

\*`O(1)` amortizado significa que na média é `O(1)`, mas ocasionalmente é `O(n)` quando o array precisa crescer.

In [11]:
nums = [1, 2, 3]

# append — adiciona no final — O(1) amortizado
nums.append(4)
print(f"após append(4): {nums}")

# insert — adiciona em posição específica — O(n)
nums.insert(0, 0)  # insere 0 no início
print(f"após insert(0, 0): {nums}")

nums.insert(2, 99)  # insere 99 na posição 2
print(f"após insert(2, 99): {nums}")

# extend — adiciona múltiplos elementos no final — O(k)
nums.extend([5, 6, 7])
print(f"após extend([5, 6, 7]): {nums}")

após append(4): [1, 2, 3, 4]
após insert(0, 0): [0, 1, 2, 3, 4]
após insert(2, 99): [0, 1, 99, 2, 3, 4]
após extend([5, 6, 7]): [0, 1, 99, 2, 3, 4, 5, 6, 7]


## remoção

| operação                | complexidade | motivo                                          |
| ----------------------- | ------------ | ----------------------------------------------- |
| `pop()` — do final      | O(1)         | não precisa deslocar nada                       |
| `pop(i)` — do meio      | O(n)         | precisa deslocar todos os elementos após `i`    |
| `pop(0)` — do início    | O(n)         | precisa deslocar todos os elementos             |
| `remove(x)` — por valor | O(n)         | precisa buscar o elemento primeiro              |

In [12]:
nums = [0, 1, 2, 3, 4, 5]

# pop() — remove e retorna o último elemento — O(1)
ultimo = nums.pop()
print(f"pop() retornou {ultimo}, lista agora: {nums}")

# pop(i) — remove e retorna elemento na posição i — O(n)
segundo = nums.pop(1)
print(f"pop(1) retornou {segundo}, lista agora: {nums}")

# remove(x) — remove primeira ocorrência do valor x — O(n)
nums.remove(3)
print(f"após remove(3): {nums}")

# del — remove por índice ou slice
del nums[0]
print(f"após del nums[0]: {nums}")

pop() retornou 5, lista agora: [0, 1, 2, 3, 4]
pop(1) retornou 1, lista agora: [0, 2, 3, 4]
após remove(3): [0, 2, 4]
após del nums[0]: [2, 4]


## busca

| operação                | complexidade | motivo                                          |
| ----------------------- | ------------ | ----------------------------------------------- |
| `x in lista`            | O(n)         | busca linear, precisa verificar cada elemento   |
| `lista.index(x)`        | O(n)         | busca linear até encontrar                      |
| `lista.count(x)`        | O(n)         | precisa verificar todos os elementos            |

In [13]:
nums = [1, 2, 3, 2, 4, 2, 5]

# verificar se elemento existe — O(n)
print(f"3 in nums: {3 in nums}")
print(f"99 in nums: {99 in nums}")

# encontrar índice de um elemento — O(n)
print(f"nums.index(4) = {nums.index(4)}")

# contar ocorrências — O(n)
print(f"nums.count(2) = {nums.count(2)}")

3 in nums: True
99 in nums: False
nums.index(4) = 4
nums.count(2) = 3


# padrões comuns com arrays

## two pointers

técnica que usa dois índices para percorrer o array, geralmente um do início e outro do fim.  
útil para problemas de busca em arrays ordenados.

In [14]:
# exemplo: verificar se array é palíndromo
def eh_palindromo(arr: list[int]) -> bool:
    esquerda = 0
    direita = len(arr) - 1

    while esquerda < direita:
        if arr[esquerda] != arr[direita]:
            return False

        esquerda += 1
        direita -= 1

    return True


print(f"[1, 2, 3, 2, 1] é palíndromo? {eh_palindromo([1, 2, 3, 2, 1])}")
print(f"[1, 2, 3, 4, 5] é palíndromo? {eh_palindromo([1, 2, 3, 4, 5])}")

[1, 2, 3, 2, 1] é palíndromo? True
[1, 2, 3, 4, 5] é palíndromo? False


## sliding window

técnica que mantém uma "janela" de tamanho fixo ou variável que desliza pelo array.  
útil para problemas de subarray, substring, etc.

In [15]:
# exemplo: soma máxima de subarray de tamanho k
def max_soma_subarray(arr: list[int], k: int) -> int:
    if len(arr) < k:
        return 0

    # soma da primeira janela
    soma_janela = sum(arr[:k])
    max_soma = soma_janela

    # desliza a janela
    for i in range(k, len(arr)):
        # remove elemento que saiu, adiciona elemento que entrou
        soma_janela = soma_janela - arr[i - k] + arr[i]
        max_soma = max(max_soma, soma_janela)

    return max_soma


nums = [2, 1, 5, 1, 3, 2]

print(f"array: {nums}")
print(f"maior soma de subarray de tamanho 3: {max_soma_subarray(nums, 3)}")

array: [2, 1, 5, 1, 3, 2]
maior soma de subarray de tamanho 3: 9


# resumo de complexidade

| operação           | complexidade | notas                              |
| ------------------ | ------------ | ---------------------------------- |
| acesso `arr[i]`    | O(1)         | direto por índice                  |
| busca `x in arr`   | O(n)         | busca linear                       |
| append             | O(1)*        | amortizado                         |
| insert no início   | O(n)         | desloca todos                      |
| insert no meio     | O(n)         | desloca elementos após             |
| pop do final       | O(1)         | não desloca                        |
| pop do início/meio | O(n)         | desloca elementos                  |
| slice              | O(k)         | k = tamanho do slice               |
| sort               | O(n log n)   | timsort no python                  |
| reverse            | O(n)         | precisa percorrer tudo             |

\* amortizado: na média é O(1), mas ocasionalmente O(n) quando precisa realocar