# Manipulação de Tipos de Dados Complexos no Apache Spark

O Apache Spark oferece uma variedade de funções para manipular tipos de dados complexos, como arrays, mapas e estruturas, em DataFrames. Essas funções são úteis para realizar operações de consulta, transformações e exploração de dados estruturados.

## Funções de Manipulação de Arrays

As funções a seguir são usadas para manipular arrays em DataFrames:

| Função                       | Descrição                                                   | Exemplo de Caso de Uso                   |
|------------------------------|-------------------------------------------------------------|-----------------------------------------|
| `array(col1, col2, ...)`     | Cria um array a partir de colunas específicas              | Unir colunas em um array.               |
| `size(col)`                  | Retorna o tamanho de um array                               | Contar o número de elementos em um array. |
| `array_contains(col, value)` | Verifica se um array contém um valor específico            | Filtrar registros que contenham um valor. |
| `explode(col)`               | Gera uma nova linha para cada elemento em um array          | Expandir arrays em múltiplas linhas.     |
| `concat_ws(sep, col1, col2, ...)` | Concatena elementos de um array com um separador     | Unir elementos de um array em uma string. |
| `collect_list(col)`          | Coleta elementos de uma coluna em uma lista                | Agregar dados em uma lista.             |
| `collect_set(col)`           | Coleta elementos únicos de uma coluna em um conjunto      | Agregar dados em um conjunto único.     |

## Funções de Manipulação de Mapas

As funções a seguir são usadas para manipular mapas em DataFrames:

| Função                       | Descrição                                                   | Exemplo de Caso de Uso                   |
|------------------------------|-------------------------------------------------------------|-----------------------------------------|
| `map(col1, col2, ...)`       | Cria um mapa a partir de pares chave-valor                    | Combinar várias colunas em um mapa.      |
| `map_keys(col)`              | Retorna as chaves de um mapa                                 | Extrair as chaves de um mapa.             |
| `map_values(col)`            | Retorna os valores de um mapa                                | Extrair os valores de um mapa.           |
| `map_concat(col1, col2)`     | Concatena dois mapas em um novo mapa                         | Combinar dois mapas em um único mapa.    |
| `map_from_arrays(keys, values)` | Cria um mapa a partir de dois arrays                   | Construir um mapa a partir de colunas separadas. |
| `map_from_entries(col)`       | Cria um mapa a partir de entradas (chave, valor)           | Construir um mapa a partir de colunas de chave e valor. |

## Funções de Manipulação de Estruturas

As funções a seguir são usadas para manipular estruturas em DataFrames:

| Função                           | Descrição                                                 | Exemplo de Caso de Uso                         |
|----------------------------------|-----------------------------------------------------------|-----------------------------------------------|
| `struct(col1, col2, ...)`        | Cria uma estrutura a partir de colunas específicas       | Combinar várias colunas em uma estrutura.      |
| `struct_fields(col)`             | Retorna os campos de uma estrutura                        | Extrair os campos de uma estrutura.             |
| `named_struct(fields)`           | Cria uma estrutura nomeada com campos especificados      | Criar uma estrutura com campos nomeados.        |
| `getField(col, fieldName)`       | Retorna o valor de um campo em uma estrutura              | Acessar valores de campos em uma estrutura.     |
