<a href="https://colab.research.google.com/github/jana-nf/Empacotamento_CODE_Reutil_R/blob/main/Empacotamento_CODE_Reutil_R.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Básico do Reuso de Código R no Colab

### O método mais simples é carregar suas funções em uma única célula e depois usá-las em outras células, simulando o carregamento de um pacote.

### Definir as Funções Reutilizáveis

Em uma célula de código, definir todas as funções que você deseja "empacotar".

No nosso exemplo, teremos funções para Análise Básica de Dados.

In [54]:
# Funções reutilizáveis para análise de dados

# 1. Função para carregar dados (simulando importação de CSV)
carregar_dados_simulados <- function() {
  # Cria um data frame (tabela) simples
  dados <- data.frame(
    id = 1:5,
    valor = c(10, 25, 30, 15, 20),
    categoria = c("A", "B", "A", "C", "B")
  )
  return(dados)
}

# 2. Função para calcular a média de uma coluna
calcular_media_coluna <- function(df, nome_coluna) {
  # Verifica se a coluna existe
  if (!nome_coluna %in% names(df)) {
    stop(paste("A coluna", nome_coluna, "não existe no data frame."))
  }

  # Calcula a média da coluna
  media <- mean(df[[nome_coluna]], na.rm = TRUE)
  return(media)
}

# Ao rodar esta célula, ambas as funções ficam disponíveis na memória.

### Usar e Reutilizar o "Pacote"

Em células de código separadas, usar suas funções, tratando a célula anterior como se fosse o comando library(seu_pacote).

### Carregar Dados

In [55]:
# 1. Carregar os dados usando a função "empacotada"
meu_dataset <- carregar_dados_simulados()

cat("Dados carregados com sucesso:\n")
print(meu_dataset)

Dados carregados com sucesso:
  id valor categoria
1  1    10         A
2  2    25         B
3  3    30         A
4  4    15         C
5  5    20         B


### Calcular a Média

In [56]:
# 2. Reutilizar a função de cálculo para a coluna 'valor'
media_do_valor <- calcular_media_coluna(meu_dataset, "valor")

cat("\nA média dos valores é:", media_do_valor, "\n")

# 3. Teste de erro da função
cat("\nTentando calcular a média de uma coluna inexistente (erro esperado):\n")
tryCatch({
  calcular_media_coluna(meu_dataset, "peso")
}, error = function(e) {
  cat("ERRO CAPTURADO:", conditionMessage(e), "\n")
})


A média dos valores é: 20 

Tentando calcular a média de uma coluna inexistente (erro esperado):
ERRO CAPTURADO: A coluna peso não existe no data frame. 


### Simular a organização em arquivos separados é o que realmente diferencia o código modularizado (o "pacote") de um simples script.

Como o Colab R não usa um sistema de arquivos RStudio tradicional, usaremos os comandos de shell do Linux para criar os arquivos e a função source() do R para carregá-los, simulando a estrutura de um pacote.

### Simulação de Empacotamento Avançado (Módulos em Arquivos)

Vamos simular um pacote chamado meu_kit_analise com dois arquivos principais:

- dados.R: Funções relacionadas ao carregamento e limpeza de dados.

- calculos.R: Funções relacionadas a cálculos estatísticos.

### Criar e Popular Arquivos

Execute a célula abaixo. Ela usa comandos do shell (!) para escrever suas funções em arquivos separados, simulando um projeto de código estruturado.

In [58]:
# 1. CRIAR OS ARQUIVOS .R NO AMBIENTE DO COLAB

# Conteúdo do arquivo 'dados.R'
writeLines(
  c(
    '# Arquivo: dados.R',
    '# Contém funções para carregamento e tratamento de dados.',
    '',
    'carregar_dados_simulados <- function() {',
    '  # Cria um data frame (tibble) para simular dados de vendas',
    '  dados <- data.frame(',
    '    id = 1:6,',
    '    venda = c(100, 250, 300, 150, 200, 120),',
    '    regiao = c("Norte", "Sul", "Norte", "Leste", "Oeste", "Sul")',
    '  )',
    '  return(dados)',
    '}',
    '',
    'limpar_dados_para_analise <- function(df) {',
    '  # Simula uma limpeza básica, garantindo que a coluna "venda" seja numérica',
    '  df$venda <- as.numeric(df$venda)',
    '  return(df)',
    '}'
  ),
  con = "dados.R"
)

# Conteúdo do arquivo 'calculos.R'
writeLines(
  c(
    '# Arquivo: calculos.R',
    '# Contém funções para análises estatísticas.',
    '',
    'calcular_media_coluna <- function(df, nome_coluna) {',
    '  if (!nome_coluna %in% names(df)) {',
    '    stop(paste("A coluna", nome_coluna, "não existe no data frame."))',
    '  }',
    '  media <- mean(df[[nome_coluna]], na.rm = TRUE)',
    '  return(media)',
    '}',
    '',
    'calcular_total_registros <- function(df) {',
    '  return(nrow(df))',
    '}'
  ),
  con = "calculos.R"
)

cat("Arquivos 'dados.R' e 'calculos.R' criados com sucesso no ambiente Colab.\n")
# Você pode verificar os arquivos na aba de Arquivos à esquerda.

Arquivos 'dados.R' e 'calculos.R' criados com sucesso no ambiente Colab.


### Simular o Carregamento do Pacote (source())

Em vez de executar uma célula gigante de funções, você usa a função source() para carregar as funções de cada arquivo modularizado na sua sessão R.

In [59]:
# 2. CARREGAR OS MÓDULOS NA SESSÃO R
# Isso simula o comando 'library(seu_pacote)'
cat("Carregando módulo de dados...\n")
source("dados.R")

cat("Carregando módulo de cálculos...\n")
source("calculos.R")

cat("Todas as funções agora estão disponíveis para uso!\n")

Carregando módulo de dados...
Carregando módulo de cálculos...
Todas as funções agora estão disponíveis para uso!


### Usar as Funções do "Pacote"

Agora, você pode usar as funções de diferentes arquivos (módulos) no seu fluxo de trabalho, provando que o código é reutilizável e organizado.

In [60]:
# 3. FLUXO DE TRABALHO USANDO O "PACOTE" MODULARIZADO

# 1. Usar função do módulo 'dados.R'
dados_brutos <- carregar_dados_simulados()

# 2. Usar função do módulo 'dados.R' para limpeza
dados_limpos <- limpar_dados_para_analise(dados_brutos)

# 3. Usar função do módulo 'calculos.R'
total_registros <- calcular_total_registros(dados_limpos)

# 4. Usar função do módulo 'calculos.R'
media_vendas <- calcular_media_coluna(dados_limpos, "venda")

cat("--- Resultados da Análise ---\n")
cat("Total de Registros Processados:", total_registros, "\n")
cat("Média de Vendas:", media_vendas, "\n")
print(head(dados_limpos))

--- Resultados da Análise ---
Total de Registros Processados: 6 
Média de Vendas: 186.6667 
  id venda regiao
1  1   100  Norte
2  2   250    Sul
3  3   300  Norte
4  4   150  Leste
5  5   200  Oeste
6  6   120    Sul


### Agrupar funções por namespace (espaço de nomes) é o que faz o código parecer e funcionar mais como um pacote R oficial.

### Usar um recurso do R chamado listas nomeadas para simular esse namespace.

### Simulação de Namespace (Empacotamento Avançado com Listas)

Vamos simular o pacote **meu_kit_analise** onde todas as funções estão aninhadas dentro desse nome.

### Reestruturar as Funções

Em vez de definir as funções diretamente, vamos agrupá-las em um objeto de lista chamado **meu_kit_analise**.

In [61]:
# 1. DEFINIR O NAMESPACE DO PACOTE

# Cria um objeto de lista que servirá como nosso "pacote" ou namespace
meu_kit_analise <- list(

  # --- Funções do módulo de Dados ---

  #' Carrega um conjunto de dados simulado.
  carregar_dados_simulados = function() {
    dados <- data.frame(
      id = 1:6,
      venda = c(100, 250, 300, 150, 200, 120),
      regiao = c("Norte", "Sul", "Norte", "Leste", "Oeste", "Sul")
    )
    return(dados)
  },

  #' Limpa dados para análise.
  limpar_dados_para_analise = function(df) {
    df$venda <- as.numeric(df$venda)
    return(df)
  },

  # --- Funções do módulo de Cálculos ---

  #' Calcula a média de uma coluna.
  calcular_media_coluna = function(df, nome_coluna) {
    if (!nome_coluna %in% names(df)) {
      stop(paste("A coluna", nome_coluna, "não existe no data frame."))
    }
    media <- mean(df[[nome_coluna]], na.rm = TRUE)
    return(media)
  },

  #' Calcula o total de registros.
  calcular_total_registros = function(df) {
    return(nrow(df))
  }
)

cat("Namespace 'meu_kit_analise' criado com sucesso. O 'pacote' está pronto para ser usado.\n")

Namespace 'meu_kit_analise' criado com sucesso. O 'pacote' está pronto para ser usado.


### Usar as Funções com a Sintaxe de Namespace (::)

Agora, a chave para simular a sintaxe de pacote é usar o operador $ (que é o equivalente R ao operador de acesso :: para listas/namespaces) para chamar suas funções.

In [62]:
# 2. USAR AS FUNÇÕES COM SINTAXE DE NAMESPACE

# 1. Carregar dados (meu_kit_analise::carregar_dados_simulados)
dados_brutos <- meu_kit_analise$carregar_dados_simulados()

# 2. Limpar dados
dados_limpos <- meu_kit_analise$limpar_dados_para_analise(dados_brutos)

# 3. Calcular a média de vendas
media_final <- meu_kit_analise$calcular_media_coluna(dados_limpos, "venda")

# 4. Obter total de registros
total_final <- meu_kit_analise$calcular_total_registros(dados_limpos)

cat("--- Análise Final Usando Namespace ---\n")
cat("Média de Vendas (chamada via Namespace):", media_final, "\n")
cat("Total de Registros (chamada via Namespace):", total_final, "\n")

# Mostrando como chamar a função diretamente para comparação (se carregada)
# Note: No nosso caso, as funções só existem DENTRO da lista 'meu_kit_analise'
# Se você tentasse rodar carregar_dados_simulados(), o R daria erro: "could not find function"

--- Análise Final Usando Namespace ---
Média de Vendas (chamada via Namespace): 186.6667 
Total de Registros (chamada via Namespace): 6 


### Exemplo de Uso Sem Nome do Pacote (Simulando library())

Em um pacote R real, se você carregar o pacote com library(meu_kit_analise), você pode chamar as funções diretamente. Podemos simular isso extraindo as funções da lista para o ambiente global usando list2env().

In [64]:
# 3. SIMULAR O COMANDO library(meu_kit_analise)

# O comando list2env move todos os itens nomeados (nossas funções) da lista
# para o ambiente de trabalho global.
list2env(meu_kit_analise, .GlobalEnv)

cat("Simulação de library(meu_kit_analise) concluída. Funções disponíveis diretamente.\n")

# Agora as funções podem ser chamadas diretamente:
dados_teste_direto <- carregar_dados_simulados()
media_teste_direto <- calcular_media_coluna(dados_teste_direto, "venda")

cat("\n--- Uso Direto (Simulando library()) ---\n")
cat("Média de Vendas (chamada direta):", media_teste_direto, "\n")

<environment: R_GlobalEnv>

Simulação de library(meu_kit_analise) concluída. Funções disponíveis diretamente.

--- Uso Direto (Simulando library()) ---
Média de Vendas (chamada direta): 186.6667 


### Essa abordagem usando Listas Nomeadas é a maneira mais sofisticada de simular a organização e o comportamento de um pacote R (com controle de namespace) dentro do ambiente de um único notebook Google Colab.

A documentação é a espinha dorsal de qualquer pacote reutilizável. No R, a forma padrão e mais robusta de documentar funções é usando o formato roxygen2, que permite gerar arquivos de ajuda (.Rd) automaticamente.

Embora não geremos os arquivos .Rd no Colab, podemos escrever a documentação no formato roxygen2 diretamente nas nossas funções. Isso torna o código mais legível e padronizado para quando você decidir migrar para um ambiente RStudio.

Vamos reescrever a estrutura do nosso namespace meu_kit_analise com a documentação detalhada.

### Prática de Documentação Detalhada (Roxygen2)

A sintaxe principal é usar #' antes do código da função, seguida de tags especiais como @param, @return, e @examples.

1. Reestruturar Funções com Documentação Roxygen2

In [65]:
# 1. DEFINIR O NAMESPACE COM DOCUMENTAÇÃO ROXYGEN2

meu_kit_analise <- list(

  #' @title Carregar Dados Simulados
  #' @description Cria um data frame de exemplo para simular a leitura de dados de vendas.
  #'
  #' @return Um data frame (tabela) com as colunas 'id', 'venda' e 'regiao'.
  #' @examples
  #' dados <- meu_kit_analise$carregar_dados_simulados()
  #' head(dados)
  carregar_dados_simulados = function() {
    dados <- data.frame(
      id = 1:6,
      venda = c(100, 250, 300, 150, 200, 120),
      regiao = c("Norte", "Sul", "Norte", "Leste", "Oeste", "Sul")
    )
    return(dados)
  },

  #' @title Calcular a Média de uma Coluna
  #' @description Calcula a média aritmética de uma coluna numérica especificada
  #' no data frame.
  #'
  #' @param df O data frame contendo os dados.
  #' @param nome_coluna Uma string indicando o nome da coluna para cálculo.
  #' @return Um valor numérico representando a média. Retorna um erro se a coluna não existir.
  #' @examples
  #' df_exemplo <- meu_kit_analise$carregar_dados_simulados()
  #' media <- meu_kit_analise$calcular_media_coluna(df_exemplo, "venda")
  #' print(media)
  calcular_media_coluna = function(df, nome_coluna) {
    if (!nome_coluna %in% names(df)) {
      stop(paste("A coluna", nome_coluna, "não existe no data frame."))
    }
    media <- mean(df[[nome_coluna]], na.rm = TRUE)
    return(media)
  },

  #' @title Calcular o Total de Registros
  #' @description Simplesmente retorna o número total de linhas (registros)
  #' no data frame fornecido.
  #'
  #' @param df O data frame de entrada.
  #' @return Um número inteiro que representa o número de linhas (registros).
  #' @examples
  #' df_exemplo <- meu_kit_analise$carregar_dados_simulados()
  #' total <- meu_kit_analise$calcular_total_registros(df_exemplo)
  #' print(total)
  calcular_total_registros = function(df) {
    return(nrow(df))
  }
)

cat("Namespace 'meu_kit_analise' redefinido com documentação Roxygen2 detalhada.\n")

Namespace 'meu_kit_analise' redefinido com documentação Roxygen2 detalhada.


### 2. Acessar a Documentação no Colab

Embora não possamos gerar o arquivo de ajuda .Rd, a documentação Roxygen2 tem dois benefícios imediatos:


Legibilidade: Qualquer pessoa que leia seu código saberá instantaneamente o que a função faz.


Visualização (Truque no Colab): Você pode usar a função print() em uma função para ver a estrutura e, muitas vezes, as tags de documentação são incluídas na saída de forma estruturada.

In [66]:
# 2. VISUALIZAÇÃO DA DOCUMENTAÇÃO

cat("--- Documentação da função 'calcular_media_coluna' ---\n")

# No Colab R, isso imprime a estrutura da função (incluindo comentários)
# e ajuda a mostrar a assinatura e o corpo da função.
print(meu_kit_analise$calcular_media_coluna)

cat("\n--- Visualização da estrutura da função ---\n")
# O R exibe a estrutura da função, que é a parte mais importante da documentação
# para o usuário que busca saber quais argumentos passar.
print(args(meu_kit_analise$calcular_media_coluna))

--- Documentação da função 'calcular_media_coluna' ---
function (df, nome_coluna) 
{
    if (!nome_coluna %in% names(df)) {
        stop(paste("A coluna", nome_coluna, "não existe no data frame."))
    }
    media <- mean(df[[nome_coluna]], na.rm = TRUE)
    return(media)
}

--- Visualização da estrutura da função ---
function (df, nome_coluna) 
NULL


### Usar os Exemplos

A tag **@examples** é crucial, pois mostra ao usuário como rodar a função. Basta copiar e colar os exemplos para testar a funcionalidade.

In [67]:
# 3. TESTAR OS EXEMPLOS (DO @examples)

# Exemplo da função 'carregar_dados_simulados'
dados <- meu_kit_analise$carregar_dados_simulados()
cat("Exemplo 1: Dados Carregados\n")
print(head(dados))

# Exemplo da função 'calcular_media_coluna'
media <- meu_kit_analise$calcular_media_coluna(dados, "venda")
cat("\nExemplo 2: Média Calculada\n")
print(media)

Exemplo 1: Dados Carregados
  id venda regiao
1  1   100  Norte
2  2   250    Sul
3  3   300  Norte
4  4   150  Leste
5  5   200  Oeste
6  6   120    Sul

Exemplo 2: Média Calculada
[1] 186.6667


### Agora, o seu código reutilizável não só está organizado por namespace, mas também está totalmente documentado no formato padrão da comunidade R, facilitando a manutenção e a migração futura para um pacote formal.