# Conversor de Arquivos TXT para CSV

Este notebook converte todos os arquivos .txt do diret√≥rio `raw_data` para o formato .csv no diret√≥rio `converted_csv_data`.

Os arquivos cont√™m dados de vento com colunas separadas por ponto e v√≠rgula (;) que ser√£o convertidas para o formato CSV padr√£o com v√≠rgulas.

## Arquivos a serem convertidos:
- Dir.txt (Dire√ß√£o do vento)
- U.txt (Componente U do vento)
- V.txt (Componente V do vento) 
- W.txt (Componente W do vento)
- WS.txt (Velocidade do vento)

#### 1. Importa as libs.

In [None]:
import pandas as pd
import os
from pathlib import Path
import glob

Bibliotecas importadas com sucesso!


#### 2. Configura o caminho dos diret√≥rios

In [None]:
# Definir diret√≥rios
raw_data_dir = Path("../raw_data")
csv_data_dir = Path("../converted_csv_data")

# Verificar se o diret√≥rio de origem existe
if raw_data_dir.exists():
    print(f"‚úì Diret√≥rio {raw_data_dir} encontrado")
else:
    print(f"‚úó Diret√≥rio {raw_data_dir} n√£o encontrado")

Diret√≥rio de origem: ../raw_data
Diret√≥rio de destino: ../converted_csv_data
‚úì Diret√≥rio ../raw_data encontrado


#### 3. Cria um caminho de output

In [10]:
# Criar diret√≥rio de destino se n√£o existir
csv_data_dir.mkdir(exist_ok=True)

if csv_data_dir.exists():
    print(f"‚úì Diret√≥rio {csv_data_dir} criado/encontrado com sucesso")
else:
    print(f"‚úó Erro ao criar diret√≥rio {csv_data_dir}")

# Listar conte√∫do atual do diret√≥rio de destino
print(f"\nConte√∫do atual do diret√≥rio {csv_data_dir}:")
csv_files = list(csv_data_dir.glob("*.csv"))
if csv_files:
    for file in csv_files:
        print(f"  - {file.name}")
else:
    print("  (vazio)")

‚úì Diret√≥rio ../converted_csv_data criado/encontrado com sucesso

Conte√∫do atual do diret√≥rio ../converted_csv_data:
  (vazio)


#### 4. Fun√ß√£o de convers√£o de arquivos

In [11]:
def convert_txt_to_csv(txt_file_path, csv_file_path):
    """
    Converte um arquivo TXT com delimitador ';' para CSV com delimitador ','
    
    Args:
        txt_file_path (Path): Caminho para o arquivo TXT de origem
        csv_file_path (Path): Caminho para o arquivo CSV de destino
    
    Returns:
        bool: True se a convers√£o foi bem-sucedida, False caso contr√°rio
    """
    try:
        # Ler o arquivo TXT com delimitador ';'
        df = pd.read_csv(txt_file_path, sep=';', encoding='utf-8')
        
        # Salvar como CSV com delimitador ','
        df.to_csv(csv_file_path, index=False, encoding='utf-8')
        
        print(f"‚úì {txt_file_path.name} ‚Üí {csv_file_path.name}")
        return True
        
    except Exception as e:
        print(f"‚úó Erro ao converter {txt_file_path.name}: {str(e)}")
        return False

print("Fun√ß√£o de convers√£o definida com sucesso!")

Fun√ß√£o de convers√£o definida com sucesso!


#### 5. Pega todos o .txt

In [None]:
# Encontrar todos os arquivos .txt no diret√≥rio raw_data
txt_files = list(raw_data_dir.glob("*.txt"))

print(f"Arquivos TXT encontrados ({len(txt_files)}):")
for txt_file in txt_files:
    print(f"  - {txt_file.name}")

if not txt_files:
    print("Nenhum arquivo .txt encontrado no diret√≥rio raw_data")

Arquivos TXT encontrados (5):
  - V.txt
  - W.txt
  - WS.txt
  - U.txt
  - Dir.txt


#### 6. Converte cada .txt em um .csv correspondente

In [None]:
# Converter cada arquivo TXT para CSV
successful_conversions = 0
failed_conversions = 0

print("Iniciando convers√£o dos arquivos...\n")

for txt_file in txt_files:
    # Criar o nome do arquivo CSV correspondente
    csv_file_name = txt_file.stem + ".csv"
    csv_file_path = csv_data_dir / csv_file_name
    
    # Converter arquivo
    if convert_txt_to_csv(txt_file, csv_file_path):
        successful_conversions += 1
    else:
        failed_conversions += 1

print(f"\n--- Resumo da Convers√£o ---")
print(f"‚úì Convers√µes bem-sucedidas: {successful_conversions}")
print(f"‚úó Convers√µes com erro: {failed_conversions}")
print(f"Total de arquivos processados: {len(txt_files)}")

Iniciando convers√£o dos arquivos...



‚úì V.txt ‚Üí V.csv
‚úì W.txt ‚Üí W.csv
‚úì WS.txt ‚Üí WS.csv
‚úì U.txt ‚Üí U.csv
‚úì Dir.txt ‚Üí Dir.csv

--- Resumo da Convers√£o ---
‚úì Convers√µes bem-sucedidas: 5
‚úó Convers√µes com erro: 0
üìä Total de arquivos processados: 5


#### 7. verifica√ß√£o dos resultados

In [None]:
# Verificar arquivos CSV criados
csv_files = list(csv_data_dir.glob("*.csv"))

print("=== VERIFICA√á√ÉO DOS RESULTADOS ===\n")

print(f"Arquivos CSV criados ({len(csv_files)}):")
for csv_file in csv_files:
    file_size = csv_file.stat().st_size
    print(f"  - {csv_file.name} ({file_size:,} bytes)")

print(f"\n--- Compara√ß√£o de Estrutura ---")

# Verificar estrutura de um arquivo como exemplo
if csv_files:
    example_csv = csv_files[0]
    print(f"\nExemplo: {example_csv.name}")
    
    # Carregar e mostrar informa√ß√µes b√°sicas
    df_csv = pd.read_csv(example_csv)
    print(f"  Dimens√µes: {df_csv.shape[0]} linhas √ó {df_csv.shape[1]} colunas")
    print(f"  Colunas: {list(df_csv.columns)[:5]}..." if len(df_csv.columns) > 5 else f"  Colunas: {list(df_csv.columns)}")
    
    # Mostrar primeiras linhas
    print(f"\n  Primeiras 3 linhas:")
    print(df_csv.head(3).to_string(index=False))

print(f"\nConvers√£o conclu√≠da! Todos os arquivos est√£o dispon√≠veis em: {csv_data_dir}")

=== VERIFICA√á√ÉO DOS RESULTADOS ===

Arquivos CSV criados (5):
  - U.csv (6,663,827 bytes)
  - Dir.csv (5,887,718 bytes)
  - WS.csv (5,819,775 bytes)
  - V.csv (6,380,526 bytes)
  - W.csv (6,027,870 bytes)

--- Compara√ß√£o de Estrutura ---

Exemplo: U.csv
  Dimens√µes: 41786 linhas √ó 27 colunas
  Colunas: ['DT', 'SODAR-30', 'SODAR-40', 'SODAR-50', 'SODAR-60']...

  Primeiras 3 linhas:
                 DT  SODAR-30  SODAR-40  SODAR-50  SODAR-60  SODAR-70  SODAR-80  SODAR-90  SODAR-100  SODAR-110  SODAR-120  SODAR-130  SODAR-140  SODAR-150  SODAR-160  SODAR-170  SODAR-180  SODAR-190  SODAR-200  SODAR-210  SODAR-220  SODAR-230  SODAR-240  SODAR-250  SODAR-260  SODAR-270  SODAR-280
2021/11/10 17:20:00     -1.16     -2.49     -2.81     -2.70     -2.95     -2.98     -3.11      -3.20      -3.20      -3.10      -2.97      -2.87      -2.80      -2.73      -2.80      -2.79      -2.76      -2.74      -2.74      -2.79      -2.74      -2.82      -2.92      -2.81      -2.74      -3.01
2021/11/10 