# üóÇÔ∏è SESI√ìN 1: HDFS OPERACIONES B√ÅSICAS
## Introducci√≥n a HDFS

### üéØ **OBJETIVO**
Aprender las operaciones b√°sicas de HDFS mediante ejemplos pr√°cticos

### üìã **CONTENIDO**
- Comandos b√°sicos de HDFS
- Gesti√≥n de archivos y directorios
- Verificaci√≥n de operaciones

In [None]:
# üîß CONFIGURACI√ìN INICIAL
import subprocess
import os
from hdfs import InsecureClient

# Conectar a HDFS
hdfs_client = InsecureClient('http://namenode:9870')

print("üîó Conexi√≥n HDFS establecida")
print(f"üìÅ Directorio ra√≠z: {hdfs_client.list('/')}")

print("‚úÖ Configuraci√≥n completada")

## üìù EJERCICIO 1: Comandos B√°sicos

Aprenderemos los comandos m√°s utilizados en HDFS

In [None]:
# 1.1 Listar directorio ra√≠z
print("üìÅ LISTANDO DIRECTORIO RA√çZ")
print("=======================")

try:
    root_contents = hdfs_client.list('/')
    print("Contenido del directorio ra√≠z:")
    for item in root_contents:
        print(f"  - {item}")
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Listado completado")

In [None]:
# 1.2 Crear directorio de trabajo
print("üìÅ CREANDO DIRECTORIO DE TRABAJO")
print("===========================")

try:
    # Crear directorio de pr√°ctica
    practice_dir = '/practica_hdfs'
    hdfs_client.makedirs(practice_dir)
    print(f"‚úÖ Directorio {practice_dir} creado")
    
    # Crear subdirectorios
    subdirs = ['/datos', '/resultados', '/backup']
    for subdir in subdirs:
        full_path = f"{practice_dir}{subdir}"
        hdfs_client.makedirs(full_path)
        print(f"‚úÖ Subdirectorio {full_path} creado")
        
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Estructura de directorios creada")

## üìù EJERCICIO 2: Gesti√≥n de Archivos

Aprenderemos a subir, verificar y manipular archivos en HDFS

In [None]:
# 2.1 Crear y subir archivo de ejemplo
print("üìÑ CREANDO Y SUBIENDO ARCHIVO")
print("=========================")

try:
    # Crear archivo local de ejemplo
    local_file = 'ejemplo.txt'
    with open(local_file, 'w') as f:
        f.write('Este es un archivo de ejemplo para HDFS\n')
        f.write('Contiene m√∫ltiples l√≠neas\n')
        f.write('Para probar operaciones b√°sicas')
    
    # Subir archivo a HDFS
    hdfs_path = f'{practice_dir}/datos/{local_file}'
    hdfs_client.upload(hdfs_path, local_file)
    print(f"‚úÖ Archivo subido a {hdfs_path}")
    
    # Verificar archivo
    file_status = hdfs_client.status(hdfs_path)
    print(f"üìä Tama√±o del archivo: {file_status['length']} bytes")
    
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Operaci√≥n completada")

In [None]:
# 2.2 Leer contenido del archivo
print("üìñ LEYENDO CONTENIDO DEL ARCHIVO")
print("============================")

try:
    with hdfs_client.read(hdfs_path) as reader:
        content = reader.read().decode('utf-8')
        print("Contenido del archivo:")
        print("-------------------")
        print(content)
        
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Lectura completada")

## üìù EJERCICIO 3: Verificaci√≥n y Limpieza

Aprenderemos a verificar operaciones y limpiar recursos

In [None]:
# 3.1 Verificar espacio y estado
print("üìä VERIFICANDO ESPACIO Y ESTADO")
print("===========================")

try:
    # Obtener estado del cluster
    result = subprocess.run(['hdfs', 'dfsadmin', '-report'], 
                          capture_output=True, text=True)
    
    if result.returncode == 0:
        print("Estado del cluster:")
        print(result.stdout)
    else:
        print(f"‚ùå Error: {result.stderr}")
        
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Verificaci√≥n completada")

In [None]:
# 3.2 Limpiar recursos
print("üßπ LIMPIANDO RECURSOS")
print("===================")

try:
    # Eliminar archivo local
    if os.path.exists(local_file):
        os.remove(local_file)
        print(f"‚úÖ Archivo local {local_file} eliminado")
    
    # Eliminar directorio de pr√°ctica
    hdfs_client.delete(practice_dir, recursive=True)
    print(f"‚úÖ Directorio {practice_dir} eliminado de HDFS")
    
except Exception as e:
    print(f"‚ùå Error: {e}")

print("\n‚úÖ Limpieza completada")