# 🗂️ SESIÓN 1: HDFS OPERACIONES BÁSICAS
## Introducción a HDFS

### 🎯 **OBJETIVO**
Aprender las operaciones básicas de HDFS mediante ejemplos prácticos

### 📋 **CONTENIDO**
- Comandos básicos de HDFS
- Gestión de archivos y directorios
- Verificación de operaciones

In [None]:
# 🔧 CONFIGURACIÓN INICIAL
import subprocess
import os
from hdfs import InsecureClient

# Conectar a HDFS
hdfs_client = InsecureClient('http://namenode:9870')

print("🔗 Conexión HDFS establecida")
print(f"📁 Directorio raíz: {hdfs_client.list('/')}")

print("✅ Configuración completada")

## 📝 EJERCICIO 1: Comandos Básicos

Aprenderemos los comandos más utilizados en HDFS

In [None]:
# 1.1 Listar directorio raíz
print("📁 LISTANDO DIRECTORIO RAÍZ")
print("=======================")

try:
    root_contents = hdfs_client.list('/')
    print("Contenido del directorio raíz:")
    for item in root_contents:
        print(f"  - {item}")
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Listado completado")

In [None]:
# 1.2 Crear directorio de trabajo
print("📁 CREANDO DIRECTORIO DE TRABAJO")
print("===========================")

try:
    # Crear directorio de práctica
    practice_dir = '/practica_hdfs'
    hdfs_client.makedirs(practice_dir)
    print(f"✅ Directorio {practice_dir} creado")
    
    # Crear subdirectorios
    subdirs = ['/datos', '/resultados', '/backup']
    for subdir in subdirs:
        full_path = f"{practice_dir}{subdir}"
        hdfs_client.makedirs(full_path)
        print(f"✅ Subdirectorio {full_path} creado")
        
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Estructura de directorios creada")

## 📝 EJERCICIO 2: Gestión de Archivos

Aprenderemos a subir, verificar y manipular archivos en HDFS

In [None]:
# 2.1 Crear y subir archivo de ejemplo
print("📄 CREANDO Y SUBIENDO ARCHIVO")
print("=========================")

try:
    # Crear archivo local de ejemplo
    local_file = 'ejemplo.txt'
    with open(local_file, 'w') as f:
        f.write('Este es un archivo de ejemplo para HDFS\n')
        f.write('Contiene múltiples líneas\n')
        f.write('Para probar operaciones básicas')
    
    # Subir archivo a HDFS
    hdfs_path = f'{practice_dir}/datos/{local_file}'
    hdfs_client.upload(hdfs_path, local_file)
    print(f"✅ Archivo subido a {hdfs_path}")
    
    # Verificar archivo
    file_status = hdfs_client.status(hdfs_path)
    print(f"📊 Tamaño del archivo: {file_status['length']} bytes")
    
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Operación completada")

In [None]:
# 2.2 Leer contenido del archivo
print("📖 LEYENDO CONTENIDO DEL ARCHIVO")
print("============================")

try:
    with hdfs_client.read(hdfs_path) as reader:
        content = reader.read().decode('utf-8')
        print("Contenido del archivo:")
        print("-------------------")
        print(content)
        
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Lectura completada")

## 📝 EJERCICIO 3: Verificación y Limpieza

Aprenderemos a verificar operaciones y limpiar recursos

In [None]:
# 3.1 Verificar espacio y estado
print("📊 VERIFICANDO ESPACIO Y ESTADO")
print("===========================")

try:
    # Obtener estado del cluster
    result = subprocess.run(['hdfs', 'dfsadmin', '-report'], 
                          capture_output=True, text=True)
    
    if result.returncode == 0:
        print("Estado del cluster:")
        print(result.stdout)
    else:
        print(f"❌ Error: {result.stderr}")
        
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Verificación completada")

In [None]:
# 3.2 Limpiar recursos
print("🧹 LIMPIANDO RECURSOS")
print("===================")

try:
    # Eliminar archivo local
    if os.path.exists(local_file):
        os.remove(local_file)
        print(f"✅ Archivo local {local_file} eliminado")
    
    # Eliminar directorio de práctica
    hdfs_client.delete(practice_dir, recursive=True)
    print(f"✅ Directorio {practice_dir} eliminado de HDFS")
    
except Exception as e:
    print(f"❌ Error: {e}")

print("\n✅ Limpieza completada")