# 🐍 Python | Rename structured & unstructured data automatically 🧠📁🎥🎵

## Are your folders full of random files like `sample_1.txt`, `img4.jpg`, `audio123.mp3`?  
🙃 What if you could rename structured and unstructured data — all at once?

## 👉 Solution  
Use `os` to scan a folder and rename **any file type**, applying a consistent, date-based pattern.

## 🔧 How it works  
📁 Python creates a folder and generates mock files:  
- Structured data → `.txt`, `.json`, `.log`  
- Unstructured data → `.jpg`, `.mp3`, `.mp4`  
🧠 It prints original names, then renames each file like:  
`project_2025_04_09_001.json`, `project_2025_04_09_002.mp4`, ...

## 🔎 Why it matters  
When handling mixed formats — datasets, logs, media —  
**consistent file naming** improves automation, reproducibility, and teamwork.

## ✨ Real-world example  
📂 A project folder contains:  
- `sample_1.txt`, `sample_4.json`, `sample_6.mp3`  
🤖 The script renames them to:  
- `project_2025_04_09_001.txt`, `project_2025_04_09_002.json`, `project_2025_04_09_003.mp3`

## ⚙️ Business Impact  
✅ Less manual renaming  
✅ More structured file systems  
✅ Fewer naming mistakes  
✅ Stronger, scalable pipelines

## 📊 What the code does  
🧪 1️⃣ Creates a dated folder  
🧪 2️⃣ Generates structured and unstructured mock files  
🧪 3️⃣ Prints the original filenames  
🧪 4️⃣ Renames everything automatically

🔗 [GitHub](https://github.com/jcombari/AI-For-Unstructured-Data/tree/main)

💭 Reflection  
How do you handle files in mixed-format projects?  
How much time would automation save your team?

🔑 #Python #Automation #StructuredData #UnstructuredData #DataScience #MachineLearning #AIForGood #OrganizedData #ProductivityTools #GenerativeAI #CloudSkills #FileNaming #JupyterNotebook

---

# 🐍 Python | Renombrar datos estructurados y no estructurados automáticamente 🧠📁🎥🎵

## ¿Tienes carpetas con archivos como `sample_1.txt`, `img4.jpg`, `audio123.mp3`?  
🙃 ¿Y si pudieras renombrar datos estructurados y no estructurados en un solo paso?

## 👉 Solución  
Usa `os` para escanear una carpeta y renombrar cualquier tipo de archivo con un patrón consistente basado en la fecha.

## 🔧 ¿Cómo funciona?  
📁 Python crea una carpeta y genera archivos ficticios:  
- Datos estructurados → `.txt`, `.json`, `.log`  
- Datos no estructurados → `.jpg`, `.mp3`, `.mp4`  
🧠 Muestra los nombres originales y luego los renombra así:  
`project_2025_04_09_001.json`, `project_2025_04_09_002.mp4`, ...

## 🔎 ¿Por qué importa?  
Al trabajar con formatos mixtos — datasets, logs, medios —  
tener nombres **consistentes** mejora la automatización, trazabilidad y colaboración.

## ✨ Ejemplo real  
📂 Una carpeta de proyecto contiene:  
- `sample_1.txt`, `sample_4.json`, `sample_6.mp3`  
🤖 El script los transforma en:  
- `project_2025_04_09_001.txt`, `project_2025_04_09_002.json`, `project_2025_04_09_003.mp3`

## ⚙️ Impacto en el negocio  
✅ Menos trabajo manual  
✅ Archivos más organizados  
✅ Menos errores en nombres  
✅ Pipelines más sólidos y escalables

## 📊 ¿Qué hace el código?  
🧪 1️⃣ Crea una carpeta con la fecha  
🧪 2️⃣ Genera archivos ficticios estructurados y no estructurados  
🧪 3️⃣ Muestra los nombres originales  
🧪 4️⃣ Renombra automáticamente todo

🔗 [GitHub](https://github.com/jcombari/AI-For-Unstructured-Data/tree/main)

💭 Reflexión  
¿Cómo manejas archivos mixtos en tus proyectos?  
¿Cuánto tiempo ahorraría la automatización a tu equipo?

🔑 #Python #Automatización #DatosEstructurados #DatosNoEstructurados #CienciaDeDatos #MachineLearning #AIForGood #Productividad #Organización #JupyterNotebook #NombresDeArchivo #GenerativeAI

![image.png](attachment:7e0f6242-6987-42cd-a777-1ff0df9344b3.png)

In [1]:
import os
from datetime import datetime

# Paso 1: Crear la carpeta con la fecha
today = datetime.now().strftime("%Y%m%d")
folder_name = f"{today}_Rename multiple files automatically"
os.makedirs(folder_name, exist_ok=True)

# Paso 2: Crear archivos dummy de distintos tipos
file_types = {
    '.txt': "Este es un archivo de texto de ejemplo.",
    '.log': "2025-04-09 12:00:00 [INFO] Este es un log de ejemplo.",
    '.json': '{"mensaje": "archivo JSON de ejemplo"}',
    '.jpg': b'\xff\xd8\xff\xe0' + b'0' * 100,  # encabezado JPEG falso
    '.mp3': b'ID3' + b'0' * 100,               # encabezado MP3 falso
    '.mp4': b'\x00\x00\x00\x18ftypmp42' + b'0' * 100  # encabezado MP4 falso
}

# Crear archivos en la carpeta
for i, (ext, content) in enumerate(file_types.items(), start=1):
    file_name = f"sample_{i}{ext}"
    file_path = os.path.join(folder_name, file_name)
    mode = 'wb' if isinstance(content, bytes) else 'w'
    with open(file_path, mode) as f:
        f.write(content)

# Mostrar archivos originales
print("📂 Archivos originales:")
original_files = sorted(os.listdir(folder_name))
for f in original_files:
    print(f" - {f}")

# Paso 3: Renombrar archivos
rename_date = datetime.now().strftime("%Y_%m_%d")
renamed_files = []

for index, filename in enumerate(original_files, start=1):
    old_path = os.path.join(folder_name, filename)
    _, ext = os.path.splitext(filename)
    new_filename = f"project_{rename_date}_{index:03d}{ext}"
    new_path = os.path.join(folder_name, new_filename)
    os.rename(old_path, new_path)
    renamed_files.append(new_filename)

# Mostrar archivos renombrados
print("\n✅ Archivos renombrados:")
for f in renamed_files:
    print(f" - {f}")


📂 Archivos originales:
 - sample_1.txt
 - sample_2.log
 - sample_3.json
 - sample_4.jpg
 - sample_5.mp3
 - sample_6.mp4

✅ Archivos renombrados:
 - project_2025_04_09_001.txt
 - project_2025_04_09_002.log
 - project_2025_04_09_003.json
 - project_2025_04_09_004.jpg
 - project_2025_04_09_005.mp3
 - project_2025_04_09_006.mp4
