# Tutorial Completo: Entornos Virtuales para Data Science

Este tutorial cubre todo lo que necesitas saber sobre entornos virtuales para proyectos de ciencia de datos, incluyendo instalaci√≥n y configuraci√≥n en Windows y macOS.

## √çndice
1. [¬øQu√© son los entornos virtuales?](#que-son)
2. [Tipos de entornos virtuales](#tipos)
3. [venv (Recomendado para principiantes)](#venv)
4. [virtualenv](#virtualenv)
5. [Conda/Anaconda (Ideal para Data Science)](#conda)
6. [pipenv](#pipenv)
7. [Comparaci√≥n y mejores pr√°cticas](#comparacion)
8. [Soluci√≥n de problemas](#troubleshooting)

## 1. ¬øQu√© son los entornos virtuales? {#que-son}

Los entornos virtuales son espacios aislados donde puedes instalar paquetes de Python sin afectar tu instalaci√≥n global del sistema. Esto es especialmente importante en Data Science donde diferentes proyectos pueden requerir diferentes versiones de librer√≠as como pandas, numpy, scikit-learn, etc.

### Ventajas:
- **Aislamiento**: Cada proyecto tiene sus propias dependencias
- **Reproducibilidad**: Puedes recrear exactamente el mismo entorno
- **Limpieza**: No contaminas tu instalaci√≥n global de Python
- **Flexibilidad**: Diferentes versiones de Python para diferentes proyectos

## 2. Tipos de entornos virtuales {#tipos}

| Herramienta | Pros | Contras | Ideal para |
|-------------|------|---------|------------|
| **venv** | Incluido en Python, simple | Solo Python, no gestiona versiones de Python | Principiantes, proyectos simples |
| **virtualenv** | M√°s funciones que venv | Instalaci√≥n adicional requerida | Proyectos avanzados |
| **Conda/Anaconda** | Gestiona Python + paquetes no-Python, ideal para Data Science | M√°s pesado, curva de aprendizaje | Data Science, Machine Learning |
| **pipenv** | Combina pip + virtualenv, archivo Pipfile | M√°s lento, menos maduro | Desarrollo web, proyectos medianos |

## 3. venv (Recomendado para principiantes) {#venv}

**venv** viene incluido con Python 3.3+ y es la forma m√°s simple de crear entornos virtuales.

### Instalaci√≥n
No requiere instalaci√≥n adicional si tienes Python 3.3+.

### Crear entorno virtual

#### En Windows:

In [None]:
# Crear entorno virtual
# En terminal/cmd:
# python -m venv nombre_entorno
# o
# python -m venv mi_proyecto_ds

# Activar entorno (Windows)
# nombre_entorno\Scripts\activate

# Desactivar entorno
# deactivate

print("Comandos para Windows mostrados arriba como comentarios")

#### En macOS/Linux:

In [None]:
# Crear entorno virtual
# En terminal:
# python3 -m venv nombre_entorno
# o
# python3 -m venv mi_proyecto_ds

# Activar entorno (macOS/Linux)
# source nombre_entorno/bin/activate

# Desactivar entorno
# deactivate

print("Comandos para macOS/Linux mostrados arriba como comentarios")

### Instalar paquetes de Data Science en venv

In [None]:
# Una vez activado el entorno, instalar paquetes esenciales para Data Science
# pip install numpy pandas matplotlib seaborn scikit-learn jupyter

# Para an√°lisis m√°s avanzado
# pip install scipy statsmodels plotly bokeh

# Para machine learning
# pip install tensorflow keras torch xgboost lightgbm

# Guardar dependencias
# pip freeze > requirements.txt

# Instalar desde requirements.txt
# pip install -r requirements.txt

print("Comandos de instalaci√≥n mostrados como comentarios")

### Ejemplo pr√°ctico con venv

In [None]:
# Ejemplo: Crear proyecto de an√°lisis de ventas

# 1. Crear directorio del proyecto
# mkdir analisis_ventas
# cd analisis_ventas

# 2. Crear entorno virtual
# python -m venv venv_ventas

# 3. Activar (Windows)
# venv_ventas\Scripts\activate

# 3. Activar (macOS/Linux)
# source venv_ventas/bin/activate

# 4. Instalar paquetes necesarios
# pip install pandas numpy matplotlib jupyter

# 5. Guardar dependencias
# pip freeze > requirements.txt

print("Ejemplo de flujo completo con venv")

## 4. virtualenv {#virtualenv}

**virtualenv** es una versi√≥n m√°s completa y con m√°s funciones que venv. Soporta Python 2 y 3.

### Instalaci√≥n

In [None]:
# Instalar virtualenv
# pip install virtualenv

# Verificar instalaci√≥n
# virtualenv --version

print("Comandos de instalaci√≥n de virtualenv")

### Usar virtualenv

In [None]:
# Crear entorno virtual
# virtualenv nombre_entorno

# Crear con versi√≥n espec√≠fica de Python
# virtualenv -p python3.9 mi_entorno_python39

# Activar (Windows)
# nombre_entorno\Scripts\activate

# Activar (macOS/Linux)
# source nombre_entorno/bin/activate

# Desactivar
# deactivate

print("Comandos b√°sicos de virtualenv")

### Ejemplo con virtualenv para proyecto de Machine Learning

In [None]:
# Proyecto de clasificaci√≥n de im√°genes

# 1. Crear entorno con Python espec√≠fico
# virtualenv -p python3.9 ml_clasificacion

# 2. Activar
# source ml_clasificacion/bin/activate  # macOS/Linux
# ml_clasificacion\Scripts\activate     # Windows

# 3. Instalar stack de ML
# pip install tensorflow keras opencv-python pillow
# pip install pandas numpy matplotlib seaborn
# pip install scikit-learn jupyter ipykernel

# 4. Agregar kernel a Jupyter
# python -m ipykernel install --user --name=ml_clasificacion

print("Ejemplo completo de proyecto ML con virtualenv")

## 5. Conda/Anaconda (Ideal para Data Science) {#conda}

**Conda** es un gestor de paquetes y entornos que puede manejar paquetes de Python y otros lenguajes. **Anaconda** es una distribuci√≥n que incluye conda + muchos paquetes cient√≠ficos preinstalados.

### Instalaci√≥n

#### Opci√≥n 1: Anaconda (Recomendado para principiantes)
- Descargar desde: https://www.anaconda.com/products/distribution
- Incluye Python + 250+ paquetes cient√≠ficos
- Tama√±o: ~3GB

#### Opci√≥n 2: Miniconda (Recomendado para usuarios avanzados)
- Descargar desde: https://docs.conda.io/en/latest/miniconda.html
- Solo Python + conda
- Tama√±o: ~400MB

### Comandos b√°sicos de Conda

In [None]:
# Verificar instalaci√≥n
# conda --version

# Crear entorno nuevo
# conda create --name mi_entorno python=3.9

# Crear entorno con paquetes espec√≠ficos
# conda create --name ds_project python=3.9 pandas numpy matplotlib jupyter

# Activar entorno
# conda activate mi_entorno

# Desactivar entorno
# conda deactivate

# Listar entornos
# conda env list

# Eliminar entorno
# conda env remove --name mi_entorno

print("Comandos b√°sicos de conda")

### Gesti√≥n de paquetes con Conda

In [None]:
# Instalar paquetes
# conda install pandas numpy matplotlib

# Instalar desde canal espec√≠fico
# conda install -c conda-forge seaborn

# Buscar paquetes
# conda search tensorflow

# Listar paquetes instalados
# conda list

# Actualizar paquetes
# conda update pandas
# conda update --all

# Exportar entorno
# conda env export > environment.yml

# Crear entorno desde archivo
# conda env create -f environment.yml

print("Gesti√≥n de paquetes con conda")

### Ejemplo completo: Proyecto de Data Science con Conda

In [None]:
# Proyecto de an√°lisis predictivo

# 1. Crear entorno con stack completo de DS
# conda create --name prediccion_ventas python=3.9 \
#   pandas numpy scipy matplotlib seaborn \
#   scikit-learn jupyter ipykernel

# 2. Activar entorno
# conda activate prediccion_ventas

# 3. Instalar paquetes adicionales
# conda install -c conda-forge plotly xgboost
# pip install lightgbm  # Si no est√° disponible en conda

# 4. Instalar kernel para Jupyter
# python -m ipykernel install --user --name prediccion_ventas --display-name "Predicci√≥n Ventas"

# 5. Exportar entorno para reproducibilidad
# conda env export > environment.yml

print("Ejemplo completo con conda para Data Science")

### Archivo environment.yml ejemplo

In [None]:
# Ejemplo de archivo environment.yml
environment_yml_content = """
name: prediccion_ventas
channels:
  - conda-forge
  - defaults
dependencies:
  - python=3.9
  - pandas
  - numpy
  - scipy
  - matplotlib
  - seaborn
  - scikit-learn
  - jupyter
  - ipykernel
  - plotly
  - xgboost
  - pip
  - pip:
    - lightgbm
    - optuna
"""

print("Contenido de environment.yml:")
print(environment_yml_content)

## 6. pipenv {#pipenv}

**pipenv** combina pip y virtualenv en una sola herramienta. Usa archivos Pipfile en lugar de requirements.txt.

### Instalaci√≥n

In [None]:
# Instalar pipenv
# pip install pipenv

# Verificar instalaci√≥n
# pipenv --version

print("Instalaci√≥n de pipenv")

### Usar pipenv

In [None]:
# Inicializar proyecto (crea Pipfile)
# pipenv install

# Instalar paquetes
# pipenv install pandas numpy matplotlib

# Instalar paquetes de desarrollo
# pipenv install pytest --dev

# Activar entorno
# pipenv shell

# Ejecutar comandos en el entorno
# pipenv run python script.py
# pipenv run jupyter notebook

# Ver dependencias
# pipenv graph

# Instalar desde Pipfile
# pipenv install

# Generar requirements.txt
# pipenv requirements > requirements.txt

print("Comandos b√°sicos de pipenv")

### Ejemplo con pipenv

In [None]:
# Proyecto de an√°lisis de datos financieros

# 1. Crear directorio e inicializar
# mkdir analisis_financiero
# cd analisis_financiero
# pipenv install

# 2. Instalar stack de finanzas
# pipenv install pandas numpy yfinance plotly dash
# pipenv install jupyter ipykernel --dev

# 3. Activar y trabajar
# pipenv shell
# pipenv run jupyter notebook

print("Ejemplo con pipenv para an√°lisis financiero")

### Archivo Pipfile ejemplo

In [None]:
# Ejemplo de archivo Pipfile
pipfile_content = """
[[source]]
url = "https://pypi.org/simple"
verify_ssl = true
name = "pypi"

[packages]
pandas = "*"
numpy = "*"
yfinance = "*"
plotly = "*"
dash = "*"

[dev-packages]
jupyter = "*"
ipykernel = "*"
pytest = "*"

[requires]
python_version = "3.9"
"""

print("Contenido de Pipfile:")
print(pipfile_content)

## 7. Comparaci√≥n y mejores pr√°cticas {#comparacion}

### Cu√°ndo usar cada herramienta

| Escenario | Herramienta recomendada | Raz√≥n |
|-----------|-------------------------|-------|
| Principiante en Python | **venv** | Simple, incluido en Python |
| Data Science/ML | **Conda/Anaconda** | Maneja paquetes cient√≠ficos complejos |
| Desarrollo web | **pipenv** | Mejor gesti√≥n de dependencias |
| Proyectos empresariales | **virtualenv** + Docker | Mayor control y reproducibilidad |
| Investigaci√≥n acad√©mica | **Conda** | F√°cil compartir entornos |
| M√∫ltiples versiones Python | **virtualenv** o **conda** | Soporte completo para versiones |

### Mejores pr√°cticas generales

In [None]:
# 1. SIEMPRE usar entornos virtuales
# Nunca instalar paquetes globalmente para proyectos

# 2. Nombra tus entornos descriptivamente
# Mal: venv, env
# Bien: analisis_ventas_2024, ml_clasificacion_imagenes

# 3. Documenta tus dependencias
# requirements.txt (pip)
# environment.yml (conda)
# Pipfile (pipenv)

# 4. Usa .gitignore
gitignore_content = """
# Entornos virtuales
venv/
env/
.venv/
.env/

# Conda
.conda/

# Jupyter
.ipynb_checkpoints/

# Python
__pycache__/
*.pyc
"""

print("Contenido recomendado para .gitignore:")
print(gitignore_content)

### Estructura de proyecto recomendada

In [None]:
# Estructura recomendada para proyectos de Data Science

project_structure = """
mi_proyecto_ds/
‚îú‚îÄ‚îÄ data/
‚îÇ   ‚îú‚îÄ‚îÄ raw/          # Datos originales
‚îÇ   ‚îú‚îÄ‚îÄ processed/    # Datos procesados
‚îÇ   ‚îî‚îÄ‚îÄ external/     # Datos de fuentes externas
‚îú‚îÄ‚îÄ notebooks/        # Jupyter notebooks
‚îú‚îÄ‚îÄ src/             # C√≥digo fuente
‚îú‚îÄ‚îÄ tests/           # Tests
‚îú‚îÄ‚îÄ docs/            # Documentaci√≥n
‚îú‚îÄ‚îÄ models/          # Modelos entrenados
‚îú‚îÄ‚îÄ reports/         # Reportes y visualizaciones
‚îú‚îÄ‚îÄ venv/            # Entorno virtual (no subir a git)
‚îú‚îÄ‚îÄ requirements.txt # Dependencias
‚îú‚îÄ‚îÄ environment.yml  # Si usas conda
‚îú‚îÄ‚îÄ README.md
‚îî‚îÄ‚îÄ .gitignore
"""

print("Estructura de proyecto recomendada:")
print(project_structure)

## 8. Soluci√≥n de problemas {#troubleshooting}

### Problemas comunes y soluciones

### Error: "Python no encontrado"

**Windows:**

In [None]:
# Problema: 'python' is not recognized as internal or external command

# Soluci√≥n 1: Usar py launcher
# py -m venv mi_entorno

# Soluci√≥n 2: Agregar Python al PATH
# 1. Buscar "Environment Variables" en Windows
# 2. Agregar la ruta de Python (ej: C:\Python39\)
# 3. Agregar tambi√©n C:\Python39\Scripts\

# Soluci√≥n 3: Reinstalar Python marcando "Add to PATH"

print("Soluciones para Windows cuando Python no se encuentra")

**macOS:**

In [None]:
# Problema: command not found: python

# Soluci√≥n 1: Usar python3
# python3 -m venv mi_entorno

# Soluci√≥n 2: Instalar Python via Homebrew
# brew install python

# Soluci√≥n 3: Crear alias en .bash_profile o .zshrc
# echo 'alias python=python3' >> ~/.zshrc
# source ~/.zshrc

print("Soluciones para macOS cuando Python no se encuentra")

### Error: "Execution policy" (Windows PowerShell)

In [None]:
# Problema: cannot be loaded because running scripts is disabled

# Soluci√≥n 1: Cambiar pol√≠tica de ejecuci√≥n temporalmente
# Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

# Soluci√≥n 2: Usar Command Prompt en lugar de PowerShell

# Soluci√≥n 3: Activar con comando completo
# .\venv\Scripts\Activate.ps1

print("Soluciones para problemas de pol√≠tica de ejecuci√≥n en Windows")

### Error: "Permission denied"

In [None]:
# Problema: Permission denied al crear entornos

# Soluci√≥n 1: No usar sudo con pip/conda (Linux/macOS)
# Malo: sudo pip install ...
# Bueno: pip install --user ...

# Soluci√≥n 2: Verificar permisos del directorio
# chmod 755 ~/mi_proyecto

# Soluci√≥n 3: Crear entorno en directorio con permisos
# mkdir ~/entornos
# python -m venv ~/entornos/mi_proyecto

print("Soluciones para problemas de permisos")

### Problemas espec√≠ficos de Conda

In [None]:
# Problema: Conda slow/packages conflict

# Soluci√≥n 1: Usar mamba (conda m√°s r√°pido)
# conda install mamba -n base -c conda-forge
# mamba install pandas numpy  # En lugar de conda install

# Soluci√≥n 2: Limpiar cach√© de conda
# conda clean --all

# Soluci√≥n 3: Especificar canales expl√≠citamente
# conda install -c conda-forge pandas

# Soluci√≥n 4: Usar pip dentro de conda para paquetes problem√°ticos
# conda activate mi_entorno
# pip install paquete_problematico

print("Soluciones para problemas comunes de Conda")

### Jupyter Kernel Issues

In [None]:
# Problema: Jupyter no encuentra el entorno virtual

# Soluci√≥n: Instalar kernel espec√≠fico
# 1. Activar entorno
# source mi_entorno/bin/activate  # Linux/macOS
# mi_entorno\Scripts\activate     # Windows

# 2. Instalar ipykernel
# pip install ipykernel

# 3. Agregar kernel a Jupyter
# python -m ipykernel install --user --name=mi_entorno --display-name="Mi Entorno DS"

# 4. Verificar kernels disponibles
# jupyter kernelspec list

# 5. Eliminar kernel si es necesario
# jupyter kernelspec uninstall mi_entorno

print("Soluciones para problemas de Jupyter Kernel")

### Comandos √∫tiles para debugging

In [None]:
# Verificar qu√© Python est√°s usando
import sys
print("Python executable:", sys.executable)
print("Python version:", sys.version)
print("Python path:", sys.path[:3])  # Primeros 3 elementos

# Verificar entorno virtual activo
import os
virtual_env = os.environ.get('VIRTUAL_ENV')
conda_env = os.environ.get('CONDA_DEFAULT_ENV')

print("\nEntorno virtual activo:")
if virtual_env:
    print("venv/virtualenv:", virtual_env)
elif conda_env:
    print("conda env:", conda_env)
else:
    print("No hay entorno virtual activo")

# Verificar paquetes instalados
try:
    import pandas as pd
    print(f"\nPandas version: {pd.__version__}")
    print(f"Pandas location: {pd.__file__}")
except ImportError:
    print("\nPandas no est√° instalado")

## Resumen y pr√≥ximos pasos

### ¬øCu√°l elegir?

**Para principiantes en Data Science:** Comienza con **Anaconda**
- Incluye todo lo necesario
- Interfaz gr√°fica disponible (Anaconda Navigator)
- Excelente documentaci√≥n

**Para usuarios intermedios:** **Miniconda** + **conda**
- Mayor control sobre lo que instalas
- M√°s ligero
- Misma potencia que Anaconda

**Para desarrollo web o proyectos generales:** **venv** o **pipenv**
- M√°s ligeros
- Mejor integraci√≥n con pip
- Suficientes para la mayor√≠a de proyectos

### Recursos adicionales
- [Documentaci√≥n oficial de venv](https://docs.python.org/3/tutorial/venv.html)
- [Conda User Guide](https://docs.conda.io/projects/conda/en/latest/user-guide/)
- [Pipenv Documentation](https://pipenv.pypa.io/en/latest/)
- [Real Python: Virtual Environments](https://realpython.com/python-virtual-environments-a-primer/)

In [None]:
# ¬°Felicitaciones! 
# Ya conoces todo lo necesario sobre entornos virtuales para Data Science

print("""üéâ ¬°Tutorial completado! üéâ

Ahora puedes:
‚úÖ Crear entornos virtuales con venv, virtualenv, conda y pipenv
‚úÖ Gestionar dependencias de manera profesional
‚úÖ Resolver problemas comunes
‚úÖ Elegir la herramienta adecuada para cada proyecto
‚úÖ Trabajar con Jupyter en entornos aislados

¬°Es hora de poner en pr√°ctica lo aprendido! üöÄ
""")