# üöÄ DE Zoomcamp - Module 1 : Docker & Terraform

**Objectif** : Ma√Ætriser Docker (containerisation) et Terraform (Infrastructure as Code)

**Date** : Janvier 2026

---

## üìã Sommaire

### Partie 1 : Docker
1. [Concepts fondamentaux](#1-docker---concepts-fondamentaux)
2. [Image vs Container](#2-image-vs-container)
3. [Commandes essentielles](#3-commandes-docker-essentielles)
4. [Flags importants (-it, -d, --rm)](#4-flags-importants)
5. [Volumes et persistance](#5-volumes-et-persistance-des-donn√©es)
6. [Networking Docker](#6-networking-docker)
7. [Dockerfile](#7-dockerfile)
8. [Docker Compose](#8-docker-compose)
9. [Commandes du cours (Postgres, pgAdmin, Ingest)](#9-commandes-pratiques-du-cours)

### Partie 2 : Terraform
10. [Concepts IaC](#10-terraform---infrastructure-as-code)
11. [Architecture et State](#11-architecture-terraform)
12. [Workflow (init, plan, apply, destroy)](#12-workflow-terraform)
13. [Fichiers du cours (main.tf, variables.tf)](#13-fichiers-terraform-du-cours)
14. [Best Practices](#14-best-practices-terraform)

---

# PARTIE 1 : DOCKER üê≥

---

## 1. Docker - Concepts Fondamentaux

### D√©finition

**Docker** = Plateforme de containerisation qui empaqu√®te une application + ses d√©pendances dans un environnement isol√© et portable.

### Docker vs VM

```
VM       : App ‚Üí OS complet ‚Üí Hypervisor ‚Üí Hardware (lourd, GB)
Docker   : App ‚Üí Docker Engine ‚Üí OS H√¥te ‚Üí Hardware (l√©ger, MB)
```

| Crit√®re | Docker | VM |
|---------|--------|-----|
| **Taille** | 5-500 MB | 2-20 GB |
| **D√©marrage** | < 1 seconde | 30-60 secondes |
| **Overhead** | ~2-5% | ~40-60% |
| **Isolation** | Processus (namespace) | Hardware (hypervisor) |

### Ce que Docker N'EST PAS

- ‚ùå **Pas une VM** : partage le kernel de l'h√¥te
- ‚ùå **Pas Kubernetes** : K8s = orchestration de containers sur clusters
- ‚ùå **Pas du config management** : pas Ansible/Chef (Docker = images immuables)
- ‚ùå **Pas magique pour la s√©curit√©** : containers partagent le kernel

### Cas d'usage id√©aux

‚úÖ Microservices, CI/CD, environnements de dev, applications web stateless

‚ùå Applications GUI desktop, kernel modules, syst√®mes temps-r√©el

## 2. Image vs Container

**Concept cl√©** - la distinction la plus importante √† comprendre :

### IMAGE = Template immuable (la classe)
- Stock√©e une seule fois sur disque
- Contient le syst√®me de fichiers et les instructions
- Commande : `docker images`

### CONTAINER = Instance de l'image (l'objet)
- Tu peux cr√©er plusieurs containers de la m√™me image
- Chaque container a son propre cycle de vie
- Commande : `docker ps -a`

```
IMAGE (postgres:18)  ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ> Container 1 (pgdatabase-dev)
                       ‚îú‚îÄ‚îÄ> Container 2 (pgdatabase-test)
                       ‚îî‚îÄ‚îÄ> Container 3 (pgdatabase-prod)
```

**R√®gle** : Tu dois supprimer les containers AVANT de pouvoir supprimer leur image.

In [None]:
# Test que Docker fonctionne
!docker run hello-world

In [None]:
# Lister les images locales
!docker images

In [None]:
# Lister les containers (actifs)
!docker ps

# Lister TOUS les containers (y compris arr√™t√©s)
!docker ps -a

## 3. Commandes Docker Essentielles

### Gestion des containers

| Commande | Action |
|----------|--------|
| `docker ps` | Containers actifs |
| `docker ps -a` | Tous les containers |
| `docker stop <id>` | Arr√™ter un container |
| `docker start <id>` | Red√©marrer un container |
| `docker rm <id>` | Supprimer un container |
| `docker logs <id>` | Voir les logs |
| `docker exec -it <id> bash` | Entrer dans un container actif |

### Gestion des images

| Commande | Action |
|----------|--------|
| `docker images` | Lister les images |
| `docker pull <image>` | T√©l√©charger une image |
| `docker rmi <image>` | Supprimer une image |
| `docker build -t <name> .` | Construire une image |

### Nettoyage

```bash
docker container prune     # Supprimer containers arr√™t√©s
docker image prune         # Supprimer images non utilis√©es
docker volume prune        # Supprimer volumes non utilis√©s
docker system prune -a     # Tout nettoyer (‚ö†Ô∏è agressif)
```

### Shortcuts utiles

```bash
docker stop $(docker ps -q)           # Arr√™ter TOUS les containers actifs
docker rm $(docker ps -aq)            # Supprimer TOUS les containers
docker rmi $(docker images -q)        # Supprimer TOUTES les images
```

## 4. Flags Importants

### `-it` : Mode interactif avec terminal

```bash
docker run -it ubuntu bash
```

- `-i` (interactive) : garde STDIN ouvert ‚Üí tu peux taper
- `-t` (tty) : alloue un pseudo-terminal ‚Üí affichage propre
- `-it` ensemble = shell interactif complet

### `-d` : Mode d√©tach√© (background)

```bash
docker run -d postgres:18
```

- Le container tourne en arri√®re-plan
- Tu r√©cup√®res ton terminal
- Id√©al pour les services (DB, web servers)

### `--rm` : Auto-suppression

```bash
docker run --rm hello-world
```

- Supprime automatiquement le container apr√®s ex√©cution
- √âvite l'accumulation de containers arr√™t√©s

### `--name` : Nommer le container

```bash
docker run --name mon-postgres postgres:18
```

### `--entrypoint` : Override le point d'entr√©e

```bash
# Au lieu de lancer Python, lance bash
docker run -it --entrypoint=bash python:3.13-slim
```

**Use case** : Explorer le filesystem d'une image, debug

### `-e` : Variables d'environnement

```bash
docker run -e POSTGRES_USER=root -e POSTGRES_PASSWORD=secret postgres:18
```

### `-p` : Port mapping

```bash
docker run -p 5432:5432 postgres:18
#          host:container
```

### Tableau r√©capitulatif

| Situation | Flags | Exemple |
|-----------|-------|---------|
| Service background | `-d` | `docker run -d nginx` |
| Shell interactif | `-it` | `docker run -it ubuntu bash` |
| Container temporaire | `-it --rm` | `docker run -it --rm python bash` |
| Debug une image | `-it --entrypoint=bash` | `docker run -it --entrypoint=bash python:3.13` |

## 5. Volumes et Persistance des Donn√©es

**Probl√®me** : Les donn√©es dans un container sont √©ph√©m√®res. Si tu supprimes le container, tout est perdu !

**Solution** : Les volumes.

### Syntaxe

```bash
docker run -v CHEMIN_LOCAL:CHEMIN_CONTAINER image
docker run -v NOM_VOLUME:CHEMIN_CONTAINER image
```

### 3 types de volumes

#### 1. Bind mount (dev) - Lie un dossier local
```bash
docker run -v $(pwd):/app python:3.13-slim
```
- Ton dossier local ‚Üî accessible dans le container
- Synchronis√© en temps r√©el
- **Use case** : Dev, notebooks, scripts

#### 2. Volume Docker (prod) - G√©r√© par Docker
```bash
docker volume create postgres-data
docker run -v postgres-data:/var/lib/postgresql/data postgres:18
```
- Survit √† la suppression du container
- **Use case** : Bases de donn√©es, donn√©es importantes

#### 3. Volume anonyme (temporaire)
```bash
docker run -v /data ubuntu
```
- Docker cr√©e un volume sans nom
- **Use case** : Cache, fichiers temporaires

### Options utiles

```bash
# Read-only
-v $(pwd)/config.yml:/app/config.yml:ro

# Workdir automatique
-v $(pwd):/app -w /app

# Multiples volumes
-v $(pwd)/code:/app -v $(pwd)/data:/data -v logs:/logs
```

### Commandes de gestion

```bash
docker volume ls                    # Lister
docker volume inspect mon-volume    # D√©tails
docker volume rm mon-volume         # Supprimer
docker volume prune                 # Nettoyer les non-utilis√©s
```

## 6. Networking Docker

### Pourquoi ?

Par d√©faut, chaque container est isol√©. Pour que 2 containers communiquent (ex: ton app Python ‚Üí Postgres), ils doivent √™tre sur le **m√™me r√©seau**.

### Cr√©er un network

```bash
docker network create pg-network
```

### Connecter des containers au network

```bash
# Container 1 : Postgres
docker run -d --network=pg-network --name pgdatabase postgres:18

# Container 2 : pgAdmin
docker run -d --network=pg-network --name pgadmin dpage/pgadmin4
```

### R√©solution DNS automatique

Sur le m√™me network, les containers se trouvent **par leur nom** :

```python
# Dans ton script Python (container sur pg-network)
connection = psycopg2.connect(
    host="pgdatabase",  # ‚Üê Le nom du container, pas localhost !
    port=5432,
    database="ny_taxi"
)
```

### Commandes r√©seau

```bash
docker network ls                   # Lister les networks
docker network inspect pg-network   # Voir les containers connect√©s
docker network rm pg-network        # Supprimer
```

## 7. Dockerfile

### C'est quoi ?

Un **Dockerfile** = recette pour construire une image Docker personnalis√©e.

### Structure de base

```dockerfile
# Image de base
FROM python:3.13-slim

# D√©finir le r√©pertoire de travail
WORKDIR /app

# Copier les fichiers de d√©pendances
COPY requirements.txt .

# Installer les d√©pendances
RUN pip install -r requirements.txt

# Copier le code source
COPY . .

# Commande par d√©faut
ENTRYPOINT ["python", "ingest_data.py"]
```

### Instructions principales

| Instruction | Description |
|-------------|-------------|
| `FROM` | Image de base |
| `WORKDIR` | R√©pertoire de travail |
| `COPY` | Copier fichiers locaux ‚Üí image |
| `RUN` | Ex√©cuter une commande (pendant le build) |
| `ENV` | D√©finir une variable d'environnement |
| `EXPOSE` | Documenter le port utilis√© |
| `ENTRYPOINT` | Commande principale (fixe) |
| `CMD` | Arguments par d√©faut (overridable) |

### Build et run

```bash
# Construire l'image
docker build -t mon-app:v1 .

# Lancer un container
docker run mon-app:v1
```

### ENTRYPOINT vs CMD

```dockerfile
# ENTRYPOINT = commande principale (ne change pas)
ENTRYPOINT ["python", "script.py"]

# CMD = arguments par d√©faut (peut √™tre overridden)
CMD ["--verbose"]

# R√©sultat : python script.py --verbose
# docker run mon-image --quiet ‚Üí python script.py --quiet
```

## 8. Docker Compose

### C'est quoi ?

**Docker Compose** = Outil pour d√©finir et lancer des applications multi-containers via un fichier YAML.

### Pourquoi ?

Au lieu de lancer manuellement :
```bash
docker network create ...
docker run postgres ...
docker run pgadmin ...
docker run mon-app ...
```

Tu fais simplement :
```bash
docker compose up
```

### Exemple docker-compose.yml

```yaml
services:
  pgdatabase:
    image: postgres:18
    environment:
      POSTGRES_USER: root
      POSTGRES_PASSWORD: root
      POSTGRES_DB: ny_taxi
    volumes:
      - ny_taxi_postgres_data:/var/lib/postgresql/data
    ports:
      - "5432:5432"

  pgadmin:
    image: dpage/pgadmin4
    environment:
      PGADMIN_DEFAULT_EMAIL: admin@admin.com
      PGADMIN_DEFAULT_PASSWORD: root
    volumes:
      - pgadmin_data:/var/lib/pgadmin
    ports:
      - "8085:80"

volumes:
  ny_taxi_postgres_data:
  pgadmin_data:
```

### Commandes

```bash
docker compose up           # Lancer tous les services
docker compose up -d        # En mode d√©tach√©
docker compose down         # Arr√™ter et supprimer
docker compose ps           # √âtat des services
docker compose logs         # Voir les logs
docker compose build        # Rebuild les images
```

### Avantages

- ‚úÖ Network cr√©√© automatiquement (tous les services peuvent se voir par leur nom)
- ‚úÖ Un seul fichier = toute la stack
- ‚úÖ Facile √† versionner dans Git
- ‚úÖ Reproductible

## 9. Commandes Pratiques du Cours

### üêò Container Postgres

```bash
docker run -it --rm \
  -e POSTGRES_USER="root" \
  -e POSTGRES_PASSWORD="root" \
  -e POSTGRES_DB="ny_taxi" \
  -v ny_taxi_postgres_data:/var/lib/postgresql/data \
  -p 5432:5432 \
  --network=pg-network \
  --name pgdatabase \
  postgres:18
```

**D√©composition :**
- `-e POSTGRES_*` : Variables d'environnement pour configurer Postgres
- `-v ny_taxi_postgres_data:...` : Volume nomm√© pour persister les donn√©es
- `-p 5432:5432` : Expose le port Postgres
- `--network=pg-network` : Connecte au r√©seau custom
- `--name pgdatabase` : Nom DNS pour les autres containers

---

### üìä Container pgAdmin

```bash
docker run -it --rm \
  -e PGADMIN_DEFAULT_EMAIL="admin@admin.com" \
  -e PGADMIN_DEFAULT_PASSWORD="root" \
  -v pgadmin_data:/var/lib/pgadmin \
  -p 8085:80 \
  --network=pg-network \
  --name pgadmin \
  dpage/pgadmin4
```

**Acc√®s** : http://localhost:8085

**Connexion √† Postgres depuis pgAdmin** :
- Host : `pgdatabase` (le nom du container, pas localhost !)
- Port : `5432`
- Username : `root`
- Password : `root`

---

### üöï Container d'ingestion (taxi data)

```bash
docker run -it --rm \
  --network=pipeline_default \
  taxi_ingest:v001 \
    --pg-user=root \
    --pg-pass=root \
    --pg-host=pgdatabase \
    --pg-port=5432 \
    --pg-db=ny_taxi \
    --target-table=yellow_taxi_trips_2021_1 \
    --chunksize=100000
```

**Note** : `taxi_ingest:v001` est une image custom construite avec un Dockerfile.

---

# PARTIE 2 : TERRAFORM üèóÔ∏è

---

## 10. Terraform - Infrastructure as Code

### D√©finition

**Terraform** = Outil pour cr√©er, modifier et d√©truire de l'infrastructure cloud via du CODE.

### Avant/Apr√®s

```
‚ùå AVANT (Console Web)
1. Ouvre console GCP
2. Clique "Create Bucket"
3. Remplis le formulaire
4. R√©p√®te pour chaque ressource...

Probl√®mes: Pas reproductible, pas versionnable, erreurs humaines

‚úÖ AVEC TERRAFORM
resource "google_storage_bucket" "data" {
  name     = "mon-bucket"
  location = "US"
}

$ terraform apply

Avantages: Reproductible, versionnable (Git), automatisable (CI/CD)
```

### Ce que Terraform N'EST PAS

| Terraform | Ce qu'il faut utiliser |
|-----------|------------------------|
| ‚ùå Config syst√®me (installer logiciels) | Ansible, Chef, Puppet |
| ‚ùå D√©ploiement d'apps | Docker, Kubernetes, GitHub Actions |
| ‚ùå Monitoring | Datadog, Prometheus, CloudWatch |
| ‚ùå Orchestration data | Airflow, Prefect, Dagster |

**Exemple concret :**
- **Terraform cr√©e** la VM sur GCP ‚úÖ
- **Ansible installe** PostgreSQL sur cette VM ‚úÖ

## 11. Architecture Terraform

### Les 3 composants

```
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ           TERRAFORM CLI                  ‚îÇ
‚îÇ   (terraform init, plan, apply)         ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
                  ‚îÇ
                  ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ            PROVIDERS                     ‚îÇ
‚îÇ   (google, aws, azure, kubernetes)       ‚îÇ
‚îÇ   = Plugins qui parlent aux APIs cloud  ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
                  ‚îÇ
                  ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ          CLOUD PLATFORMS                 ‚îÇ
‚îÇ   (GCP, AWS, Azure)                      ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

### Le State File (`terraform.tfstate`)

**LE fichier le plus important !**

C'est un fichier JSON qui enregistre l'√©tat actuel de ton infrastructure :

```json
{
  "resources": [
    {
      "type": "google_storage_bucket",
      "name": "demo-bucket",
      "attributes": {
        "id": "mon-projet-terra-bucket",
        "location": "US"
      }
    }
  ]
}
```

**R√¥le :** Terraform compare ce fichier avec ton code `.tf` pour d√©terminer :
- Ce qui existe d√©j√†
- Ce qui doit √™tre cr√©√©
- Ce qui doit √™tre modifi√©
- Ce qui doit √™tre supprim√©

‚ö†Ô∏è **Si tu perds ce fichier, Terraform ne sait plus ce qu'il a cr√©√© !**

## 12. Workflow Terraform

### Le flow standard

```
1. √âCRIRE ‚îÄ‚îÄ> main.tf, variables.tf
       ‚îÇ
       ‚ñº
2. INIT ‚îÄ‚îÄ> $ terraform init
       ‚îÇ     ‚Üí T√©l√©charge les providers
       ‚ñº
3. PLAN ‚îÄ‚îÄ> $ terraform plan
       ‚îÇ     ‚Üí Preview des changements (rien n'est cr√©√©)
       ‚ñº
4. APPLY ‚îÄ‚îÄ> $ terraform apply
       ‚îÇ      ‚Üí Cr√©e/modifie les ressources
       ‚ñº
5. DESTROY ‚îÄ‚îÄ> $ terraform destroy
               ‚Üí Supprime toutes les ressources
```

### Commandes essentielles

| Commande | Description | Quand |
|----------|-------------|-------|
| `terraform init` | Initialise le projet | 1√®re fois + apr√®s ajout provider |
| `terraform plan` | Preview des changements | **Toujours avant apply** |
| `terraform apply` | Applique les changements | Cr√©er/modifier l'infra |
| `terraform destroy` | D√©truit tout | Nettoyage complet |
| `terraform fmt` | Formate le code | Avant commit Git |
| `terraform validate` | V√©rifie la syntaxe | Debugging |
| `terraform show` | Affiche le state | Voir ce qui existe |

### Workflow s√©curis√© (production)

```bash
terraform plan -out=tfplan   # Sauvegarde le plan
# ‚Üê V√©rifie le plan soigneusement
terraform apply tfplan       # Applique exactement ce plan
```

## 13. Fichiers Terraform du Cours

### Structure du projet

```
terrademo/
‚îú‚îÄ‚îÄ main.tf           # Ressources principales
‚îú‚îÄ‚îÄ variables.tf      # D√©finition des variables
‚îú‚îÄ‚îÄ terraform.tfstate # √âtat (auto-g√©n√©r√©, NE PAS COMMIT)
‚îî‚îÄ‚îÄ keys/
    ‚îî‚îÄ‚îÄ my-CREDENTIALS.json  # Cl√© de service account GCP
```

---

### main.tf

```hcl
terraform {
  required_providers {
    google = {
      source  = "hashicorp/google"
      version = "7.16.0"
    }
  }
}

# Configuration du provider Google Cloud
provider "google" {
  credentials = file(var.credentials)
  project     = var.project
  region      = var.region
}

# Ressource : Google Cloud Storage Bucket (Data Lake)
resource "google_storage_bucket" "demo-bucket" {
  name          = var.gcs_bucket_name
  location      = var.location
  force_destroy = true

  lifecycle_rule {
    condition {
      age = 1  # Jours
    }
    action {
      type = "AbortIncompleteMultipartUpload"
    }
  }
}

# Ressource : BigQuery Dataset (Data Warehouse)
resource "google_bigquery_dataset" "demo_dataset" {
  dataset_id  = var.bq_dataset_name
  location    = var.location
  description = var.bq_dataset_description
}
```

---

### variables.tf

```hcl
variable "credentials" {
  description = "Path to GCP service account key"
  default     = "./keys/my-CREDENTIALS.json"
}

variable "project" {
  description = "GCP Project ID"
  default     = "cohesive-folio-485508-e4"
}

variable "region" {
  description = "GCP Region"
  default     = "us-central1"
}

variable "location" {
  description = "GCP Location for resources"
  default     = "US"
}

variable "gcs_bucket_name" {
  description = "GCS Bucket Name (must be globally unique)"
  default     = "cohesive-folio-485508-e4-terra-bucket"
}

variable "bq_dataset_name" {
  description = "BigQuery Dataset Name"
  default     = "demo_dataset"
}

variable "bq_dataset_description" {
  description = "BigQuery Dataset Description"
  default     = "Demo dataset created with Terraform"
}

variable "gcs_storage_class" {
  description = "Storage class for the bucket"
  default     = "STANDARD"
}
```

---

### Configuration des credentials

**Option 1 : Variable d'environnement**
```bash
export GOOGLE_CREDENTIALS='/chemin/vers/my-CREDENTIALS.json'
```

**Option 2 : Dans le code (comme ci-dessus)**
```hcl
credentials = file(var.credentials)
```

## 14. Best Practices Terraform

### 1. Ne JAMAIS commit le state dans Git

```bash
# .gitignore
terraform.tfstate
terraform.tfstate.backup
.terraform/
*.tfvars  # Contient souvent des secrets
```

**Solution pro :** Remote backend (GCS, S3)
```hcl
terraform {
  backend "gcs" {
    bucket = "mon-projet-terraform-state"
    prefix = "terraform/state"
  }
}
```

### 2. Utilise des variables (pas de valeurs en dur)

```hcl
# ‚ùå MAUVAIS
resource "google_storage_bucket" "data" {
  name = "cohesive-folio-485508-e4-terra-bucket"
}

# ‚úÖ BON
resource "google_storage_bucket" "data" {
  name = "${var.project_id}-data-lake"
}
```

### 3. Nomme clairement tes ressources

```hcl
# ‚ùå MAUVAIS
resource "google_storage_bucket" "b1" { ... }

# ‚úÖ BON
resource "google_storage_bucket" "raw_data_lake" { ... }
```

### 4. Toujours `plan` avant `apply`

```bash
terraform plan -out=tfplan
# V√©rifie le plan
terraform apply tfplan
```

### 5. Utilise des labels

```hcl
resource "google_storage_bucket" "data" {
  name = "mon-bucket"
  
  labels = {
    environment = "dev"
    team        = "data-engineering"
    managed_by  = "terraform"
  }
}
```

**Utilit√© :** Facturation par √©quipe, filtrage, automatisation

### 6. Documente ton code

```hcl
# Ce bucket stocke les donn√©es brutes depuis les APIs
# Lifecycle: fichiers > 90 jours passent en NEARLINE
resource "google_storage_bucket" "raw_ingestion" {
  name          = "${var.project_id}-raw-data"
  storage_class = "STANDARD"
  
  lifecycle_rule {
    condition { age = 90 }
    action { 
      type          = "SetStorageClass"
      storage_class = "NEARLINE"
    }
  }
}
```

---

## üéØ R√©capitulatif Final

### Docker - Points cl√©s

| Concept | R√©sum√© |
|---------|--------|
| **Image vs Container** | Image = template, Container = instance |
| **Flags essentiels** | `-it` (interactif), `-d` (background), `--rm` (auto-clean) |
| **Volumes** | Bind mount (dev), Named volume (prod) |
| **Networking** | `--network` pour que les containers communiquent |
| **Docker Compose** | Un fichier YAML = toute la stack |

### Terraform - Points cl√©s

| Concept | R√©sum√© |
|---------|--------|
| **IaC** | Infrastructure d√©finie en code, reproductible |
| **State** | `terraform.tfstate` = source de v√©rit√© |
| **Workflow** | init ‚Üí plan ‚Üí apply ‚Üí destroy |
| **Variables** | Param√©trise ton code pour r√©utilisation |
| **Providers** | Plugins pour parler aux clouds (google, aws...) |

### Ta stack DE

```
Infrastructure (Terraform)
    ‚Üì
Containerisation (Docker)
    ‚Üì
Orchestration data (Airflow)
    ‚Üì
Monitoring (Grafana/Datadog)
```

---

## üìö Ressources

**Docker**
- [Documentation officielle](https://docs.docker.com/)
- [Docker Hub](https://hub.docker.com/)

**Terraform**
- [Terraform Docs](https://developer.hashicorp.com/terraform/docs)
- [Google Provider](https://registry.terraform.io/providers/hashicorp/google/latest/docs)
- [Learn Terraform](https://learn.hashicorp.com/terraform)

**Zoomcamp**
- [DE Zoomcamp GitHub](https://github.com/DataTalksClub/data-engineering-zoomcamp)