# 115_168 Produzione industriale in quantità e valore

- 5 dimensioni:
    - FREQ → CL_FREQ
    - REF_AREA → CL_ITTER107
    - DATA_TYPE → CL_TIPO_DATO37
    - PRODCOM_NACE_REV2 → CL_ATECO_2007_PRODCOM
    - TIME_PERIOD → —

In [1]:
from sdmx import Client

# Inizializza il client ISTAT
istat = Client("Istat")

# STEP 1 – Carica il dataflow e ottieni la struttura associata
df_id = "115_168"
dataflows = istat.dataflow()
df = dataflows.dataflow[df_id]

# Nome leggibile robusto
if df.name.localizations:
    nome_df = (
        df.name.localizations.get("it") or
        df.name.localizations.get("en") or
        next(iter(df.name.localizations.values()))
    )
else:
    nome_df = str(df.name)

print(f"\n🧩 Dataflow ID: {df.id}")
print(f"📘 Nome: {nome_df}")
print(f"📎 DSD ID: {df.structure.id}")


🧩 Dataflow ID: 115_168
📘 Nome: Produzione industriale in quantità e valore
📎 DSD ID: DCSP_PRODCOM


In [2]:
# STEP 2 – Scarica la struttura dati
dsd_msg = istat.datastructure(df.structure.id)
dsd = dsd_msg.structure[0]
dsd

<DataStructureDefinition IT1:DCSP_PRODCOM(1.0): Industrial production volume>

In [3]:
# STEP 3 – Elenca dimensioni e codelist associate
print("\n📐 Dimensioni e relative Codelist:")
for dim in dsd.dimensions:
    cl = dim.local_representation.enumerated
    cl_id = cl.id if cl else "—"
    print(f" - {dim.id} → {cl_id}")


📐 Dimensioni e relative Codelist:
 - FREQ → CL_FREQ
 - REF_AREA → CL_ITTER107
 - DATA_TYPE → CL_TIPO_DATO37
 - PRODCOM_NACE_REV2 → CL_ATECO_2007_PRODCOM
 - TIME_PERIOD → —


In [4]:
# STEP 4 – Elenca i valori ammessi per ciascuna codelist
print("\n📋 Contenuto delle Codelist:")
codelists = dsd_msg.codelist

for dim in dsd.dimensions:
    cl = dim.local_representation.enumerated
    cl_id = cl.id if cl else None
    if cl_id and cl_id in codelists:
        print(f"\n🔹 {dim.id} ({cl_id}):")
        for code in codelists[cl_id]:
            if code.name.localizations:
                label = (
                    code.name.localizations.get("it") or
                    code.name.localizations.get("en") or
                    next(iter(code.name.localizations.values()))
                )
            else:
                label = ""
            print(f"   - {code.id:<15} {label}")


📋 Contenuto delle Codelist:

🔹 FREQ (CL_FREQ):
   - A               annuale
   - B               business (non supportato)
   - D               giornaliero
   - E               event (non supportato)
   - H               semestrale
   - M               mensile
   - Q               trimestrale
   - W               settimanale

🔹 REF_AREA (CL_ITTER107):
   - 00              Raggruppamento a 107 province
   - IT              Italia
   - ITCDE           Centro-nord
   - ITCD            Nord
   - N_2             centro area metropolitana
   - N_MET_AR_INH_GE50001 periferia area metropolitana e comuni con 50.001 ab. e più
   - N_INH_OTH_UN5000 altri comuni fino a 50.000 ab. (diversi dai comuni periferia area metropolitana)
   - ITC             Nord-ovest
   - ITC1            Piemonte
   - ITC11           Torino
   - 001001          Agliè
   - 001002          Airasca
   - 001003          Ala di Stura
   - 001004          Albiano d'Ivrea
   - 001005          Alice Superiore
   - 001006       

In [5]:
def stampa_codelist(codelist_id, filtro=None):
    msg = istat.codelist(codelist_id)
    cl = list(msg.codelist.values())[0]
    for code in cl.items.values():
        if filtro is None or filtro(code):
            loc = code.name.localizations
            name = loc.get('it') or loc.get('en') or next(iter(loc.values()), code.id)
            print(f"{code.id} – {name}")

In [6]:
stampa_codelist('CL_FREQ')

A – annuale
B – business (non supportato)
D – giornaliero
E – event (non supportato)
H – semestrale
M – mensile
Q – trimestrale
W – settimanale


In [7]:
stampa_codelist('CL_TIPO_DATO37')

PV_M_IA_DI_EURO – produzione venduta - m.ia di euro
PV_1000_P_ST – produzione venduta in quantità - 1000 p/st
PV_CGT – produzione venduta in quantità - CGT
PV_C_K – produzione venduta in quantità - c/k
PV_CE_EL – produzione venduta in quantità - ce/el
PV_G – produzione venduta in quantità - g
PV_KW – produzione venduta in quantità - kW
PV_KM – produzione venduta in quantità - km
PV_L_ALC_100PER – produzione venduta in quantità - l alc 100%
PV_LITRI – produzione venduta in quantità - litri
PV_M – produzione venduta in quantità - m
PV_M2 – produzione venduta in quantità - m2
PV_M3 – produzione venduta in quantità - m3
PV_P_ST – produzione venduta in quantità - p/st
PV_PA – produzione venduta in quantità - pa
PV_T – produzione venduta in quantità - t
PV_T_90PER_SDT – produzione venduta in quantità - t 90% sdt
PV_T_AL2O3 – produzione venduta in quantità - t Al2O3
PV_T_B2O3 – produzione venduta in quantità - t B2O3
PV_T_CL – produzione venduta in quantità - t Cl
PV_T_F – produzione venduta 

In [9]:
stampa_codelist('CL_ATECO_2007_PRODCOM')

07_08 – minerali metalliferi e altri minerali da cave e miniere
07 – minerali metalliferi
0710 – minerali metalliferi ferrosi
07101000 – minerali di ferro e loro concentrati (escluse le piriti di ferro arrostite)
07101010 – minerali di ferro e loro concentrati. non agglomerati (escluse le piriti di ferro arrostite)
07101020 – minerali di ferro e loro concentrati. agglomerati (escluse le piriti di ferro arrostite)
0721 – minerali di uranio e di torio
0729 – altri minerali metalliferi non ferrosi
07291100 – minerali di rame e loro concentrati
07291200 – minerali di nichel e loro concentrati
07291300 – minerali di alluminio e loro concentrati
07291400 – minerali di metalli preziosi e loro concentrati
07291410 – minerali di argento e loro concentrati
07291420 – altri minerali di metalli preziosi e loro concentrati (esclusi minerali di argento e loro concentrati)
07291500 – minerali di piombo, zinco e stagno e loro concentrati
07291510 – minerali di piombo e loro concentrati
07291520 – mine

In [None]:
stampa_codelist('CL_ATECO_2007_PRODCOM')

In [None]:
stampa_codelist('CL_FREQ')

In [None]:
stampa_codelist('CL_FREQ')

#  tentativo di accedere ai **codici CPA / ATECO / PRODCOM** da ISTAT via SDMX:


### 🔍 **6. Tentativo di accesso alle codelist ISTAT via SDMX (per mappare CF ↔ CPA ↔ PRODCOM)**

#### 🎯 Obiettivo

Recuperare le **codelist ufficiali** da ISTAT per comprendere:

* quali **codici di classificazione dei prodotti (CPA/PRODCOM)** sono usati,
* come sono rappresentati nel dataset **SDMX `115_168` - Produzione industriale** (`DCSP_PRODCOM`),
* e come collegarli a **Ateco/NACE** e **CF ISTAT**.



#### 📘 Dataset SDMX coinvolto

* **Codice dataflow**: `115_168_DF_DCSP_PRODCOM_2`
* **Struttura dati associata (DSD)**: `DCSP_PRODCOM`
* **Fonte metadati ufficiale**:
  [https://esploradati.istat.it/RefMeta/template/GenericMetadataTemplate.html?nodeId=DW\&metadataSetId=MS\_ISTAT\_TOPMETA2\&reportId=DCSP\_PRODCOM\&lang=it](https://esploradati.istat.it/RefMeta/template/GenericMetadataTemplate.html?nodeId=DW&metadataSetId=MS_ISTAT_TOPMETA2&reportId=DCSP_PRODCOM&lang=it)



#### 🧩 Dimensioni chiave trovate nella struttura del dataset

Eseguendo:

```bash
curl -kL "http://sdmx.istat.it/SDMXWS/rest/datastructure/IT1/DCSP_PRODCOM/1.0"
```

abbiamo ottenuto l’elenco delle dimensioni utilizzate, tra cui:

* `FREQ`: Frequenza
* `ATECO2007_PRODCOM`: Codice dell'attività produttiva secondo Ateco 2007 (≈ NACE Rev.2)
* `ITTER107`: Territorio
* `TIPO_DATO`: Tipo di misura (valore, quantità, ecc.)
* `TIME_PERIOD`: Periodo


#### 📦 Codelist identificata per i codici di attività

La dimensione `ATECO2007_PRODCOM` usa la codelist:

```
CL_ATECO_2007_PRODCOM version="1.1"
```

Questa codelist è fondamentale perché:

* include i codici **Ateco a 4 cifre** compatibili con i codici **PRODCOM**,
* rappresenta quindi l’**aggancio tra NACE/CPA e la produzione fisica nei dati Coeweb**.



#### ✅ Tentativo riuscito

Abbiamo quindi scaricato la codelist con:

```bash
curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_ATECO_2007_PRODCOM/1.1"
```

e abbiamo:

* letto l’XML in Python,

* risolto l’errore `prefix 'xml' not found` aggiungendo al dizionario dei namespace:

  ```python
  ns = {
      "str": "http://www.sdmx.org/resources/sdmxml/schemas/v2_1/structure",
      "com": "http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common",
      "xml": "http://www.w3.org/XML/1998/namespace"  # importante!
  }
  ```

* Estratto correttamente i **codici Ateco e descrizioni**:

  ```text
  ATECO: 2120 - Fabbricazione di medicinali e preparati farmaceutici
  ATECO: 2110 - Fabbricazione di prodotti farmaceutici di base
  ...
  ```

Questi sono i codici **NACE Rev.2 (Ateco 2007)** usati per l’industria manifatturiera nei dati PRODCOM ISTAT.



#### 🧭 Implicazione

Con questi codici ora possiamo:

* filtrare i dati `DCSP_PRODCOM` di Coeweb per **settore produttivo** (es. solo farmaceutico),
* associare ciascun codice **CFxxx** al rispettivo codice **Ateco/CPA/PRODCOM**,
* costruire query precise per esportare dati SDMX o navigare nel portale Coeweb.



Se vuoi, posso anche costruire un mapping finale tra:

```
CFxxx ↔ NACE/Ateco ↔ CL_ATECO_2007_PRODCOM ↔ PRODCOM
```

usando i file già caricati. Vuoi procedere?


In [11]:
import requests
import xml.etree.ElementTree as ET
import pandas as pd

# Scarica XML della codelist
url = "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_ATECO_2007_PRODCOM/1.1"
response = requests.get(url)
root = ET.fromstring(response.content)

# Namespace aggiornato con xml
ns = {
    'str': 'http://www.sdmx.org/resources/sdmxml/schemas/v2_1/structure',
    'com': 'http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common',
    'xml': 'http://www.w3.org/XML/1998/namespace'
}

# Estrai codici e descrizioni in italiano
codes = []
for code_elem in root.findall(".//str:Code", ns):
    code = code_elem.attrib['id']
    name_elem = code_elem.find("com:Name[@xml:lang='it']", ns)
    name = name_elem.text if name_elem is not None else ""
    codes.append((code, name))

# Crea DataFrame
df_codes = pd.DataFrame(codes, columns=['CODE', 'DESCRIPTION'])

# Esempio: solo CF212 (NACE 21.20)
df_cf212 = df_codes[df_codes['CODE'].str.startswith('2120')]
print(df_cf212)



          CODE                                        DESCRIPTION
3575      2120                medicinali e preparati farmaceutici
3576  21202120  sieri specifici di animali o di persone immuni...
3577  21202140                      vaccini per la medicina umana
3578  21202340  preparazioni opacizzanti per esami radiografic...
3579  21202420  medicazioni adesive e simili, impregnate o con...
3580  21202430                                     catgut sterili
3581  21202440  ovatte, garze, ecc. con sostanze farmaceutiche...
3582  21202460  astucci e borse farmaceutici forniti del neces...
3583  21201130  medicamenti contenenti penicilline o streptomi...
3584  21201150  medicamenti contenenti altri antibiotici, non ...
3585  21201160  medicamenti contenenti penicilline, streptomic...
3586  21201180  medicamenti contenenti altri antibiotici, cond...
3587  21201230  medicamenti non contenenti antibiotici, ma ins...
3588  21201250  medicamenti non contenenti antibiotici né insu...
3589  2120

# 🔹 1. **Cos'è `115_168`?**

* `115_168` è un **dataflow ID** registrato presso ISTAT.
* In particolare, è il **codice del dominio SDMX** usato per accedere ai dati **Prodcom** sulla produzione industriale per prodotti e settori.
* Questo dataflow ha diverse varianti:

  | Dataflow ID completo        | Descrizione                                                     |
  | --------------------------- | --------------------------------------------------------------- |
  | `115_168_DF_DCSP_PRODCOM_1` | Produzione per divisione Ateco (2 cifre)                        |
  | `115_168_DF_DCSP_PRODCOM_2` | Produzione per **singolo prodotto** Prodcom                     |
  | `115_168_DF_DCSP_PRODCOM_3` | Produzione per **tutti i prodotti** Prodcom (livello aggregato) |


## 🔹 2. **Cos'è `DCSP_PRODCOM`?**

* `DCSP_PRODCOM` è la **struttura dati (DSD)** condivisa da **tutti i dataflow `115_168_DF_...`**.
* Serve a definire:

  * quali **dimensioni** contiene il dataset,
  * quali **codici/classificazioni (codelist)** sono validi per ciascuna dimensione (es. Ateco, territorio, tipo dato),
  * come interpretare i valori numerici (unità di misura, tipo di frequenza, ecc.).

➡️ **In SDMX, ogni dataflow è collegato a una sola struttura DSD**, e tutti i `115_168_DF_DCSP_PRODCOM_*` sono legati alla **stessa struttura**:

```xml
<Ref id="DCSP_PRODCOM" version="1.0" agencyID="IT1" />
```

Cosa abbiamo fatto quindi?

1. **Hai chiesto di interrogare il dataflow `115_168`** → correttamente identificato come relativo ai dati Prodcom.

2. Abbiamo interrogato:

   ```bash
   curl -kL "http://sdmx.istat.it/SDMXWS/rest/datastructure/IT1/DCSP_PRODCOM/1.0"
   ```

   per ottenere la **struttura dati (DSD)** associata a `115_168`.

3. Dentro questa DSD abbiamo scoperto le **dimensioni**, tra cui:

   * `ATECO2007_PRODCOM`
   * `TIPO_DATO`
   * `ITTER107` (territorio)
   * `TIME_PERIOD`
   * ecc.

4. Abbiamo quindi scaricato la **codelist per `ATECO2007_PRODCOM`**:

   ```bash
   curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_ATECO_2007_PRODCOM/1.1"
   ```

   che contiene i codici Ateco/NACE usati nel dominio `115_168`.


Il **punto 4**, cioè l’interrogazione delle **codelist associate a ciascuna dimensione**, è una procedura **valida per *tutte*** le dimensioni della struttura `DCSP_PRODCOM`.

Per ogni dimensione elencata nella DSD che hai scaricato (`DCSP_PRODCOM`), possiamo accedere alla lista dei codici **valori validi** tramite il relativo ID di codelist.

Ecco un riepilogo con esempi concreti:

| Dimensione SDMX     | Descrizione                        | Codelist ID                 | Esempio `curl`                                                                       |
| ------------------- | ---------------------------------- | --------------------------- | ------------------------------------------------------------------------------------ |
| `FREQ`              | Frequenza (annuale, mensile...)    | `CL_FREQ`                   | `curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_FREQ"`                   |
| `ATECO2007_PRODCOM` | Codici Ateco per Prodcom           | `CL_ATECO_2007_PRODCOM/1.1` | `curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_ATECO_2007_PRODCOM/1.1"` |
| `ITTER107`          | Territorio                         | `CL_ITTER107/1.2`           | `curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_ITTER107/1.2"`           |
| `TIPO_DATO`         | Tipo di dato (valore, quantità...) | `CL_TIPO_DATO37/1.0`        | `curl -kL "http://sdmx.istat.it/SDMXWS/rest/codelist/IT1/CL_TIPO_DATO37/1.0"`        |


* **`FREQ`** → ci dice se i dati sono annuali (tipico per Prodcom).
* **`ATECO2007_PRODCOM`** → ci dà l'elenco dei codici Ateco/NACE utilizzati.
* **`ITTER107`** → territori ISTAT (Italia, regioni, province, ecc.).
* **`TIPO_DATO`** → distinguere ad esempio **valore della produzione** vs **quantità prodotta**.


## 🛠 Perché è utile interrogare tutte le codelist?

* Per **sapere quali codici possiamo usare nelle query**.
* Per **filtrare i dati in modo preciso** (es. solo Puglia, solo valore, solo 2120).
* Per **decodificare i risultati**, dato che spesso i file CSV restituiti hanno solo i codici.


## 📌 In sintesi

* Abbiamo usato `DCSP_PRODCOM` **non al posto di `115_168`**, ma perché è **la struttura che regola tutti i dataset `115_168_*`**.
* È **esattamente il passaggio corretto** per capire:

  * come costruire query SDMX per `115_168`,
  * quali valori usare nelle dimensioni (es. Ateco 2120 = farmaceutico),
  * come decodificare il significato di ciascun codice.

Ora che abbiamo:

* la **struttura delle dimensioni** (grazie a `DCSP_PRODCOM`),
* la **codelist Ateco/Prodcom** corretta (grazie a `CL_ATECO_2007_PRODCOM`),

possiamo procedere a interrogare i **dati veri e propri** da `115_168_DF_DCSP_PRODCOM_2` (es. per 2120, farmaceutico).


# Funzionano

- https://sdmx.istat.it/SDMXWS/rest/data/115_168/A.30....
- https://sdmx.istat.it/SDMXWS/rest/data/115_168/A.30.IT.PV_M_IA_DI_EURO
- https://sdmx.istat.it/SDMXWS/rest/data/115_168/A.31..PV_M_IA_DI_EURO
