### 1- Import des librairies utiles

In [1]:
import pandas as pd
import numpy as np
import sqlalchemy as db

import warnings
warnings.filterwarnings('ignore')

### 2- Création du contexte SQLAlchemy

In [63]:
from sqlalchemy import create_engine, MetaData, Table, inspect

In [39]:
engine = db.create_engine('sqlite:///FPA_FOD_20170508.sqlite')
connection = engine.connect()
metadata = db.MetaData(bind=engine)

### 3- Listing des tables

In [40]:
inspector = inspect(engine)

In [41]:
inspector.get_table_names()

['ElementaryGeometries',
 'Fires',
 'KNN',
 'NWCG_UnitIDActive_20170109',
 'SpatialIndex',
 'geometry_columns',
 'geometry_columns_auth',
 'geometry_columns_field_infos',
 'geometry_columns_statistics',
 'geometry_columns_time',
 'idx_Fires_Shape',
 'idx_Fires_Shape_node',
 'idx_Fires_Shape_parent',
 'idx_Fires_Shape_rowid',
 'spatial_ref_sys',
 'spatial_ref_sys_aux',
 'spatialite_history',
 'sql_statements_log',
 'sqlite_sequence',
 'views_geometry_columns',
 'views_geometry_columns_auth',
 'views_geometry_columns_field_infos',
 'views_geometry_columns_statistics',
 'virts_geometry_columns',
 'virts_geometry_columns_auth',
 'virts_geometry_columns_field_infos',
 'virts_geometry_columns_statistics']

In [22]:
print('Nb de tables :',len(inspector.get_table_names()))

Nb de tables : 27


J'ai remarqué que certaines tables n'étaient pas valides et ne pouvaient être chargées, j'essaie donc de définir les tables valides à étudier et sortir les tables non-exploitables :

In [42]:
list_tables_OK = []
list_tables_NOK = []

for table_name in inspector.get_table_names():
    try:
        inspector.has_table(table_name)
        list_tables_OK.append(table_name)
    except:
        list_tables_NOK.append(table_name)

In [43]:
list_tables_OK

['Fires',
 'NWCG_UnitIDActive_20170109',
 'geometry_columns',
 'geometry_columns_auth',
 'geometry_columns_field_infos',
 'geometry_columns_statistics',
 'geometry_columns_time',
 'idx_Fires_Shape',
 'idx_Fires_Shape_node',
 'idx_Fires_Shape_parent',
 'idx_Fires_Shape_rowid',
 'spatial_ref_sys',
 'spatial_ref_sys_aux',
 'spatialite_history',
 'sql_statements_log',
 'sqlite_sequence',
 'views_geometry_columns',
 'views_geometry_columns_auth',
 'views_geometry_columns_field_infos',
 'views_geometry_columns_statistics',
 'virts_geometry_columns',
 'virts_geometry_columns_auth',
 'virts_geometry_columns_field_infos',
 'virts_geometry_columns_statistics']

In [44]:
list_tables_NOK

['ElementaryGeometries', 'KNN', 'SpatialIndex']

### 4- Relevé du nombre de lignes et colonnes

Chargement des metadata pour les tables OK :

In [49]:
metadata.reflect(only = list_tables_OK)

Relevé du nombres lignes par table :

In [53]:
for table_name in list_tables_OK:
    print('Table :', table_name, '|| Nb lignes :', db.select([db.func.count()]).select_from(metadata.tables[table_name]).scalar())

Table : Fires || Nb lignes : 1880465
Table : NWCG_UnitIDActive_20170109 || Nb lignes : 5867
Table : geometry_columns || Nb lignes : 1
Table : geometry_columns_auth || Nb lignes : 1
Table : geometry_columns_field_infos || Nb lignes : 0
Table : geometry_columns_statistics || Nb lignes : 1
Table : geometry_columns_time || Nb lignes : 1
Table : idx_Fires_Shape || Nb lignes : 1880465
Table : idx_Fires_Shape_node || Nb lignes : 72263
Table : idx_Fires_Shape_parent || Nb lignes : 72262
Table : idx_Fires_Shape_rowid || Nb lignes : 1880465
Table : spatial_ref_sys || Nb lignes : 4924
Table : spatial_ref_sys_aux || Nb lignes : 4873
Table : spatialite_history || Nb lignes : 16
Table : sql_statements_log || Nb lignes : 0
Table : sqlite_sequence || Nb lignes : 3
Table : views_geometry_columns || Nb lignes : 0
Table : views_geometry_columns_auth || Nb lignes : 0
Table : views_geometry_columns_field_infos || Nb lignes : 0
Table : views_geometry_columns_statistics || Nb lignes : 0
Table : virts_geometr

Relevé du nombre de colonnes par table :

In [58]:
for table_name in list_tables_OK:
      print('Table :', table_name, '|| Nb colonnes :', len(metadata.tables[table_name].columns.keys()))

Table : Fires || Nb colonnes : 39
Table : NWCG_UnitIDActive_20170109 || Nb colonnes : 13
Table : geometry_columns || Nb colonnes : 6
Table : geometry_columns_auth || Nb colonnes : 4
Table : geometry_columns_field_infos || Nb colonnes : 14
Table : geometry_columns_statistics || Nb colonnes : 8
Table : geometry_columns_time || Nb colonnes : 5
Table : idx_Fires_Shape || Nb colonnes : 5
Table : idx_Fires_Shape_node || Nb colonnes : 2
Table : idx_Fires_Shape_parent || Nb colonnes : 2
Table : idx_Fires_Shape_rowid || Nb colonnes : 2
Table : spatial_ref_sys || Nb colonnes : 6
Table : spatial_ref_sys_aux || Nb colonnes : 12
Table : spatialite_history || Nb colonnes : 7
Table : sql_statements_log || Nb colonnes : 7
Table : sqlite_sequence || Nb colonnes : 2
Table : views_geometry_columns || Nb colonnes : 6
Table : views_geometry_columns_auth || Nb colonnes : 3
Table : views_geometry_columns_field_infos || Nb colonnes : 14
Table : views_geometry_columns_statistics || Nb colonnes : 8
Table : virt

Requête globale en vue d'une reprise sous Excel :

In [62]:
print('Table_name', ',', 'Nb lignes', ',', 'Nb colonnes')
for table_name in list_tables_OK:
    print(table_name, ',',db.select([db.func.count()]).select_from(metadata.tables[table_name]).scalar(), ',', len(metadata.tables[table_name].columns.keys()))

Table_name , Nb lignes , Nb colonnes
Fires , 1880465 , 39
NWCG_UnitIDActive_20170109 , 5867 , 13
geometry_columns , 1 , 6
geometry_columns_auth , 1 , 4
geometry_columns_field_infos , 0 , 14
geometry_columns_statistics , 1 , 8
geometry_columns_time , 1 , 5
idx_Fires_Shape , 1880465 , 5
idx_Fires_Shape_node , 72263 , 2
idx_Fires_Shape_parent , 72262 , 2
idx_Fires_Shape_rowid , 1880465 , 2
spatial_ref_sys , 4924 , 6
spatial_ref_sys_aux , 4873 , 12
spatialite_history , 16 , 7
sql_statements_log , 0 , 7
sqlite_sequence , 3 , 2
views_geometry_columns , 0 , 6
views_geometry_columns_auth , 0 , 3
views_geometry_columns_field_infos , 0 , 14
views_geometry_columns_statistics , 0 , 8
virts_geometry_columns , 0 , 5
virts_geometry_columns_auth , 0 , 3
virts_geometry_columns_field_infos , 0 , 14
virts_geometry_columns_statistics , 0 , 8
