In [11]:
%cd /home/mfu/Documents/Projets/coronavirus

"""
CoronaVirus (Covid19) - Evolution par pays et dans le monde (maj quotidienne)

Ces données sont utilisées afin d'afficher les tableaux et graphiques 
sur le site dédié au CoronaVirus (Covid19) de Politologue.com

Lien vers les données : https://coronavirus.politologue.com/
"""

import urllib.request
# Source : https://www.data.gouv.fr/fr/datasets/coronavirus-covid19-evolution-par-pays-et-dans-le-monde-maj-quotidienne/
url = 'https://coronavirus.politologue.com/data/coronavirus/coronacsv.aspx?format=csv&t=pays'
filename = 'data/sources/coronacsv.csv'
urllib.request.urlretrieve(url, filename)

"""
# Données nationales concernant l'épidémie de COVID19 

L'information officielle sur la progression de l'épidémie en France est assez fragmentée, 
et n'est presque jamais structurée sous forme de données.
L'objectif de ce jeu de données est de consolider l'information officielle, et de la rendre disponible 
dans des formats ouverts et aisément réutilisables (JSON, CSV…).

Lien vers les données : https://github.com/opencovid19-fr/data
"""

url = 'https://github.com/opencovid19-fr/data/raw/master/dist/chiffres-cles.csv'
filename = 'data/sources/chiffres-cle.csv'
urllib.request.urlretrieve(url, filename)

"""
# Données relatives à l'épidémie du covid-19 

Santé publique France a pour mission d'améliorer et de protéger la santé des populations. 
Durant la crise sanitaire liée à l'épidémie du covid-19, Santé publique France se charge de surveiller 
et comprendre la dynamique de l'épidémie, d'anticiper les différents scénarii et de mettre en place 
des actions pour prévenir et limiter la transmission de ce virus sur le territoire national.

Lien vers les données : https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/
"""
url = 'https://www.data.gouv.fr/fr/datasets/r/941ff2b4-ea24-4cdf-b0a7-655f2a332fb2'
filename = 'data/sources/sursaud-covid19-quotidien.xlsx'
urllib.request.urlretrieve(url, filename)

"""
# Données hospitalières relatives à l'épidémie de COVID-19 

Santé publique France a pour mission d'améliorer et de protéger la santé des populations. 
Durant la crise sanitaire liée à l'épidémie du COVID-19, Santé publique France se charge de surveiller 
et comprendre la dynamique de l'épidémie, d'anticiper les différents scénarii et de mettre en place des actions 
pour prévenir et limiter la transmission de ce virus sur le territoire national.

Lien vers les données : https://www.data.gouv.fr/fr/datasets/donnees-hospitalieres-relatives-a-lepidemie-de-covid-19/#_
"""

url = 'https://www.data.gouv.fr/fr/datasets/r/63352e38-d353-4b54-bfd1-f1b3ee1cabd7'
filename = 'data/sources/donnees-hospitalieres-covid19.csv'
urllib.request.urlretrieve(url, filename)

url = 'https://www.data.gouv.fr/fr/datasets/r/41b9bd2a-b5b6-4271-8878-e45a8902ef00'
filename = 'data/sources/donnees-hospitalieres-etablissements-covid19.csv'
urllib.request.urlretrieve(url, filename)

"""
Données relatives aux tests de dépistage de COVID-19 réalisés en laboratoire de ville 

Le présent jeu de données renseigne sur le nombre de tests de dépistage du COVID-19 réalisés par les laboratoires 
de villes, par département et par sexe :
- Nombre de tests réalisés ;
- Nombre de tests positifs.

Lien vers les données : : https://www.data.gouv.fr/fr/datasets/donnees-relatives-aux-tests-de-depistage-de-covid-19-realises-en-laboratoire-de-ville/
"""

url = 'https://www.data.gouv.fr/fr/datasets/r/b4ea7b4b-b7d1-4885-a099-71852291ff20'
filename = 'data/sources/donnees-tests-covid19-labo-quotidien.csv'
urllib.request.urlretrieve(url, filename)

"""
Données relatives aux transferts de patients atteints de COVID-19 
Pour répondre à la crise sanitaire et à la mise en tension du système de santé français, 
le gouvernement opère depuis le 18 mars 2020 des transferts de patients entre établissements hospitaliers. 
Ce dispositif a pour objectif de désengorger les établissements les plus touchés par l'épidémie de COVID-19.

Lien vers les données : https://www.data.gouv.fr/fr/datasets/donnees-relatives-aux-transferts-de-patients-atteints-de-covid-19/
"""

url = 'https://www.data.gouv.fr/fr/datasets/r/70cf1fd0-60b3-4584-b261-63fb2281359e'
filename = 'data/sources/transferts-patients-covid19.csv'
urllib.request.urlretrieve(url, filename)

/home/mfu/Documents/Projets/coronavirus


('data/sources/transferts-patients-covid19.csv',
 <http.client.HTTPMessage at 0x7fe3a9989590>)

In [12]:
import pandas as pd   

# CoronaVirus (Covid19) - Evolution par pays et dans le monde (maj quotidienne)

## Export en supprimant les 3 premières lignes
##coronapolitologue.csv

pd_coronapolitologue = pd.read_csv('data/sources/coronacsv.csv',  encoding='utf-8', sep=';', skiprows= 3 )
pd_coronapolitologue.to_csv("data/sources_traitees/coronapolitologue.csv", index=False, encoding='utf8', sep=';')


# Données nationales concernant l'épidémie de COVID19
## opencovid19fr.csv

pd_opencovid19fr = pd.read_csv('data/sources/chiffres-cle.csv', dtype={'cas_confirmes': float,'deces': float, 'reanimation': float}, encoding='utf-8', sep=',' )
pd_opencovid19fr.to_csv("data/sources_traitees/opencovid19fr.csv", index=False, encoding='utf8', sep=',')

# Données relatives à l'épidémie du covid-19

## sursaud-covid19-quotidien_dep.csv
pd_sursaud_dep = pd.read_excel('data/sources/sursaud-covid19-quotidien.xlsx', 
                          dtype={                        
'sursaud_cl_age_corona' : str,
'nbre_pass_corona' : float,
'nbre_pass_tot' : float,
'nbre_hospit_corona' : float,
'nbre_pass_corona_h' : float,
'nbre_pass_corona_f' : float,
'nbre_pass_tot_h' : float,
'nbre_pass_tot_f' : float,
'nbre_hospit_corona_h' : float,
'nbre_hospit_corona_f' : float,
'nbre_acte_corona' : float,
'nbre_acte_tot' : float,
'nbre_acte_corona_h' : float,
'nbre_acte_corona_f' : float,
'nbre_acte_tot_h' : float,
'nbre_acte_tot_f' : float,    }, sheet_name='dep', encoding='utf-8', sep=',' )
pd_sursaud_dep.to_csv("data/sources_traitees/sursaud-covid19-quotidien_dep.csv", index=False, encoding='utf8', sep=',')

## sursaud-covid19-quotidien_reg.csv
pd_sursaud_reg = pd.read_excel('data/sources/sursaud-covid19-quotidien.xlsx', 
                          dtype={                        
'sursaud_cl_age_corona' : str,
'nbre_pass_corona' : float,
'nbre_pass_tot' : float,
'nbre_hospit_corona' : float,
'nbre_pass_corona_h' : float,
'nbre_pass_corona_f' : float,
'nbre_pass_tot_h' : float,
'nbre_pass_tot_f' : float,
'nbre_hospit_corona_h' : float,
'nbre_hospit_corona_f' : float,
'nbre_acte_corona' : float,
'nbre_acte_tot' : float,
'nbre_acte_corona_h' : float,
'nbre_acte_corona_f' : float,
'nbre_acte_tot_h' : float,
'nbre_acte_tot_f' : float,    }, sheet_name='reg', encoding='utf-8', sep=',' )
pd_sursaud_reg.to_csv("data/sources_traitees/sursaud-covid19-quotidien_reg.csv", index=False, encoding='utf8', sep=',')

# Données hospitalières relatives à l'épidémie de COVID-19
pd_donneeshospitalierescovid19 = pd.read_csv('data/sources/donnees-hospitalieres-covid19.csv', encoding='utf-8', sep=';' )
pd_donneeshospitalierescovid19.to_csv("data/sources_traitees/donnees-hospitalieres-covid19.csv", index=False, encoding='utf8', sep=';')

# Données hospitalières des établissements relatives à l'épidémie de COVID-19
pd_donneeshospitalieresetablissementscovid19 = pd.read_csv('data/sources/donnees-hospitalieres-etablissements-covid19.csv', encoding='utf-8', sep=';' )
pd_donneeshospitalieresetablissementscovid19.to_csv("data/sources_traitees/donnees-hospitalieres-etablissements-covid19.csv", index=False, encoding='utf8', sep=';')

# Données relatives aux tests de dépistage de COVID-19 réalisés en laboratoire de ville
pd_donneestestscovid19laboquotidien = pd.read_csv('data/sources/donnees-tests-covid19-labo-quotidien.csv', encoding='utf-8', sep=';' )
pd_donneestestscovid19laboquotidien.to_csv("data/sources_traitees/donnees-tests-covid19-labo-quotidien.csv", index=False, encoding='utf8', sep=';')

# Données relatives aux transferts de patients atteints de COVID-19 
pd_transfertspatientscovid19 = pd.read_csv('data/sources/transferts-patients-covid19.csv', encoding='utf-8', sep=',' )
pd_transfertspatientscovid19.to_csv("data/sources_traitees/transferts-patients-covid19.csv", index=False, encoding='utf8', sep=',')


In [13]:
# Create empty table sante.coronapolitologue;

from sqlalchemy.engine.url import URL

from sqlalchemy import create_engine
db_uri = "postgres://visumarqueblanche:ARZRc9pxe3hyIDY1KFMw@visu-db.makina-corpus.net:5432"
engine = create_engine(db_uri)

# create table

engine.execute ("""
 
DROP TABLE IF EXISTS sante.coronapolitologue;

CREATE TABLE sante.coronapolitologue ( gid serial , -- Identifiant unique
 country_region character varying(255) , -- Pays des cas de coronavirus recensés
 province_state character varying(255) DEFAULT NULL , -- Province
 confirmed integer DEFAULT 0, -- Cas de coronavirus confirmés
 deaths integer DEFAULT 0, -- Décès liés au coronavirus
 recovered integer DEFAULT 0, -- Guérisons dues coronavirus
 rate_confirmed float DEFAULT 0, -- Taux de cas de coronavirus confirmés
 rate_deaths float DEFAULT 0, -- Taux de décès liés au coronavirus
 rate_recovered float DEFAULT 0, -- Taux de guérisons dues coronavirus
 confirmed_n_classe integer DEFAULT 1, -- Classes jenks pour les cas de coronavirus confirmés
 deaths_n_classe integer DEFAULT 1 , -- Classes jenks pour les décès liés au coronavirus
 recovered_n_classe integer DEFAULT 1 , -- Classes jenks pour les guérisons dues coronavirus
 latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
 longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
 date_actualisation date , -- Date de la mise à jour des données
 source character varying(255) DEFAULT 'https://coronavirus.politologue.com', -- Origine de la donnée
 ratepop_confirmed float DEFAULT 0, -- Taux de cas de coronavirus confirmés pour 100 000 habitants
 ratepop_deaths float DEFAULT 0, -- Taux de décès liés au coronavirus pour 100 000 habitants
 ratepop_recovered float DEFAULT 0, -- Taux de guérisons dues coronavirus pour 100 000 habitants
 variation_confirmed float DEFAULT 0, -- Variation journalière du nombre de cas de coronavirus confirmés
 variation_deaths float DEFAULT 0, -- Variation journalière du nombre de décès liés au coronavirus
 variation_recovered float DEFAULT 0, -- Variation journalière du nombre de guérisons dues coronavirus
 ratepop_confirmed_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de cas de coronavirus confirmés pour 100 000 habitants
 ratepop_deaths_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de décès liés au coronavirus pour 100 000 habitants
 ratepop_recovered_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de guérisons dues coronavirus pour 100 000 habitants
 variation_confirmed_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière du nombre de cas de coronavirus confirmés
 variation_deaths_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière journalière du nombre de décès liés au coronavirus
 variation_recovered_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière journalière du nombre de guérisons dues coronavirus
 
 geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
 
 CONSTRAINT coronapolitologue_pkey PRIMARY KEY (gid));


 """
)

engine.execute("""CREATE INDEX coronapolitologue_geom_idx ON sante.coronapolitologue USING GIST(geom);""")


<sqlalchemy.engine.result.ResultProxy at 0x7fe3cdfd96d0>

In [14]:
# create table sante.opencovid19fr

engine.execute ("""
 
DROP TABLE IF EXISTS sante.opencovid19fr;
  CREATE TABLE sante.opencovid19fr (
  gid serial , -- Identifiant unique
  date_actualisation varchar , -- Date de la mise à jour des données
  granularite character varying(255) , -- Granularité du recensement
  maille_code character varying(255)  , -- Code de la maille du recensement
  maille_nom character varying(255)  , -- Nom de la maille du recensement
  confirmes float DEFAULT 0, -- Total cumulé du nombre de cas confirmés
  cas_ehpad float DEFAULT 0, -- Total cumulé du nombre de cas en EHPAD
  confirmes_ehpad float DEFAULT 0, -- Total cumulé du nombre de cas confirmés en EHPAD
  cas_possibles_ehpad float DEFAULT 0, -- Total cumulé du nombre de cas possibles en EHPAD
  deces float DEFAULT 0, -- Total cumulé du nombre de décès
  deces_ehpad float DEFAULT 0, -- Total cumulé du nombre de décès en EHPAD (si indiqué)
  reanimation float DEFAULT 0, -- Nombre de personnes en réanimation le jour du bulletin
  hospitalises float DEFAULT 0, -- Nombre de personnes hospitalisées le jour du bulletin
  gueris float DEFAULT 0, -- Total cumulé du nombre de personnes guéries (sorties de l'hôpital)
  depistes float DEFAULT 0, -- Cas dépistés dus coronavirus 
  source_nom character varying(255) , -- Origine de la donnée
  source_url text , -- URL de la source
  source_archive text , -- Archive source
  source_type character varying(255) , -- Type de la source
  confirmes_n_classe integer DEFAULT 1, -- Classes jenks pour le total cumulé du nombre de cas confirmés
  cas_ehpad_n_classe integer DEFAULT 1, -- Classes jenks pour le total cumulé du nombre de cas en EHPAD
  confirmes_ehpad_n_classe integer DEFAULT 1, -- Classes jenks pour le total cumulé du nombre de cas confirmés en EHPAD
  cas_possibles_ehpad_n_classe integer DEFAULT 1, -- Classes jenks pour le total cumulé du nombre de décès
  deces_n_classe integer DEFAULT 1 , -- Classes jenks pour les décès liés au coronavirus
  deces_ehpad_n_classe integer DEFAULT 1 , -- Classes jenks pour le total cumulé du nombre de décès en EHPAD (si indiqué)
  reanimation_n_classe integer DEFAULT 1 , -- Classes jenks pour le nnombre de personnes en réanimation le jour du bulletin
  hospitalises_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de personnes hospitalisées le jour du bulletin
  gueris_n_classe integer DEFAULT 1 , -- Classes jenks pour le total cumulé du nombre de personnes guéries (sorties de l'hôpital)
  depistes_n_classe integer DEFAULT 1 , -- Classes jenks pour le total cumulé du nombre de personnes dépistées (testées par PCR)
  latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
  longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
  geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
  
  CONSTRAINT opencovid19fr_pkey PRIMARY KEY (gid));


 """
)

engine.execute("""CREATE INDEX opencovid19fr_geom_idx ON sante.opencovid19fr USING GIST(geom);""")



<sqlalchemy.engine.result.ResultProxy at 0x7fe3cdfd9d50>

In [15]:
# Create empty table sante.sursaud_covid19_quotidien_dep;

engine.execute ("""DROP TABLE IF EXISTS sante.sursaud_covid19_quotidien_dep;

CREATE TABLE sante.sursaud_covid19_quotidien_dep ( 
 gid serial , -- Identifiant unique
 code_dep character varying(255) , -- Pays des cas de coronavirus recensés
 date_actualisation character varying(255) , -- Date de la mise à jour des données
 sursaud_cl_age_corona varchar, -- Tranche d'âge des patients
 nbre_pass_corona float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19 
 nbre_pass_tot float DEFAULT 0, -- Nombre de passages aux urgences total 
 nbre_hospit_corona float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 
 nbre_pass_corona_h float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19  - Hommes
 nbre_pass_corona_f float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19  - Femmes
 nbre_pass_tot_h float DEFAULT 0, -- Nombre de passages aux urgences total - Hommes
 nbre_pass_tot_f float DEFAULT 0, -- Nombre de passages aux urgences total - Femmes
 nbre_hospit_corona_h float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19  - Hommes
 nbre_hospit_corona_f float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - Femmes
 nbre_acte_corona float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19
 nbre_acte_tot float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total
 nbre_acte_corona_h float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - Hommes
 nbre_acte_corona_f float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - Femmes
 nbre_acte_tot_h float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total - Hommes
 nbre_acte_tot_f float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total - Femmes
 source_nom character varying(255) DEFAULT 'https://www.santepubliquefrance.fr/surveillance-syndromique-sursaud-R', -- Origine de la donnée
 source_url character varying(255) DEFAULT 'https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/', -- Origine de la donnée
 nbre_pass_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19  
 nbre_hospit_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 
 nbre_acte_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19
 nbre_pass_corona_a_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 A
 nbre_hospit_corona_a_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 A
 nbre_acte_corona_a_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 A
 nbre_pass_corona_b_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 B
 nbre_hospit_corona_b_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 B
 nbre_acte_corona_b_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 B
 nbre_pass_corona_c_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 C
 nbre_hospit_corona_c_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 C
 nbre_acte_corona_c_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 C
 nbre_pass_corona_d_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 D
 nbre_hospit_corona_d_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 D
 nbre_acte_corona_d_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 D
 nbre_pass_corona_e_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 E
 nbre_hospit_corona_e_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 E
 nbre_acte_corona_e_n_classe integer DEFAULT 1 ,-- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 E
 latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
 longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
 geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
 
 CONSTRAINT sursaud_covid19_quotidien_dep_pkey PRIMARY KEY (gid));
 
 """
)

engine.execute("""CREATE INDEX sursaud_covid19_quotidien_dep_geom_idx ON sante.sursaud_covid19_quotidien_dep USING GIST(geom);""")


<sqlalchemy.engine.result.ResultProxy at 0x7fe3aa1883d0>

In [16]:
# Create empty table sante.sursaud_covid19_quotidien_reg;

engine.execute ("""
DROP TABLE IF EXISTS sante.sursaud_covid19_quotidien_reg;
CREATE TABLE sante.sursaud_covid19_quotidien_reg ( 
 gid serial , -- Identifiant unique
 code_reg character varying(255) , -- Pays des cas de coronavirus recensés
 date_actualisation character varying(255) , -- Date de la mise à jour des données
 sursaud_cl_age_corona varchar, -- Tranche d'âge des patients
 nbre_pass_corona float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19 
 nbre_pass_tot float DEFAULT 0, -- Nombre de passages aux urgences total 
 nbre_hospit_corona float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 
 nbre_pass_corona_h float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19  - Hommes
 nbre_pass_corona_f float DEFAULT 0, -- Nombre de passages aux urgences pour suspicion de COVID-19  - Femmes
 nbre_pass_tot_h float DEFAULT 0, -- Nombre de passages aux urgences total - Hommes
 nbre_pass_tot_f float DEFAULT 0, -- Nombre de passages aux urgences total - Femmes
 nbre_hospit_corona_h float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19  - Hommes
 nbre_hospit_corona_f float DEFAULT 0, -- Nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - Femmes
 nbre_acte_corona float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19
 nbre_acte_tot float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total
 nbre_acte_corona_h float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - Hommes
 nbre_acte_corona_f float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - Femmes
 nbre_acte_tot_h float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total - Hommes
 nbre_acte_tot_f float DEFAULT 0, -- Nombres d'actes médicaux SOS Médecins total - Femmes
 source_nom character varying(255) DEFAULT 'https://www.santepubliquefrance.fr/surveillance-syndromique-sursaud-R', -- Origine de la donnée
 source_url character varying(255) DEFAULT 'https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/', -- Origine de la donnée
 nbre_pass_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19  
 nbre_hospit_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 
 nbre_acte_corona_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19
 nbre_pass_corona_a_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 - moins de 15 ans  
 nbre_hospit_corona_a_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - moins de 15 ans 
 nbre_acte_corona_a_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - moins de 15 ans
 nbre_pass_corona_b_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 - 15-44 ans
 nbre_hospit_corona_b_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - 15-44 ans
 nbre_acte_corona_b_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - 15-44 ans
 nbre_pass_corona_c_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 - 45-64 ans
 nbre_hospit_corona_c_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - 45-64 ans
 nbre_acte_corona_c_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - 45-64 ans
 nbre_pass_corona_d_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 - 65-74 ans
 nbre_hospit_corona_d_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - 65-74 ans
 nbre_acte_corona_d_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - 65-74 ans
 nbre_pass_corona_e_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre de passages aux urgences pour suspicion de COVID-19 - 75 ans et plus
 nbre_hospit_corona_e_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombre d'hospitalisations parmi les passages aux urgences pour suspicion de COVID-19 - 75 ans et plus
 nbre_acte_corona_e_n_classe integer DEFAULT 1 , -- Classes jenks pour le nombres d'actes médicaux SOS Médecins pour suspicion de COVID-19 - 75 ans et plus
 latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
 longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
 geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
 
 CONSTRAINT sursaud_covid19_quotidien_reg_pkey PRIMARY KEY (gid));
 
 """
)

engine.execute("""CREATE INDEX sursaud_covid19_quotidien_reg_geom_idx ON sante.sursaud_covid19_quotidien_reg USING GIST(geom);""")


<sqlalchemy.engine.result.ResultProxy at 0x7fe3aa3c0510>

In [17]:
# create table sante.donneeshospitalierescovid19

engine.execute ("""
 
DROP TABLE IF EXISTS sante.donneeshospitalierescovid19;
  CREATE TABLE sante.donneeshospitalierescovid19 (
  gid serial , -- Identifiant unique
  dep character varying(255) , -- Code de département
  sexe character varying(5) , -- Sexe
  jour character varying(255), -- Date de notification
  hosp integer DEFAULT NULL , -- Nombre de personnes actuellement hospitalisées
  rea integer DEFAULT NULL , -- Nombre de personnes actuellement en réanimation ou soins intensifs
  rad integer DEFAULT NULL , -- Nombre cumulé de personnes retournées à domicile
  dc integer DEFAULT NULL , -- Nombre cumulé de personnes décédées à l'hôpital
  nom_dep character varying(255) , -- Département
  source_nom character varying(255) DEFAULT 'Santé Publique France' , -- Origine de la donnée
  source_url text DEFAULT 'https://www.data.gouv.fr/fr/datasets/donnees-hospitalieres-relatives-a-lepidemie-de-covid-19/' , -- URL de la source
  hosp_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre total de personnes actuellement hospitalisées
  hosp_f_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre de femmes actuellement hospitalisées
  hosp_h_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre d'hommes actuellement hospitalisés
  rea_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre total de personnes actuellement en réanimation ou soins intensifs
  rea_f_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre de femmes actuellement en réanimation ou soins intensifs
  rea_h_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre d'hommes actuellement en réanimation ou soins intensifs
  rad_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé de personnes retournées à domicile
  rad_f_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé de femmes retournées à domicile
  rad_h_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé d'hommes retournés à domicile
  dc_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé de personnes décédées à l'hôpital
  dc_f_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé de femmes décédées à l'hôpital
  dc_h_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé d'hommes décédées à l'hôpital
  rea_variation integer, -- Variation journalière pour le nombre de personnes actuellement en réanimation ou soins intensifs
  rad_variation integer, -- Variation journalière pour le nombre cumulé de personnes retournées à domicile
  hosp_variation integer, -- Variation journalière pour le nombre de personnes actuellement hospitalisées
  dc_variation integer, -- Variation journalière pour le nombre cumulé de personnes décédées à l'hôpital
  rea_variation_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière pour le nombre cumulé de personnes décédées à l'hôpital
  rad_variation_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière pour le nombre cumulé de personnes décédées à l'hôpital
  hosp_variation_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière pour le nombre cumulé de personnes décédées à l'hôpital
  dc_variation_n_classe integer DEFAULT 1, -- Classes jenks pour la variation journalière pour le nombre cumulé de personnes décédées à l'hôpital
  tx_rea integer, -- Taux de personnes actuellement en réanimation ou soins intensifs pour 100000 habitants
  tx_rad integer, -- Taux de personnes retournées à domicile pour 100000 habitants
  tx_hosp integer, -- Taux de personnes actuellement hospitalisées pour 100000 habitants
  tx_dc integer, -- Taux de personnes décédées à l'hôpital pour 100000 habitants
  tx_rea_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de personnes actuellement en réanimation ou soins intensifs pour 100000 habitants
  tx_rad_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de personnes retournées à domicile pour 100000 habitants
  tx_hosp_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de personnes actuellement hospitalisées pour 100000 habitants
  tx_dc_n_classe integer DEFAULT 1, -- Classes jenks pour le taux de personnes décédées à l'hôpital pour 100000 habitants
  latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
  longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
  geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
  
  CONSTRAINT donneeshospitalierescovid19_pkey PRIMARY KEY (gid));
  
  CREATE INDEX donneeshospitalierescovid19_geom_idx ON sante.donneeshospitalierescovid19 USING GIST(geom);

 """
)

# create table sante.donneeshospitalieresetablissementscovid19

engine.execute ("""
 
DROP TABLE IF EXISTS sante.donneeshospitalieresetablissementscovid19;
  CREATE TABLE sante.donneeshospitalieresetablissementscovid19 (
  gid serial , -- Identifiant unique
  dep character varying(255) , -- Code de département
  jour character varying(255), -- Date de notification
  nb integer DEFAULT NULL , -- Nombre cumulé de services hospitaliers ayant déclaré au moins un cas
  nom_dep character varying(255) , -- Département
  source_nom character varying(255) DEFAULT 'Santé Publique France' , -- Origine de la donnée
  source_url text DEFAULT 'https://www.data.gouv.fr/fr/datasets/donnees-hospitalieres-relatives-a-lepidemie-de-covid-19/' , -- URL de la source
  nb_n_classe integer DEFAULT 1, -- Classes jenks pour le nombre cumulé de services hospitaliers ayant déclaré au moins un cas
  latitude numeric GENERATED ALWAYS AS (ST_X(geom)) STORED, --Latitude
  longitude numeric GENERATED ALWAYS AS (ST_Y(geom)) STORED, -- Longitude
  geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
  
  CONSTRAINT donneeshospitalieresetablissementscovid19_pkey PRIMARY KEY (gid));
  
  CREATE INDEX donneeshospitalieresetablissementscovid19_geom_idx ON sante.donneeshospitalieresetablissementscovid19 USING GIST(geom);

 """
)


<sqlalchemy.engine.result.ResultProxy at 0x7fe3aa3c0190>

In [18]:
# create table sante.donneestestscovid19laboquotidien

engine.execute ("""
 
DROP TABLE IF EXISTS sante.donneestestscovid19laboquotidien;
CREATE TABLE sante.donneestestscovid19laboquotidien (
gid serial , -- Identifiant unique
dep character varying(255) , -- Code de département
jour character varying(255) , -- Date de notification 
clage_covid character varying(255) DEFAULT NULL, -- Tranche d'âge des patients 
nb_test integer, -- Nombre de tests pour recherche de SARS-CoV-2
nb_pos integer, -- Nombre de tests positifs pour recherche de SARS-CoV-2
nb_test_h integer, -- Nombre de tests pour recherche de SARS-CoV-2 - Hommes
nb_pos_h integer, -- Nombre de tests positifs pour recherche de SARS-CoV-2 - Hommes
nb_test_f integer, -- Nombre de tests pour recherche de SARS-CoV-2 - Femmes
nb_pos_f integer, -- Nombre de tests positifs pour recherche de SARS-CoV-2 - Femmes
nom_dep character varying(255) , -- Département
source_nom character varying(255) DEFAULT 'Santé Publique France'::character varying, -- Origine de la donnée
source_url text DEFAULT 'https://www.data.gouv.fr/fr/datasets/donnees-relatives-aux-tests-de-depistage-de-covid-19-realises-en-laboratoire-de-ville/'::text,-- URL de la source
nb_test_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests pour recherche de SARS-CoV-2
nb_pos_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests positifs pour recherche de SARS-CoV-2
nb_test_h_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests pour recherche de SARS-CoV-2 - Hommes
nb_pos_h_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests positifs pour recherche de SARS-CoV-2 - Hommes
nb_test_f_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests pour recherche de SARS-CoV-2 - Femmes
nb_pos_f_n_classe integer DEFAULT 1,-- Classes jenks pour le nombre de tests positifs pour recherche de SARS-CoV-2 - Femmes
pourcentage_testpos integer GENERATED ALWAYS AS (
CASE
    WHEN (((nb_pos * 100) / NULLIF(nb_test, 0)) IS NULL) THEN 0
    ELSE ((nb_pos * 100) / NULLIF(nb_test, 0))
END) STORED,-- Taux de tests positif pour recherche de SARS-CoV-2
pourcentage_testpos_n_classe integer DEFAULT 1,-- Classes jenks pour le taux de tests positif pour recherche de SARS-CoV-2
latitude numeric GENERATED ALWAYS AS (st_x(geom)) STORED,-- Latitude
longitude numeric GENERATED ALWAYS AS (st_y(geom)) STORED,-- Longitude
geom geometry(Point,4326) DEFAULT NULL , -- Géométrie du point en EPSG 4326
  
  CONSTRAINT donneestestscovid19laboquotidien_pkey PRIMARY KEY (gid));
  
  CREATE INDEX donneestestscovid19laboquotidien_geom_idx ON sante.donneestestscovid19laboquotidien USING GIST(geom);

 """
)

<sqlalchemy.engine.result.ResultProxy at 0x7fe3a9860e10>

In [19]:
# create table sante.transfertspatientscovid19

engine.execute ("""

DROP TABLE IF EXISTS sante.transfertspatientscovid19;
CREATE TABLE sante.transfertspatientscovid19 (
gid serial , -- Identifiant unique
debut_transfert DATE , -- Date de début du transfert
fin_transfert DATE , -- Date de fin du transfert
type_vecteur character varying(255) DEFAULT NULL, -- Moyen de transport utilisé pour le transfert
region_depart character varying(255), -- Région de départ
region_arrivee character varying(255), -- Région d'arrivée
pays_arrivee character varying(255), -- Pays d'arrivée (si en dehors de la France)
nombre_patients_transferes integer, -- Effectifs de patients transférés
geom_depart geometry(Point,4326) DEFAULT NULL , -- Géométrie du point de depart en EPSG 4326
geom_arrivee geometry(Point,4326) DEFAULT NULL , -- Géométrie du point d'arrivée en EPSG 4326
    
  CONSTRAINT transfertspatientscovid19_pkey PRIMARY KEY (gid));
  
  CREATE INDEX transfertspatientscovid19_geom_depart_idx ON sante.transfertspatientscovid19 USING GIST(geom_depart);

 """
)

<sqlalchemy.engine.result.ResultProxy at 0x7fe3aa188cd0>

In [20]:
# Exécuter un fichier bash
## Méthode 1

#import subprocess

#subprocess.Popen(['sh','/home/mfu/Documents/Projets/coronavirus//scripts/executesql.sh'])

## Méthode 2
### change le répertoire courrant
%cd scripts/ 
### affiche les fichiers/dossiers à l'intérieur
!ls
### exécute le script bash
! bash executesql.sh
### supprime les données sources et sources traitées
%cd /home/mfu/Documents/Projets/coronavirus/data/sources
%rm *.csv
%rm *.xlsx
%cd /home/mfu/Documents/Projets/coronavirus/data/sources_traitees
%rm *.csv
### revient à la racine du projet
%cd -

/home/mfu/Documents/Projets/coronavirus/scripts
00_importcsv.sql
10_update_coronapolitologue.sql
20_update_opencovidfr.sql
30_update_sursaud_covid19_quotidien_dep.sql
40_update_sursaud_covid19_quotidien_reg.sql
50_update_donneeshospitalierescovid19.sql
60_update_donneeshospitalieresetablissementscovid19.sql
70_donneestestscovid19laboquotidien.sql
80_donneestestscovid19laboquotidien.sql
90_createupdate_caresteouvert.sql
executesql.sh
executesql.sh: ligne 3: Lancement : commande introuvable
TRUNCATE TABLE
COPY 10961
TRUNCATE TABLE
COPY 7989
TRUNCATE TABLE
COPY 37572
TRUNCATE TABLE
COPY 7440
TRUNCATE TABLE
COPY 12123
TRUNCATE TABLE
COPY 4040
TRUNCATE TABLE
COPY 26664
TRUNCATE TABLE
COPY 26
UPDATE 10870
UPDATE 10870
UPDATE 203
psql:/home/mfu/Documents/Projets/coronavirus/scripts/10_update_coronapolitologue.sql:140: NOTICE:  kmeans_init: there are at least 24 duplicate inputs, number of output clusters may be less than you requested
UPDATE 3964
psql:/home/mfu/Documents/Projets/coronavirus/s

psql:/home/mfu/Documents/Projets/coronavirus/scripts/40_update_sursaud_covid19_quotidien_reg.sql:664: NOTICE:  kmeans_init: there are at least 5 duplicate inputs, number of output clusters may be less than you requested
UPDATE 1211
psql:/home/mfu/Documents/Projets/coronavirus/scripts/40_update_sursaud_covid19_quotidien_reg.sql:713: NOTICE:  kmeans_init: there are at least 3 duplicate inputs, number of output clusters may be less than you requested
UPDATE 1249
psql:/home/mfu/Documents/Projets/coronavirus/scripts/40_update_sursaud_covid19_quotidien_reg.sql:758: NOTICE:  kmeans_init: there are at least 3 duplicate inputs, number of output clusters may be less than you requested
UPDATE 1459
psql:/home/mfu/Documents/Projets/coronavirus/scripts/40_update_sursaud_covid19_quotidien_reg.sql:804: NOTICE:  kmeans_init: there are at least 3 duplicate inputs, number of output clusters may be less than you requested
UPDATE 642
psql:/home/mfu/Documents/Projets/coronavirus/scripts/40_update_sursaud_co