Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Optimiser le traitement convert_spire_vessels_to_spire_ais_data.py #163

Closed
njouanin opened this issue Apr 8, 2024 · 4 comments
Closed

Comments

@njouanin
Copy link
Collaborator

njouanin commented Apr 8, 2024

Le traitement convert_spire_vessels_to_spire_ais_data.py convertit les données de l'ancienne table spire_vessel_positions vers le nouveau modèle spire_ais_data. Le traitement s'exécute sur l'ensemble des données et peut donc être très long à tourner.
Propositions à creuser:

  • possibilités d'optimisation des traitements ?
  • traitement par lot permettant de limiter la durée du traitement (par exemple nombre max d'enregistrements ou intervalle de dates).
@rv2931
Copy link
Collaborator

rv2931 commented Apr 8, 2024

ok. j'ai bien récupéré le dump
J'ai réussi à le restaurer (postgres 16 et user Bloom_user avec une majuscule)
Je vais regarder pour faire des intervales de dates dans un premier temps (genre Airflow et option backfill --start 2020-01-01 --end 2024-08-01 et périodicité de 15 minutes ou 24h par exemple)

@rv2931
Copy link
Collaborator

rv2931 commented Apr 8, 2024

ah ouay... 43 millions de lignes sur 1 an seulement

juste pour info y a une politique d'archivage/purge prévue côté prod ?

@njouanin
Copy link
Collaborator Author

njouanin commented Apr 9, 2024

actuellement non, mais il faudrait y penser pour la V2 effectivement. C'est sur que les données de la table spire_ais_data n'ont pas besoin d'y rester une fois qu'elle auront été traitées. J'avais pensé à un traitement régulier d'export (format parquet par exemple) et de purge.

@njouanin
Copy link
Collaborator Author

Obsolète

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants