[Infra] Version 2.0.0b16 #1678

d116626 · 2023-08-30T13:05:21Z

Version 2.0.0b16 - Release Changelog

Added

Now divided the package into four extras for easier installation:
- pip install basedosdados: Installs the core package.
- pip install basedosdados[upload]: Installs modules for interacting with the backend.
- pip install basedosdados[avro]: Installs modules for working with Avro.
- pip install basedosdados[cli]: Installs modules for using the command-line interface.
- pip install basedosdados[all]: Installs all modules.
Added suport to biglake tables
Added connection_id property to external data configuration.
Implemented automatic management of BigQuery connection.
Added service_account property to Connection.
Introduced backend class for handling interaction with GraphQL.
Added support for CSV delimiter customization with csv_delimiter
Added new parameter csv_skip_leading_rows and csv_allow_jagged_rows for handling CSV parsing.
Add new scopes to credentials: drive and bigquery

Fixed

Fixed datatype issues by adding connection ID for external configuration.
Improved error handling and optional setting of BigQuery permissions.

Changed

Refactored dependency management for improved performance.
Cleaned up code and linting issues.

Removed

Removed unnecessary dependencies and compressed R package.

Deprecated

Deprecated usage of YAML dependency from metadata handling.
CLI suport to upload methods

To-do

Mapeamento dos YAML no pacote

Config
- 1. Alterar o template do config.toml
- 2. Alterar os templates da configuração
- 3. Alterar, se necessário, o processo de inicialização
Dataset
- 1. init: cria um objeto Metadata em self.metadata
- 2. dataset_config: carrega os metadados do yaml
- 3. _setup_dataset_object: atualizar a descrição (.txt) para o bigquery
- 4. _write_readme_file: gera o [README.md](http://README.md)
- 5. init: cria ou substitui o arquivo yaml do dataset
Table
- 1. init: cria um objeto Metadata em self.metadata
- 2. table_config: carrega os metadados do yaml
- 3. _is_partitioned: verifica se a tabela é particionada pelos dados do yaml (campos de particionamento)
- 4. _load_schema: gera o json do schema da tabela e envia para o BQ
- 5. _make_publish_sql: cria o arquivo publish.sql baseado no yaml e salva na pasta da tabela
- 6. _make_template: cria o arquivo yaml e o publish.sql
- 7. update_columns: carrega os metadados do arquivo yaml, lê a planilha de arquitetura (google sheets ou arquivo csv, xls, xlsx, xlsm, xlsb, odf, ods, odt), insere em cols e salva o arquivo yaml com as colunas
- 8. init: gera os arquivos de configuração (table_config.yaml e publish.sql) com base em um sample dos arquivos de dados e, caso exista uma planilha de arquitetura, atualiza as colunas com base nela
- 9. create: cria a tabela no BQ e chama o init para gerar os arquivos de configuração
- 10. update: atualiza o schema do BQ, usando os metadados para renderizar o arquivo .txt de descrição da tabela
- 11. publish: cria a tabela em produção no BQ, usando o publish.sql para criar a view atual.
Base
- 1. _load_yaml: método responsável por carregar os dados dos arquivos yaml

Workflow

Table.create
- staging
  - publish.sql: usa dados do csv para criar a view em que todas as colunas são string
  - schema-staging.json: td como string
Se tabela n existe na API
- raise: direciona para formulário de criação de metadados
Se tabela já existe,
- Usa dados da API para preencher os arquivos necessários
  - atualiza publish.sql
  - atualiza schema-staging.json
  - cria schema-prod.json
  - cria table_description.txt

….7.0

This reverts commit 0cba449.

….0.0

lucascr91 and others added 30 commits November 3, 2022 16:57

[infra] Version 1.7.0 python-package

77540ab

[infra] fix update_columns test

b0f5dfe

[infra] remove unused import

17ba1ba

[infra] add to_partition utility function

a3f71df

[infra] add test for to_partitions

91ea441

Merge branch 'master' of https://github.com/basedosdados/mais into v1…

c51b4aa

….7.0

[infra] pump package version 1.6.9-b2

0cba449

[infra] add break_file feature

6aaa1b1

Revert "[infra] pump package version 1.6.9-b2"

bef2953

This reverts commit 0cba449.

feat: add connection_id to external data configuration

2640684

fix(Datatype): add connection id for external configuration

dffb8ab

feat: add automatic management of BQ connection

cbfdeca

chore: fix linting issues

d10cee8

feat: add test folder to gitignore

69555f0

feat: release beta version

4ca854f

feat(Connection): add service_account property

61a6f88

feat(Base): add IAM stuff

34fe6eb

chore: fix linting issues

5122127

feat: automatic granting roles to BigLake service account

e701d06

feat: better error handling, set biglake permissions is now optional

43f7913

feat: release beta version

39e700a

Merge branch 'master' into feat/add-biglake-tables

8294db7

chore: modify log message

1f4ab2e

Merge branch 'master' into feat/add-biglake-tables

99c0911

Merge branch 'master' into feat/add-biglake-tables

69ed7ef

Merge branch 'master' into feat/add-biglake-tables

7a2536e

chore: make all partitions string

d2d6b28

Merge branch 'master' into feat/add-biglake-tables

e468f5d

Merge branch 'master' into feat/add-biglake-tables

2f61e97

Merge branch 'master' into v1.7.0

278cbda

mergify bot and others added 2 commits August 28, 2023 16:59

Merge branch 'master' into feat/remove_yamls

146afc2

feat: create branch v2.0.0

7dca3b6

d116626 mentioned this pull request Aug 30, 2023

[Infra] Version 2.0.0b13 #1608

Closed

36 tasks

Merge branch 'master' into v2.0.0

c69f84d

d116626 self-assigned this Sep 6, 2023

d116626 added 2 commits September 12, 2023 18:11

fix: add csv delimiter to schema

2e856e9

Merge branch 'v2.0.0' of https://github.com/basedosdados/mais into v2…

50cd8ec

….0.0

d116626 changed the title ~~[Infra] Version 2.0.0b13~~ [Infra] Version 2.0.0b14 Sep 12, 2023

mergify bot and others added 3 commits September 21, 2023 15:27

Merge branch 'master' into v2.0.0

125f28f

Merge branch 'master' into v2.0.0

0635373

feat: expand credential scope to drive and bq

61d2655

d116626 changed the title ~~[Infra] Version 2.0.0b14~~ [Infra] Version 2.0.0b15 Oct 3, 2023

This was referenced Oct 26, 2023

Atualizar requerimentos do Python #1684

Closed

[infra] [python] [v2] Revisar testes do pacote Python #1691

Open

[infra] [python] [v2] Revisar documentação do pacote Python #1692

Open

rdahis added the enhancement New feature or request label Nov 8, 2023

mergify bot and others added 8 commits January 8, 2024 00:59

Merge branch 'master' into v2.0.0

bb26637

Merge branch 'master' into v2.0.0

84b8b5c

Merge branch 'master' into v2.0.0

ea62797

chore: start cleaning tests

14c0ee9

Merge branch 'master' into v2.0.0

653f256

Merge branch 'master' into v2.0.0

ed85bb5

Merge branch 'master' into v2.0.0

dab0051

chore: add timeout to pypi warning

4562113

d116626 changed the title ~~[Infra] Version 2.0.0b15~~ [Infra] Version 2.0.0b16 Apr 2, 2024

vncsna mentioned this pull request Apr 8, 2024

Listar dependências do pacote basedosdados/backend#582

Closed

laura-l-amaral mentioned this pull request Apr 10, 2024

[BUG] list_datasets() nos pacotes está quebrada #1699

Open

vncsna approved these changes May 2, 2024

View reviewed changes

vncsna merged commit 246943c into master May 2, 2024
1 check passed

vncsna deleted the v2.0.0 branch May 2, 2024 21:55

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Infra] Version 2.0.0b16 #1678

[Infra] Version 2.0.0b16 #1678

d116626 commented Aug 30, 2023 •

edited

Loading

[Infra] Version 2.0.0b16 #1678

[Infra] Version 2.0.0b16 #1678

Conversation

d116626 commented Aug 30, 2023 • edited Loading

Version 2.0.0b16 - Release Changelog

Added

Fixed

Changed

Removed

Deprecated

To-do

Mapeamento dos YAML no pacote

Workflow

d116626 commented Aug 30, 2023 •

edited

Loading