In [1]:
import csv

desired_columns = ["Ano", "Sigla da Unidade da Federação", "Nome da Unidade da Federação", "Código do Município", "Nome do Município","Produto Interno Bruto","Produto Interno Bruto per capita"]

with open('../data/PIB_10-21.csv', 'r') as infile:
    reader = csv.DictReader(infile)

    with open('filtered_pib_municipio_data.csv', 'w') as outfile:
        writer = csv.DictWriter(outfile, fieldnames=desired_columns)

        writer.writeheader()

        for row in reader:
            filtered_row = {column: row[column] for column in desired_columns}
            writer.writerow(filtered_row)

In [5]:
import csv

def combine_and_filter_csv(files, desired_columns, output_file):
  with open(output_file, 'w') as outfile:
    writer = csv.DictWriter(outfile, fieldnames=desired_columns)
    writer.writeheader()
    for file in files:
      with open(file, 'r') as infile:
        reader = csv.DictReader(infile)
        for row in reader:
          filtered_row = {column: row[column] for column in desired_columns}
          writer.writerow(filtered_row)

files = ['../data/PIB_02-09.csv', '../data/PIB_10-21.csv']  
desired_columns = ["Ano", "Sigla da Unidade da Federação", "Nome da Unidade da Federação", "Código do Município", "Nome do Município",
                   "Produto Interno Bruto", "Produto Interno Bruto per capita"]
output_file = 'combined_filtered_pib_municipio_data.csv'

combine_and_filter_csv(files, desired_columns, output_file)


In [7]:
import csv
import csv

def calculate_sums_by_ano_uf(file, desired_columns, output_file):

    with open(output_file, 'w', newline='') as outfile:
        writer = csv.DictWriter(outfile, fieldnames=['Ano', 'Sigla da Unidade da Federação', 'Soma Produto Interno Bruto', 'Soma Produto Interno Bruto per capita'])
        writer.writeheader()

        with open(file, 'r', newline='') as infile:
            reader = csv.DictReader(infile)

            sums_by_ano_uf = {}

            for row in reader:
                ano = row['Ano']
                uf = row['Sigla da Unidade da Federação']
                # Clean the PIB and PIB per capita strings before converting to float
                pib = float(row['Produto Interno Bruto'].replace(',', '').replace(' ', '').replace('-', '0')) 
                pib_per_capita = float(row['Produto Interno Bruto per capita'].replace(',', '').replace(' ', '').replace('-', '0'))

                if (ano, uf) not in sums_by_ano_uf:
                    sums_by_ano_uf[(ano, uf)] = {'Soma Produto Interno Bruto': 0, 'Soma Produto Interno Bruto per capita': 0}

                sums_by_ano_uf[(ano, uf)]['Soma Produto Interno Bruto'] += pib
                sums_by_ano_uf[(ano, uf)]['Soma Produto Interno Bruto per capita'] += pib_per_capita

            for (ano, uf), sums in sums_by_ano_uf.items():
                writer.writerow({
                    'Ano': ano,
                    'Sigla da Unidade da Federação': uf,
                    'Soma Produto Interno Bruto': sums['Soma Produto Interno Bruto'],
                    'Soma Produto Interno Bruto per capita': sums['Soma Produto Interno Bruto per capita']
                })

file = 'combined_filtered_pib_municipio_data.csv'  
desired_columns = ["Ano", "Sigla da Unidade da Federação", "Produto Interno Bruto", "Produto Interno Bruto per capita"]
output_file = 'uf_pib_ano.csv'

calculate_sums_by_ano_uf(file, desired_columns, output_file)



In [15]:
#highest PIBC per year
import csv

data = []
with open('pib_municipio_sums_by_ano_uf.csv', 'r') as file:
  reader = csv.reader(file)
  headers = next(reader)
  for row in reader:
    data.append(row)

with open('highest_pibc_by_year.csv', 'w', newline='') as output_file:
  writer = csv.writer(output_file)

  ano_col = headers.index('Ano')
  uf_col = headers.index('Sigla da Unidade da Federação')
  spbc_col = headers.index('Soma Produto Interno Bruto per capita')

  writer.writerow(['Ano', 'UF', 'PIBC'])

  highest_spbc_by_year = {}

  for row in data:
    ano = int(row[ano_col]) 
    uf = row[uf_col]
    spbc = float(row[spbc_col])

    if ano not in highest_spbc_by_year:
      highest_spbc_by_year[ano] = (uf, spbc)
    else:
      if spbc > highest_spbc_by_year[ano][1]:
        highest_spbc_by_year[ano] = (uf, spbc)

  for ano, (uf, spbc) in highest_spbc_by_year.items():
    writer.writerow([ano, uf, spbc])



In [16]:
#highest pib per year
import csv

data = []
with open('pib_municipio_sums_by_ano_uf.csv', 'r') as file:
  reader = csv.reader(file)
  headers = next(reader)
  for row in reader:
    data.append(row)

with open('highest_pib_by_year.csv', 'w', newline='') as output_file:
  writer = csv.writer(output_file)

  ano_col = headers.index('Ano')
  uf_col = headers.index('Sigla da Unidade da Federação')
  spbc_col = headers.index('Soma Produto Interno Bruto')

  writer.writerow(['Ano', 'UF', 'PIB'])

  highest_spbc_by_year = {}

  for row in data:
    ano = int(row[ano_col]) 
    uf = row[uf_col]
    spbc = float(row[spbc_col])

    if ano not in highest_spbc_by_year:
      highest_spbc_by_year[ano] = (uf, spbc)
    else:
      if spbc > highest_spbc_by_year[ano][1]:
        highest_spbc_by_year[ano] = (uf, spbc)

  for ano, (uf, spbc) in highest_spbc_by_year.items():
    writer.writerow([ano, uf, spbc])

