#Lidando com Arquivos, Pacotes e Módulos

O objetivo dessa aula é praticar os temas da aula 1 e 2 do módulo 1 e para isso vamos trabalhar com um exemplo de análise de dados usando somente bibliotecas padrão do Python.

###Preparando o ambiente

In [1]:
# Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [2]:
# mostra o conteudo do drive
!ls /content/drive/MyDrive

'Apresentação - Hipóteses .gslides'   COURSERA				 grande_arquivo.gsheet
'Carolyne Oliveira'		      CURRICULUM			 LABORATORIA
 Certificados			      DESENVOLVE			 PRETALAB
 Classroom			     'DP - 900'				 REPROGRAMA
'Colab Notebooks'		     'experimento_duraccao (1).gsheet'	 UDEMY
'Cópia de Exercicio-Segunda.gsheet'   experimento_duraccao.gsheet


In [3]:
#Acessando a pasta
%cd /content/drive/MyDrive/PRETALAB/Python/Aula03

/content/drive/MyDrive/PRETALAB/Python/Aula03


In [4]:
# Mostra o conteudo do local/pasta
!ls

arquivo_modelo.ipynb	internacoes.csv		   modulo_analise.py	 __pycache__
internacao2.csv		meu_arquivo.csv		   modulo_internacao.py
internacao_desafio.csv	modulo_analise_desafio.py  nome_arquivo.csv


In [5]:
# Biblioteca do python utilizada para acessar o sistema, os arquivos. Ele mostra onde vc esta!
import os
os.getcwd()

'/content/drive/MyDrive/PRETALAB/Python/Aula03'

In [6]:
#Importando as bibliotecas
import pandas as pd

###Lidando com Arquivos, Pacotes e Módulos

####Cenário

**Objetivo:** Analisar dados de internações hospitalares, calcular métricas como o custo médio por internação, número de internações por tipo de tratamento, e visualizar a quantidade de internações ao longo do tempo.

**Estrutura do Dataset de Internações Hospitalares**

 - Cada linha no dataset conterá as seguintes colunas:

1. Data de Internação: A data em que o paciente foi internado.

2. Tratamento: O tipo de tratamento (ex: "Cirurgia", "Tratamento Intensivo", "Exames", "Fisioterapia").
3. Dias de Internação: O número de dias que o paciente ficou internado.

4. Custo Total: O custo total da internação.

**Passos**

1. Criar um módulo Python para lidar com o arquivo CSV, cálculos, e manipulação de dados.

2. Gerar dados fictícios de internações hospitalares.
3. Analisar e visualizar os dados sem o uso de bibliotecas externas como pandas, usando apenas bibliotecas nativas do Python.

### 1. Manipulando arquivos

Aqui já começamos manipulando arquivos e construindo o módulo, lembre-se de fazer por parte:

In [7]:
# Importando os módulos padrão do Python
import csv
import random
from datetime import datetime, timedelta # Importando a biblioteca datetime

### 1. Criando um módulo como construtor de dados ficticios e manipulando arquivos:

In [8]:
cria_arquivo = '''
import csv
import random
from datetime import datetime, timedelta

# Construindo a função
# coloque todo o código que anterior numa função que receba o nome e quantidade de linhas do arquivo com extensão csv
def meu_arquivo(nome_arquivo, num_linhas):
  colunas = ['data_internacao', 'tratamento', 'dias_internacao', 'custo_total']
  tratamento = ['cirurgia', 'tratamento_intensivo', 'exames', 'fisioterapia']
  data_inicial = datetime.now() - timedelta(days=730)

  with open(nome_arquivo, 'w', newline='') as arquivo:
    construtor = csv.writer(arquivo)
    #adicionar a lista criada chamada coluna como cabeçalho do arquivo csv
    construtor.writerow(colunas)

    for _ in range(num_linhas):
      data_internacao = data_inicial + timedelta(days=random.randint(1, 730))
      tratamento = random.choice(tratamento)
      dias_internacao = random.randint(1, 30)
      custo_total = round(random.uniform(100.0, 10000.0), 2)
      construtor.writerow([data_internacao.strftime('%Y-%m-%d'), tratamento, dias_internacao, custo_total])
      '''

  #construindo o arquivo do modulo
with open('modulo_internacao.py', 'w') as arquivo:
    arquivo.write(cria_arquivo)

### 2. Criando um módulo de análise

In [9]:
#Construindo o modulo
conteudo = '''
import csv
import math
from datetime import datetime

# Funcao para carregar arquivos csv
def carregar_dados(nome_arquivo):
  dados = []
  with open(nome_arquivo, 'r') as arquivo:
    leitor = csv.DictReader(arquivo)
    for linha in leitor:
      dados.append(linha)
  return dados
  '''
  #construindo o arquivo do modulo
with open('modulo_analise.py', 'w') as modulo:
    modulo.write(conteudo)

### Usando o módulo construido

In [10]:
# importando o módulo e definindo como mi
import modulo_internacao as mi
import modulo_analise as ma

In [11]:
#criando o arquivo
mi.meu_arquivo('internacao2.csv', 50000)

In [12]:
# lendo o arquivo
base = ma.carregar_dados('internacao2.csv')

In [13]:
base

[{'data_internacao': '2024-06-22',
  'tratamento': 'fisioterapia',
  'dias_internacao': '1',
  'custo_total': '9076.2'},
 {'data_internacao': '2024-04-26',
  'tratamento': 'i',
  'dias_internacao': '1',
  'custo_total': '4209.86'},
 {'data_internacao': '2022-10-18',
  'tratamento': 'i',
  'dias_internacao': '5',
  'custo_total': '324.41'},
 {'data_internacao': '2023-08-15',
  'tratamento': 'i',
  'dias_internacao': '30',
  'custo_total': '7424.93'},
 {'data_internacao': '2022-12-22',
  'tratamento': 'i',
  'dias_internacao': '7',
  'custo_total': '4196.8'},
 {'data_internacao': '2023-05-28',
  'tratamento': 'i',
  'dias_internacao': '6',
  'custo_total': '5679.96'},
 {'data_internacao': '2024-01-21',
  'tratamento': 'i',
  'dias_internacao': '21',
  'custo_total': '8802.42'},
 {'data_internacao': '2023-08-04',
  'tratamento': 'i',
  'dias_internacao': '29',
  'custo_total': '432.61'},
 {'data_internacao': '2022-10-20',
  'tratamento': 'i',
  'dias_internacao': '26',
  'custo_total': '1

### DESAFIO

Termine de construir o módulo de análise

1. Crie uma função que calcule o custo médio por internação
2. Crie uma função que calcule o volume de internações por tipo de tratamento

3. Crie uma função que calcule o volume de internações ao longo do tempo, uma visão mensal.

In [14]:
#Construindo o modulo
analisar_arquivo = '''
import csv
import math
from datetime import datetime

# Funcao para carregar arquivos csv
def carregar_dados(nome_arquivo):
  dados = []
  with open(nome_arquivo, 'r') as arquivo:
    leitor = csv.DictReader(arquivo)
    for linha in leitor:
      dados.append(linha)
  return dados

# Função que calcule o custo médio por internação
def custo_medio(dados):
  custo_total = 0
  for linha in dados:
    custo_total += float(linha['custo_total'])
  custo_medio = custo_total / len(dados)
  return custo_medio

# Função que calcule o volume de internações por tipo de tratamento
def volume_internacao_tratamento(dados):
    volume_por_tratamento = {}
    for linha in dados:
        tratamento = linha['tratamento']
        if tratamento in volume_por_tratamento:
            volume_por_tratamento[tratamento] += 1
        else:
            volume_por_tratamento[tratamento] = 1
    return volume_por_tratamento

# Função que calcule o volume de internações ao longo do tempo, uma visão mensal.
def volume_internacao_mensal(dados):
    volume_por_mes = {}
    for linha in dados:
        data_internacao = datetime.strptime(linha['data_internacao'], '%Y-%m-%d')
        mes_ano = data_internacao.strftime('%Y-%m')
        if mes_ano in volume_por_mes:
            volume_por_mes[mes_ano] += 1
        else:
            volume_por_mes[mes_ano] = 1
    return volume_por_mes
'''

# Construindo o arquivo do módulo
with open('modulo_analise_desafio.py', 'w') as modulo:
    modulo.write(conteudo)

In [15]:
# importando o módulo e definindo como 'mad'
import modulo_analise_desafio as mad

In [16]:
#criando o arquivo
mi.meu_arquivo('internacao_desafio.csv', 50000)

In [17]:
# lendo o arquivo
desafio = mad.carregar_dados('internacao_desafio.csv')

In [18]:
desafio

[{'data_internacao': '2023-05-28',
  'tratamento': 'tratamento_intensivo',
  'dias_internacao': '9',
  'custo_total': '8936.06'},
 {'data_internacao': '2023-04-01',
  'tratamento': 't',
  'dias_internacao': '1',
  'custo_total': '9479.52'},
 {'data_internacao': '2024-01-27',
  'tratamento': 't',
  'dias_internacao': '22',
  'custo_total': '874.42'},
 {'data_internacao': '2023-08-04',
  'tratamento': 't',
  'dias_internacao': '11',
  'custo_total': '7164.7'},
 {'data_internacao': '2024-01-22',
  'tratamento': 't',
  'dias_internacao': '15',
  'custo_total': '9616.91'},
 {'data_internacao': '2024-09-10',
  'tratamento': 't',
  'dias_internacao': '15',
  'custo_total': '5021.86'},
 {'data_internacao': '2024-05-01',
  'tratamento': 't',
  'dias_internacao': '12',
  'custo_total': '8847.83'},
 {'data_internacao': '2022-11-30',
  'tratamento': 't',
  'dias_internacao': '8',
  'custo_total': '4684.23'},
 {'data_internacao': '2023-09-11',
  'tratamento': 't',
  'dias_internacao': '7',
  'custo