# <font color='blue'>Data Science Academy</font>

## <font color='blue'>Fundamentos de Linguagem Python Para Análise de Dados e Data Science</font>

## <font color='blue'>Capítulo 6 - Manipulação de Arquivos - Parte 2</font>

In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.9.13


## Manipulando Arquivos TXT

TXT é a extensão de arquivo para arquivos de texto puro. Um arquivo TXT é um arquivo de texto simples sem formatação, como negrito, itálico ou fontes diferentes. Ele pode ser aberto e editado com muitos aplicativos diferentes, incluindo editores de texto, processadores de texto e IDEs. Arquivos TXT são amplamente utilizados para armazenar dados de texto simples, como listas, notas e documentos de texto. Eles são universais e podem ser lidos em praticamente qualquer dispositivo ou sistema operacional.

In [2]:
texto = "Cientista de Dados pode ser uma excelente alternativa de carreira.\n"
texto = texto + "Esses profissionais precisam saber como programar em Python.\n"
texto += "E, claro, devem ser proficientes em Data Science."

In [3]:
print(texto)

Cientista de Dados pode ser uma excelente alternativa de carreira.
Esses profissionais precisam saber como programar em Python.
E, claro, devem ser proficientes em Data Science.


In [4]:
# Importando o módulo os
import os

In [5]:
# Criando um arquivo 
arquivo = open(os.path.join('arquivos/cientista.txt'),'w')

In [6]:
# Gravando os dados no arquivo
for palavra in texto.split():
    arquivo.write(palavra + ' ')

In [7]:
# Fechando o arquivo
arquivo.close()

In [8]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt','r')
conteudo = arquivo.read()
arquivo.close()
print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em Python. E, claro, devem ser proficientes em Data Science. 


### Usando a Expressão `with` 

O método close() é executado automaticamente.

In [9]:
with open('arquivos/cientista.txt','r') as arquivo:
    conteudo = arquivo.read()
    #with fecha o arquivo sem precisar chamar o metodo close

In [10]:
print(len(conteudo))

178


In [11]:
print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em Python. E, claro, devem ser proficientes em Data Science. 


In [37]:
with open('arquivos/cientista.txt','w') as arquivo:
    arquivo.write(texto[:19])
    arquivo.write('\n')
    arquivo.write(texto[28:66])

In [38]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt','r')
conteudo = arquivo.read()
arquivo.close()
print (conteudo)

Cientista de Dados 
uma excelente alternativa de carreira.


## Manipulando Arquivos CSV 

CSV (Comma-Separated Values) é um formato de arquivo que armazena dados tabulares em formato de texto plano. Cada linha do arquivo CSV representa uma linha da tabela e as colunas são separadas por vírgulas. É amplamente utilizado para exportar e importar dados em diferentes aplicações, como planilhas e banco de dados. CSV é uma opção simples e universal para compartilhar dados, pois pode ser aberto e editado com muitos aplicativos diferentes, incluindo programas de planilha e editores de texto.

In [39]:
# Importando o módulo csv
import csv

In [40]:
with open('arquivos/numeros.csv','w') as arquivo:
    
    # Cria o objeto de gravação
    writer = csv.writer(arquivo)
    
    # Grava no arquivo linha a linha
    writer.writerow(('nota1', 'nota2', 'nota3'))
    writer.writerow((63,87,92)) 
    writer.writerow((61,79,76))
    writer.writerow((72,64,91))

In [41]:
# Leitura de arquivos csv
with open('arquivos/numeros.csv', 'r', encoding='utf8', newline = '\r\n') as arquivo:
    
    # Cria o objeto de leitura
    leitor = csv.reader(arquivo)
    
    # Loop
    for x in leitor:
        print(x)

['nota1', 'nota2', 'nota3']
['63', '87', '92']
['61', '79', '76']
['72', '64', '91']


In [42]:
# Gerando uma lista com dados do arquivo csv
with open('arquivos/numeros.csv','r') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)

In [43]:
print(dados)

[['nota1', 'nota2', 'nota3'], [], ['63', '87', '92'], [], ['61', '79', '76'], [], ['72', '64', '91'], []]


In [44]:
# Impriminfo a partir da segunda linha
for linha in dados[1:]:
    print(linha)

[]
['63', '87', '92']
[]
['61', '79', '76']
[]
['72', '64', '91']
[]


## Manipulando Arquivos JSON (Java Script Object Notation )

JSON (JavaScript Object Notation) é um formato de dados de texto simples e leve que é utilizado para transmitir informações em aplicações web. É baseado em uma estrutura de objetos JavaScript e usa pares de chave-valor para representar dados. JSON é facilmente lido e escrito por máquinas e é amplamente utilizado como formato de intercâmbio de dados em aplicações web modernas.

In [45]:
# Criando um dicionário
dict_guido = {'nome': 'Guido van Rossum',
              'linguagem': 'Python',
              'similar': ['c','Modula-3','lisp'],
              'users': 1000000}

In [46]:
for k,v in dict_guido.items():
    print (k,v)

nome Guido van Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [47]:
# Importando o módulo JSON
import json

In [48]:
# Convertendo o dicionário para um objeto json
json.dumps(dict_guido)

'{"nome": "Guido van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [49]:
# Criando um arquivo Json
with open('arquivos/dados.json','w') as arquivo:
    arquivo.write(json.dumps(dict_guido))

In [50]:
# Leitura de arquivos Json
with open('arquivos/dados.json','r') as arquivo:
    texto = arquivo.read()
    dados = json.loads(texto)

In [51]:
dados

{'nome': 'Guido van Rossum',
 'linguagem': 'Python',
 'similar': ['c', 'Modula-3', 'lisp'],
 'users': 1000000}

In [52]:
print(dados['nome'])

Guido van Rossum


### Extração de Arquivo da Web

In [56]:
# Imprimindo um arquivo JSON copiado da internet
from urllib.request import urlopen

response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode('utf8')
dados = json.loads(response)[0]

In [57]:
dados

{'id': 57733101,
 'title': 'The Good Man trailer',
 'description': 'Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/',
 'url': 'https://vimeo.com/57733101',
 'upload_date': '2013-01-19 04:01:15',
 'thumbnail_small': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_100x75',
 'thumbnail_medium': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_200x150',
 '

In [58]:
print ('Título: ', dados['title'])
print ('URL: ', dados['url'])
print ('Duração: ', dados['duration'])
print ('Número de Visualizações: ', dados['stats_number_of_plays'])

Título:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Número de Visualizações:  6747


> Copiando o conteúdo de um arquivo para outro.

In [59]:
# Nomes dos arquivos
arquivo_fonte = 'arquivos/dados.json'
arquivo_destino = 'arquivos/dados.txt'

In [60]:
# Método 1
with open(arquivo_fonte,'r') as infile:
    text = infile.read()
    with open(arquivo_destino,'w') as outfile:
        outfile.write(text)  

In [61]:
# Método 2
open(arquivo_destino,'w').write(open(arquivo_fonte,'r').read()) 

107

In [62]:
# Leitura do arquivo txt
with open('arquivos/dados.txt','r') as arquivo:
    texto = arquivo.read()
    dados = json.loads(texto)
print(type(texto))

<class 'str'>


In [None]:
print(dados['nome'])

In [None]:
import selenium
import time
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import os

In [None]:
usuario = input('Insira o usuário do AtenaPrev.Net: ')
senha = input('Insira a senha do AtenaPrev.Net: ')
referencia = '2024'



diretorio = f"H:\GAC\Relatórios Santander\Carteira Custódia\{referencia}\carteiras\\"
chrome_options = Options()
chrome_options.add_experimental_option("detach", True)

prefs = {"download.default_directory" : diretorio}
chrome_options.add_experimental_option("prefs", prefs)

servico = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=servico, options=chrome_options)
navegador.get("http://contabilidade.neos.com/ControleAcesso/login/Login.aspx")

navegador.find_element('xpath','//*[@id="MainContent_lgnLogin_UserName"]').send_keys(usuario) #insere o login
navegador.find_element('xpath','//*[@id="MainContent_lgnLogin_Password"]').send_keys(senha) #insere a senha
navegador.find_element('xpath','//*[@id="MainContent_lgnLogin_LoginButton"]').click() #clica "entrar"

navegador.get("http://contabilidade.neos.com/Contabilidade/Default.aspx")
navegador.get("http://contabilidade.neos.com/Contabilidade")
navegador.get("http://contabilidade.neos.com/Contabilidade/Relatorios/Balancete/contabil/Pesquisar.aspx")



In [None]:
# Lista de opções para escolha dos balancetes
opcoes_xpath = [
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[9]',# CD BA
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[8]',# BD BA
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[7]',# CD RN
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[5]',# PGA
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[4]',# BD RN
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[3]',# CD PE
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[2]',# BD PE    
    '//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxLeft"]/option[1]',# CD Néos
]


# Loop para escolha das opções xpath
for opcoes_xpath in opcoes_xpath:
    #Abre janela de seleção de balancete
    navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_lnkSelecionado"]').click()
    time.sleep (0.75)

    #Limpa possíveis balancetes selecionados
    navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_lbtList_btnRemAll"]').click() #//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxRight"]/option
    time.sleep (0.75)

    #Seleciona balancete CD Néos
    elemento = navegador.find_element(By.XPATH, opcoes_xpath)
    acoes = ActionChains(navegador)
    acoes.double_click(elemento).perform()
    time.sleep (0.75)

    #Fecha janela de seleção de balancete
    navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_btnCancelar"]').click()
    time.sleep (1.75)

    #Exporta balancete
    navegador.find_element('xpath','//*[@id="MainContent_MainContent_btnExportar"]').click()
    time.sleep (1.75)

#Abre janela de seleção de balancete
navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_lnkSelecionado"]').click()
time.sleep (0.75)

#Limpa possíveis balancetes selecionados
navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_lbtList_btnRemAll"]').click() #//*[@id="MainContent_MainContent_fpuBalancete_lbtList_lbxRight"]/option
time.sleep (0.75)

#Fecha janela de seleção de balancete
navegador.find_element('xpath','//*[@id="MainContent_MainContent_fpuBalancete_btnCancelar"]').click()
time.sleep (1.75)

opcoes_xpath_perfis = [
    'Bas CD BA',
    'Dif CD BA',
    'Cons CD BA',
    'Cons CD RN',
    'Mod Plus CD RN',
    'Mod CD RN',
    'Agr CD RN',
    'Agr Plus CD RN',
    'Super Conservador CD PE',
    'Conservador CD PE',
    'Moderado CD PE',
    'Agressivo CD PE',
    'Super Agressivo CD PE',
    'Sup Cons CD Néos',
    'Cons CD Néos',
    'Mod CD Néos',
    'Agr CD Néos', 
]

# Loop para escolha dos perfis
for opcoes_xpath_perfis in opcoes_xpath_perfis:

    #Seleciona os perfis
    elemento = navegador.find_element(By.XPATH, '//*[@id="MainContent_MainContent_ddlTipoCota"]').send_keys(opcoes_xpath_perfis)
        
    #Exporta balancete
    navegador.find_element('xpath','//*[@id="MainContent_MainContent_btnExportar"]').click()
    time.sleep (1.75)

time.sleep (120)

nomes_antigos = [
    'Balancete.xlsx',
    'Balancete (1).xlsx',
    'Balancete (2).xlsx',
    'Balancete (3).xlsx',
    'Balancete (4).xlsx',
    'Balancete (5).xlsx',
    'Balancete (6).xlsx',
    'Balancete (7).xlsx',
    'Balancete (8).xlsx',
    'Balancete (9).xlsx',
    'Balancete (10).xlsx',
    'Balancete (11).xlsx',
    'Balancete (12).xlsx',
    'Balancete (13).xlsx',
    'Balancete (14).xlsx',
    'Balancete (15).xlsx',
    'Balancete (16).xlsx',
    'Balancete (17).xlsx',
    'Balancete (18).xlsx',
    'Balancete (19).xlsx',
    'Balancete (20).xlsx',
    'Balancete (21).xlsx',
    'Balancete (22).xlsx',
    'Balancete (23).xlsx',
    'Balancete (24).xlsx',
    'Balancete (25).xlsx',
]

nomes_novos = [
    f'Balancete CD BA - {referencia}.xlsx',
    f'Balancete BD BA - {referencia}.xlsx',
    f'Balancete CD RN - {referencia}.xlsx',
    f'Balancete PGA - {referencia}.xlsx',
    f'Balancete BD RN - {referencia}.xlsx',
    f'Balancete CD PE - {referencia}.xlsx',
    f'Balancete BD PE - {referencia}.xlsx',
    f'Balancete CD NÉOS - {referencia}.xlsx',
    f'Balancete CD BA Básico - {referencia}.xlsx',
    f'Balancete CD BA Diferenciado - {referencia}.xlsx',
    f'Balancete CD BA Conservador - {referencia}.xlsx',
    f'Balancete CD RN Conservador - {referencia}.xlsx',
    f'Balancete CD RN Moderado Plus - {referencia}.xlsx',
    f'Balancete CD RN Moderado - {referencia}.xlsx',
    f'Balancete CD RN Agressivo - {referencia}.xlsx',
    f'Balancete CD RN Agressivo Plus - {referencia}.xlsx',
    f'Balancete CD PE Super Conservador - {referencia}.xlsx',
    f'Balancete CD PE Conservador - {referencia}.xlsx',
    f'Balancete CD PE Moderado - {referencia}.xlsx',
    f'Balancete CD PE Agressivo - {referencia}.xlsx',
    f'Balancete CD PE Super Agressivo - {referencia}.xlsx',
    f'Balancete CD Néos Super Conservador - {referencia}.xlsx',
    f'Balancete CD Néos Conservador - {referencia}.xlsx',
    f'Balancete CD Néos Moderado - {referencia}.xlsx',
    f'Balancete CD Néos Agressivo - {referencia}.xlsx', 
]

# Adicione este código ao seu script
for i in range(len(nomes_antigos)):
    # Construa o caminho completo para os nomes de arquivo antigos e novos
    nome_antigo = os.path.join(diretorio, nomes_antigos[i])
    novo_nome = os.path.join(diretorio, nomes_novos[i])

    # Renomeia o arquivo
    os.rename(nome_antigo, novo_nome)




navegador.quit

# FIM

### Obrigado

### Visite o Blog da Data Science Academy - <a href="http://blog.dsacademy.com.br">Blog DSA</a>