##Manipulando arquivos txt

TXT é a extensão de arquivo para arquivos de texto puro.

TXT é um arquivo de texto simples sem formatação, como negrito, itálico ou fontes diferentes. Ele pode ser aberto e editado com muitos aplicativos diferentes, incluindo editores de texto, processadores de texto e IDEs.

Arquivos TXT são amplamente utilizados para armazenar dados de texto simples, como listas, notas e documentos de texto. Eles são universais e podem ser lidos em praticamente qualquer dispositivo ou sistema operacional.

In [None]:
texto = 'Análise de Dados pode ser uma excelente carreira \n'
texto = texto + 'Esses profissionais precisam saber sobre Storytelling \n'
texto += 'E, claro, devem ser proficientes em BI'

In [None]:
print(texto)

Análise de Dados pode ser uma excelente carreira 
Esses profissionais precisam saber sobre Storytelling 
E, claro, devem ser proficientes em BI


In [None]:
# Importanto o módulo os
# operate system
# Interage com o SO
import os

In [None]:
# Criando um arquivo
# Função open
# Pacote os com as funções path (caminho) e join (juntar)
arquivo = open(os.path.join('arquivos/analista.txt'), 'w')

In [None]:
# split sem parâmetro ele faz a divisão por 'espaço'
# Quebrando frases em palavra e gravando no arquivo
for palavra in texto.split():
  arquivo.write(palavra + ' ')

In [None]:
arquivo.close()

In [None]:
arquivo = open('arquivos/analista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Análise de Dados pode ser uma excelente carreira Esses profissionais precisam saber sobre Storytelling E, claro, devem ser proficientes em BI 


## Usando a expressão `with`

Sem o `with`, é necessário sempre fechar o arquivo com close() para que não ocorra problemas como corromper.

Com o `with`, o método close() é executado automaticamente, com isso, se torna mais segura a manipulação dos arquivos.

In [None]:
# With = com
# Com o arquivo aberto no modo read chame de arquivo
with open('arquivos/analista.txt', 'r') as arquivo:
  # Lê o arquivo e grava na variável 'conteudo'
  conteudo = arquivo.read()

In [None]:
# Comprimento do arquivo
print(len(conteudo))

142


In [None]:
print(conteudo)

Análise de Dados pode ser uma excelente carreira Esses profissionais precisam saber sobre Storytelling E, claro, devem ser proficientes em BI 


In [None]:
with open('arquivos/analista.txt', 'w') as arquivo:
  arquivo.write(texto[:17])
  arquivo.write('\n')
  arquivo.write(texto[26:48])

In [None]:
arquivo = open('arquivos/analista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()
print(conteudo)

Análise de Dados 
uma excelente carreira


## Manipulando arquivos CSV

CSV (Comma-Separated Values) é um formato de arquivo que armazena dados tabulares em formato de texto plano.

Cada linha do arquivo CSV representa uma linha da tabela e as colunas são separadas por vírgulas. É amplamente utilizado para exportar e importar dados em diferentes aplicações, como planilhas e bancos de dados.

CSV é uma opção simples e universal para compartilhar dados, pois pode ser aberto e editado com muitos aplicativos diferentes, incluindo programas de planilha e editores de texto.

In [1]:
# Importando o módulo CSV
import csv

In [3]:
# Abrindo o arquivo no modo write
with open('arquivos/numeros.csv', 'w') as arquivo:
  # Criando o objeto writering de gravação com o método writer
  writering = csv.writer(arquivo)
  # Grava no arquivo linha a linha com o método writerow
  writering.writerow(('nota 1', 'nota 2', 'nota 3'))
  writering.writerow((20,30,40))
  writering.writerow((1,2,3))
  writering.writerow((100,200,300))

In [4]:
# Leitura de arquivos CSV
# encoding é a codificação do arquivo, formato de caracteres, cada arquivo tem o seu encoding
with open('arquivos/numeros.csv', 'r', encoding='utf8', newline = '\r\n') as arquivo:
  # Cria o objeto leitor com o método reader
  # reader lê cada linha e gera uma lista dessa linha
  leitor = csv.reader(arquivo)
  # Para cada elemento do objeto leitor (linha)
  for i in leitor:
    # Imprime a contagem do número de colunas
    print('Número de colunas:', len(i))
    # Imprime os elementos da linha
    print(i)

Número de colunas: 3
['nota 1', 'nota 2', 'nota 3']
Número de colunas: 3
['20', '30', '40']
Número de colunas: 3
['1', '2', '3']
Número de colunas: 3
['100', '200', '300']


In [5]:
# Gerando uma lista com dados do arquivo CSV
with open('arquivos/numeros.csv', 'r') as arquivo:
  leitor = csv.reader(arquivo)
  dados = list(leitor)

In [6]:
print(dados)

[['nota 1', 'nota 2', 'nota 3'], ['20', '30', '40'], ['1', '2', '3'], ['100', '200', '300']]


In [7]:
# Imprimindo a partir da segunda linha
# Slicing 1: para não imprimir o que está no índice 0, nesse caso o cabeçalho
for linha in dados[1:]:
  print(linha)

['20', '30', '40']
['1', '2', '3']
['100', '200', '300']


## Manipulando arquivos JSON (Java Script Object Notation)

JSON é um formato de dados de texto simples e leve que é utilizado para transmitir informações em aplicações web.

É baseado em uma estrutura de objetos JavaScript e usa pares de chave-valor para representar dados.

JSON é facilmente lido e escrito por máquinas e é amplamente utilizado como formato de intercâmbio de dados em aplicações web modernas.

In [8]:
# Criando um dicionário
dictio = {'nome': 'Guido van Rossum',
          'linguagem': 'Python',
          'similar': ['c', 'Modula-3', 'lisp'],
          'users': 100000}

In [11]:
# Loop que percorre as chaves e valores do dictio
for k,v in dictio.items():
  print(k,v)

nome Guido van Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 100000


In [10]:
# Importanto o módulo json
import json

In [13]:
# Função dumps converte o dicionário em formato arquivo JSON
json.dumps(dictio)

'{"nome": "Guido van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 100000}'

In [14]:
# Criando um arquivo JSON
with open('arquivos/dados.json', 'w') as arquivo:
  arquivo.write(json.dumps(dictio))

In [15]:
# Leitura de um arquivo JSON
with open('arquivos/dados.json', 'r') as arquivo:
  # Método read lê o que tem no arquivo e salva na variável 'texto'
  texto = arquivo.read()
  # método loads carrega o conteúdo salvo na variável 'texto' e salva na variável 'dados'
  dados = json.loads(texto)

In [16]:
dados

{'nome': 'Guido van Rossum',
 'linguagem': 'Python',
 'similar': ['c', 'Modula-3', 'lisp'],
 'users': 100000}

In [17]:
# Vantagem de chave-valor é poder usar a chave como índice
print(dados['nome'])

Guido van Rossum


Obs: o banco de dados NoSQL MongoDB grava os dados em formato JSON

## Extração de arquivo da web

In [18]:
# Imprimindo um arquivo JSON copiado da internet
# importando o pacote urllib com o método urlopen
from urllib.request import urlopen

# abrindo a url no modo leitura e decodificando o arquivo para utf8 e grava na variável 'response'
response = urlopen('http://vimeo.com/api/v2/video/57733101.json').read().decode('utf8')
# carregando a resposta com o método loads e somente a primeira parte do response, por isso o índice 0
dados = json.loads(response)[0]

In [22]:
# imprimindo o conteúdo
dados

{'id': 57733101,
 'title': 'The Good Man trailer',
 'description': 'Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/',
 'url': 'https://vimeo.com/57733101',
 'upload_date': '2013-01-19 04:01:15',
 'thumbnail_small': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_100x75',
 'thumbnail_medium': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_200x150',
 '

In [21]:
# usando as chaves como filtro para extrair os valores
print('Título: ', dados['title'])
print('URL: ', dados['url'])
print('Duração: ', dados['duration'])
print('Número de visualizações: ', dados['stats_number_of_plays'])

Título:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Número de visualizações:  6769


Copiando o conteúdo de um arquivo para outro

In [23]:
# Nomes dos arquivos
arquivo_fonte = 'arquivos/dados.json'
arquivo_destino = 'arquivos/dados.txt'

As duas célular abaixo tem o mesmo propósito, só muda a forma de implementação

In [28]:
# Método 1
# abre o arquivo no modo read, lê e grava na variável text
with open(arquivo_fonte, 'r') as infile:
  text = infile.read()
  # abre o arquivo no modo write e escreve nele o que está na variável 'text'
  with open(arquivo_destino, 'w') as outfile:
    outfile.write(text)

In [29]:
# Método 2 que é melhor para legibilidade do código
# abre o arquivo para gravação do outro arquivo que está sendo lido
open(arquivo_destino, 'w').write(open(arquivo_fonte, 'r').read())

106

In [30]:
# Leitura do arquivo txt
with open('arquivos/dados.txt', 'r') as arquivo:
  texto = arquivo.read()
  dados = json.loads(texto)

In [31]:
print(dados)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 100000}
