## Manipulação de Arquivos

- Arquivos TXT
- Arquivos CSV
- Arquivos JSON

## Manipulando Arquivos TXT

In [1]:
texto = 'Cientista de Dados é a profissão que mais tem crescido em todo mundo.\n'
texto = texto + 'Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning.\n'
texto += 'E claro, em Big Data.'

In [2]:
print(texto)

Cientista de Dados é a profissão que mais tem crescido em todo mundo.
Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning.
E claro, em Big Data.


In [3]:
# Importando o módulo 'os' para manipular o sistema operacional
import os

In [4]:
# Criando um arquivo e entrando no modo escrita
arquivo = open(os.path.join('arquivos/cientista.txt'),'w')

In [5]:
# Gravando os dados no arquivo
for palavra in texto.split():
    arquivo.write(palavra + ' ')

In [6]:
# Fechando o arquivo no modo escrita
arquivo.close()

In [7]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt', 'r')
conteudo = arquivo.read() # atribuindo a leitura a uma variável
arquivo.close()  # fechando o arquivo

print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. 


### Usando a expressão `with`

O método `close()` é executado automaticamente

In [8]:
# Abrindo o arquivo no modo de leitura
with open('arquivos/cientista.txt', 'r') as arquivo:
    conteudo = arquivo.read()

In [9]:
# Imprimindo a quantidade de caracteres do arquivo
print(len(conteudo))

185


In [10]:
# Imprimindo o arquivo
print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. 


In [11]:
# Abrindo o arquivo em modo de escrita
with open('arquivos/cientista.txt', 'w') as arquivo:
    arquivo.write(texto[:21])  # escrevendo no arquivo através do slice
    arquivo.write('\n')  # Ao final da escrita, adicionando um enter
    arquivo.write(texto[:33])  # escrevendo no arquivo através do slice

In [12]:
# Abrindo o arquivo em modo de leitura
with open('arquivos/cientista.txt', 'r') as arquivo:
    conteudo = arquivo.read()

print(conteudo)

Cientista de Dados é 
Cientista de Dados é a profissão 


## Manipulando Arquivos CSV (comma-separated values)

In [13]:
# Importando o módulo csv
import csv

In [14]:
# abrindo/criando um arquivo csv no modo de escrta
with open('arquivos/numeros.csv', 'w', encoding='utf-8') as arquivo:
    writer = csv.writer(arquivo)  # atribuindo a função de escrita na variável
    writer.writerow(('primeira', 'segunda', 'terceira'))  # escrevendo na linha
    writer.writerow((55, 93, 76))
    writer.writerow((62, 14, 86))

In [15]:
# abrindo o arquivo para leitura
# o parâmetro newline='\r\n' evita as linhas em branco
with open('arquivos/numeros.csv', 'r', encoding='utf-8', newline='\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 3
['55', '93', '76']
Número de colunas: 3
['62', '14', '86']


In [16]:
# gerando uma lista com dados do arquivo csv
# o parâmetro newline='\r\n' evita as linhas em branco
with open('arquivos/numeros.csv', 'r', encoding='utf-8', newline='\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)  # convertendo o conteúdo do arquivo para uma lista

print(dados)

[['primeira', 'segunda', 'terceira'], ['55', '93', '76'], ['62', '14', '86']]


In [17]:
# imprimindo a partir de uma determinada linha
for linha in dados[1:]:
    print(linha)

['55', '93', '76']
['62', '14', '86']


## Manipulando Arquivos JSON (JavaScript Object Notation)

In [18]:
# criando um dicionário
dict = {'nome': 'Guido van Rossum',
        'linguagem': 'Python',
        'similar': ['c', 'Modula-3', 'lisp'],
        'users': 1000000}

In [19]:
# imprimindo cada chave e valor do dicionário
for chave, valor in dict.items():
    print(chave, valor)

nome Guido van Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [20]:
# importando o módulo JSON
import json

In [21]:
# convertendo o dicionário para um objeto json
json.dumps(dict)

'{"nome": "Guido van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [22]:
# criando um arquivo json
with open('arquivos/dados.json', 'w') as arquivo:
    arquivo.write(json.dumps(dict))

In [23]:
# abrindo o arquivo em modo leitura
with open('arquivos/dados.json', 'r', encoding='utf-8') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

In [24]:
print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


In [25]:
# acessando uma chave do arquivo
print(data['nome'])

Guido van Rossum


In [26]:
# importando um arquivo json copiado da internet
from urllib.request import urlopen

response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode('utf8')
data = json.loads(response)[0]

In [27]:
# extraindo e imprimindo os elementos do arquivo
print('Título:', data['title'])
print('URL:', data['url'])
print('Duração:', data['duration'])
print('Número de visualizações:', data['stats_number_of_plays'])

Título: The Good Man trailer
URL: https://vimeo.com/57733101
Duração: 143
Número de visualizações: 6264


In [28]:
# copiando o conteúdo de um arquivo para outro
import os

arquivo_fonte = 'arquivos/dados.json'
arquivo_destino = 'arquivos/json_data.txt'

In [29]:
# método 1
with open(arquivo_fonte, 'r') as infile:
    text = infile.read()
    with open(arquivo_destino, 'w') as outfile:
        outfile.write(text)

In [30]:
# método 2
open(arquivo_destino, 'w').write(open(arquivo_fonte,'r').read())

107

In [31]:
# leitura de arquivos json
with open('arquivos/json_data.txt', 'r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

In [32]:
print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}
