# Manipulação de Arquivos

- Text files
- CSV files
- JSON

## Manipulação de Arquivos TXT

In [1]:
texto = "Ciencista de Dados é a profissão que mais tem crescido ultimamente. \n"
texto = texto + "Esses profissionais precisam se especializar em Estatística, Programação e Machine Learning.\n"
texto += "E claro, em Big Data."

In [2]:
print(texto)

Ciencista de Dados é a profissão que mais tem crescido ultimamente. 
Esses profissionais precisam se especializar em Estatística, Programação e Machine Learning.
E claro, em Big Data.


In [3]:
# Importando o módulo os
import os

In [4]:
# Criando um arquivo (no mesmo diretório onde está o Jupyter Notebook)
arquivo = open(os.path.join('cientista.txt'), 'w')

In [5]:
# Gravando os dados no arquivo
for palavra in texto.split():
    arquivo.write(palavra+' ')

In [6]:
# Fechando o arquivo
arquivo.close()

In [7]:
#! executa um função do sistema 

# Em unix
#!cat cientista.txt

# Em Win
!type cientista.txt

Ciencista de Dados é a profissão que mais tem crescido ultimamente. Esses profissionais precisam se especializar em Estatística, Programação e Machine Learning. E claro, em Big Data. 


In [8]:
# Lendo o arquivo 
arquivo = open('cientista.txt', 'r')
texto = arquivo.read()
arquivo.close()

print(texto)

Ciencista de Dados é a profissão que mais tem crescido ultimamente. Esses profissionais precisam se especializar em Estatística, Programação e Machine Learning. E claro, em Big Data. 


## Usando a expressão with

O método close() é executado automaticamente 

In [9]:
with open('cientista.txt', 'r') as arquivo:
    texto = arquivo.read()

In [10]:
print(len(texto))

183


In [11]:
print(texto)

Ciencista de Dados é a profissão que mais tem crescido ultimamente. Esses profissionais precisam se especializar em Estatística, Programação e Machine Learning. E claro, em Big Data. 


In [12]:
with open('cientista.txt', 'w') as arquivo:
    arquivo.write(texto[:21])
    arquivo.write('\n')
    arquivo.write(texto[:33])

In [13]:
#! executa um função do sistema 

# Em unix
#!cat cientista.txt

# Em Win
!type cientista.txt

Ciencista de Dados é 
Ciencista de Dados é a profissão 


## Manipulando Arquivos CSV (comma-separated values)

In [14]:
# Importando o módulo csv
import csv

In [15]:
with open('numeros.csv', 'w', newline='') as arquivo:
    writer = csv.writer(arquivo)
    writer.writerow(('primeira', 'segunda', 'terceira'))
    writer.writerow((55,93,76))
    writer.writerow((62,14,86))

In [16]:
# Em unix
#!cat numeros.csv

# Em Win
!type numeros.csv

primeira,segunda,terceira
55,93,76
62,14,86


In [17]:
# Leitura de arquivo csv
with open('numeros.csv', 'r') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 3
['55', '93', '76']
Número de colunas: 3
['62', '14', '86']


In [18]:
# Gerando uma lista com dados do arquivo csv
with open('numeros.csv', 'r') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)

print(dados)

[['primeira', 'segunda', 'terceira'], ['55', '93', '76'], ['62', '14', '86']]


In [19]:
# Imprimindo informação a partir da segunda linha
for linha in dados[1:]:
    print(linha)

['55', '93', '76']
['62', '14', '86']


## Manipulando Arquivos JSON (Java Script Object Notation)

JSON (Java Script Object Notation) é uma maneira de armazenar informações de forma organizada e de fácil acesso. Em poucas palavras, ele nos dá uma coleção legível de dados que podem ser acessados de forma muito lógica. Pode ser um fonte de Big Data.

In [20]:
# Criando um dicionário
dict = {'nome':'Guido Van Rossum',
       'Linguagem':'Python',
       'similar':['c','Modula-3','lisp'],
       'users':1000000}

In [21]:
for k,v in dict.items():
    print(k, v)

nome Guido Van Rossum
Linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [22]:
# Importando o módulo JSON
import json

In [23]:
# Convertendo o dicionário para um objeto json
json.dumps(dict)

'{"nome": "Guido Van Rossum", "Linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [24]:
# Criando um arquivo JSON
with open('dados.json','w') as arquivo:
    arquivo.write(json.dumps(dict))

In [25]:
# Leitura de arquivos json
with open('dados.json','r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

In [26]:
print(data)

{'nome': 'Guido Van Rossum', 'Linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


In [27]:
print(data['nome'])

Guido Van Rossum


In [28]:
# Imprimindo um arquivo JSON copiado da internet
from urllib.request import urlopen

response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode('utf8')
data = json.loads(response)[0]

In [29]:
print('Titulo:', data['title'])
print('URL:', data['url'])
print('Duração:', data['duration'])
print('Número de Visualizações:', data['stats_number_of_plays'])

Titulo: The Good Man trailer
URL: https://vimeo.com/57733101
Duração: 143
Número de Visualizações: 5433


In [30]:
# Copiando o conteúdo de um arquivo para outro
import os

arquivo_fonte = 'dados.json'
arquivo_destino = 'json_data.txt'

In [31]:
# Metedo 1
with open(arquivo_fonte, 'r') as infile:
    text = infile.read()
    with open(arquivo_destino, 'w') as outfile:
        outfile.write(text)

In [32]:
# Em unix
#!cat json_data.txt

# Em Win
!type json_data.txt

{"nome": "Guido Van Rossum", "Linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}


In [33]:
# Metodo 2
open(arquivo_destino,'w').write(open(arquivo_fonte,'r').read())

107

In [34]:
# Em unix
#!cat json_data.txt

# Em Win
!type json_data.txt

{"nome": "Guido Van Rossum", "Linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}


### The End