<a href="https://colab.research.google.com/github/ralsouza/python_fundamentos/blob/master/src/03_tratamento_arquivos_modulos_pacotes_funcoes_buildin/01_arquivos_parte2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Manipulação de Arquivos
*   Arquivos TXT
*   Arquivos CSV
*   Arquivos JSON



## 1. Arquivos TXT

In [0]:
texto = 'Cientista de Dados é a profissão que mais tem crescido em todo o mundo.\n'
texto = texto + 'Estes profissionais precisam se especializar em programação, estatística e machine learning.\n'
texto += 'E claro em big data.'

In [0]:
print (texto)

Cientista de Dados é a profissão que mais tem crescido em todo o mundo.
Estes profissionais precisam se especializar em programação, estatística e machine learning.
E claro em big data.


In [0]:
# Importar o módulo OS
import os

In [0]:
# Criar um novo arquivo no file system
# Se o arquivo não existir, o Python criará um novo arquivo com o nome especificado
arquivo = open(os.path.join('/content/cientista.txt'), 'w')

In [0]:
# Efetuar a gravação no texto, baseado nos espaços em branco com a função split()
for palavra in texto.split():
  arquivo.write(palavra + ' ')

In [0]:
arquivo.close()

In [0]:
# Ler conteúdo do arquivo
arquivo = open('/content/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo o mundo. Estes profissionais precisam se especializar em programação, estatística e machine learning. E claro em big data. 


## 2. Expressão *with*
O método *close()* é executado automaticamente.

In [0]:
with open('/content/cientista.txt', 'r') as arquivo:
  conteudo = arquivo.read()

In [0]:
print(len(conteudo))

186


In [0]:
print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo o mundo. Estes profissionais precisam se especializar em programação, estatística e machine learning. E claro em big data. 


In [0]:
# Usar notações de slicing
with open('/content/sample_data/cientista.txt', 'w') as arquivo:
  # Imprimir os dados da posição 0 à 21
  arquivo.write(texto[ :21])
  # Quebrar a linha
  arquivo.write('\n')
  # Imprimir os dados de 0 à 33
  arquivo.write(texto[ :33])

In [0]:
# Ler o arquivo
arquivo = open('/content/sample_data/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Cientista de Dados é 
Cientista de Dados é a profissão 


## 3. Arquivos CSV

In [0]:
# Importar módulo csv
import csv

In [0]:
# Escrever no arquivo
with open('/content/sample_data/numeros.csv', 'w') as arquivo:
  writer = csv.writer(arquivo)
  writer.writerow(('primeira', 'segunda', 'terceira'))
  writer.writerow((55,93,76))
  writer.writerow((62,14,86))

In [0]:
# Ler o arquivo gravado anteriormente
with open('/content/sample_data/numeros.csv', 'r') as arquivo:
  leitor = csv.reader(arquivo)
  for i in leitor:
    print('Número de colunas', len(i))
    print(i)


Número de colunas 3
['primeira', 'segunda', 'terceira']
Número de colunas 3
['55', '93', '76']
Número de colunas 3
['62', '14', '86']


In [0]:
# Transferir o conteúdo do arquivo para uma lista na memória
with open('/content/sample_data/numeros.csv', 'r') as arquivo:
  leitor = csv.reader(arquivo)
  dados = list(leitor)
  
print(dados)

[['primeira', 'segunda', 'terceira'], ['55', '93', '76'], ['62', '14', '86']]


In [0]:
# Imprimir a partir da segunda linha, removendo o cabeçalho
for linha in dados[1: ]:
  print(linha)

['55', '93', '76']
['62', '14', '86']


In [0]:
# Imprimir todas as linhas
for linha in dados[0:]:
  print(linha)

['primeira', 'segunda', 'terceira']
['55', '93', '76']
['62', '14', '86']


## 4. Arquivos JSON (JavaScript Object Notation)

In [0]:
# Criação de um dicionário
dict = {'nome': 'Guido Van Rossum',
        'linguagem': 'Python',
        'similar': ['c','Modula-3','Lisp'],
        'users': 1000000}

In [0]:
# Impressão do dicionário por chave e valor
for k,v in dict.items():
  print(k,v)

nome Guido Van Rossum
linguagem Python
similar ['c', 'Modula-3', 'Lisp']
users 1000000


In [0]:
# Importação do módulo JSON
import json

In [0]:
# Conversão de um dicionário em um json
json.dumps(dict)

'{"nome": "Guido Van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "Lisp"], "users": 1000000}'

In [0]:
# Abrir um arquivo json, se o arquivo não existir, um novo será criado
# E gravar os dados do dicionário dict no arquivo
with open('/content/sample_data/dados.json', 'w') as arquivo:
  arquivo.write(json.dumps(dict))

In [0]:
# Leitura do arquivo e impressão do conteúdo
with open('/content/sample_data/dados.json', 'r') as arquivo:
  content = arquivo.read()
  data = json.loads(content)
  
print(data)

{'nome': 'Guido Van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'Lisp'], 'users': 1000000}


In [0]:
# Como um arquivo json é um dicionário em Python
# é possível acessar o valor através da chave do objeto
print(data['nome'])

Guido Van Rossum


In [41]:
# Buscar um json na internet
from urllib.request import urlopen

response = urlopen('http://vimeo.com/api/v2/video/57733101.json').read().decode('utf8')
data = json.loads(response)[0]

# Formatar o arquivo json para estrutura legível
pretty_json = json.dumps(data, indent = 4, sort_keys = True)

print(pretty_json)

{
    "description": "Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/",
    "duration": 143,
    "embed_privacy": "anywhere",
    "height": 360,
    "id": 57733101,
    "stats_number_of_comments": 0,
    "stats_number_of_likes": 17,
    "stats_number_of_plays": 5791,
    "tags": "film, ireland, africa, cape town, belfast",
    "thumbnail_large": "http://i.vimeocdn.com/video/436057121_640.jpg",
    "thumbnail_medium": "http://i.vimeocdn.com/video/436057121_200x150.jpg

In [33]:
# Impressão dos dados do arquivo baixado
print('Título: ', data['title'])
print('URL: ', data['url'])
print('Duração: ', data['duration'])
print('Nro de Visualizações: ', data['stats_number_of_plays'])

Título:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Nro de Visualizações:  5791


In [0]:
# Copiar os dados no json para outro arquivo no sistema de arquivos
# Primeiramente baixar o módulo os
import os
arquivo_fonte = '/content/sample_data/dados.json'
arquivo_destino = '/content/sample_data/json_data.txt'

In [0]:
# Método 1
with open(arquivo_fonte, 'r') as origem:
  text = origem.read()
  with open(arquivo_destino, 'w') as destino:
    destino.write(text)    

In [37]:
# Método 2 - Unindo tudo em uma única linha
open(arquivo_destino, 'w').write(open(arquivo_fonte, 'r').read())

107

In [0]:
# Ler o arquivo txt criado
with open('/content/sample_data/json_data.txt') as arquivo:
  texto = arquivo.read()
  data = json.loads(texto)

In [40]:
# Formatar o arquivo json para estrutura legível
pretty_json = json.dumps(data, indent = 4, sort_keys = True)

print(pretty_json)

{
    "linguagem": "Python",
    "nome": "Guido Van Rossum",
    "similar": [
        "c",
        "Modula-3",
        "Lisp"
    ],
    "users": 1000000
}
