## Manipulação de arquivo

## <ul><li>Arquivo .txt</li><li>Arquivo .csv</li><li>Arquivo .json</li></ul>

## Manipulando arquivos de texto

In [18]:
texto = 'Cientista de dados é a profissão que mais tem crescrido no mundo.\n'
texto = texto + 'Estes profissionais precisam se profissionalizar em programação estátistica e machine learning.\n'
texto += 'É claro, em Big Data'

In [19]:
print(texto)

Cientista de dados é a profissão que mais tem crescrido no mundo.
Estes profissionais precisam se profissionalizar em programação estátistica e machine learning.
É claro, em Big Data


In [20]:
# importando o pacote os, pacote sistema operacional serve para você, manipular arquivos, diretórios, manipular variáveis de ambiente
import os

In [21]:
# criando o arquivo, funcao join, modulo path, pacote os
arquivo = open(os.path.join('Notebooks/arquivos/cientista.txt'), 'w')

In [22]:
# escrevendo string indexada na palavra no arquivo
# texto é uma sequência então para cada palavra em uma sequência de caractere, vai concatena palavra concatenado com ' '
for palavra in texto.split():
    arquivo.write(palavra+ ' ')

In [23]:
# fechando arquivo, em modo escrita
arquivo.close()

In [24]:
# abrindo o arquivo em modo leitura
arquivo = open('Notebooks/arquivos/cientista.txt', 'r')

In [25]:
# lendo o arquivo e idexando
conteudo = arquivo.read()
# fechando o arquivo
arquivo.close()

In [26]:
print(conteudo)

Cientista de dados é a profissão que mais tem crescrido no mundo. Estes profissionais precisam se profissionalizar em programação estátistica e machine learning. É claro, em Big Data 


## Usando a expressão with (com)

## <h4>O metodo close() fecha automáticamente</h4>

In [32]:
# com arquivo aberto como arquivo, faça leitura de um arquivo e guarde em uma variável
with open('Notebooks/arquivos/cientista.txt', 'r') as arquivo:
    conteudo = arquivo.read()

In [29]:
# imprimindo a quantidade de dados do conteudo
print(len(conteudo))

183


In [31]:
# imprimindo o conteudo
print(conteudo)

Cientista de dados é a profissão que mais tem crescrido no mundo. Estes profissionais precisam se profissionalizar em programação estátistica e machine learning. É claro, em Big Data 


In [36]:
# usando sequência slice, quando você trabalha com uma sequência de caractere você pode acessar esta sequência
with open('Notebooks/arquivos/cientista.txt', 'w') as arquivo:
    arquivo.write(texto[:21])
    arquivo.write('\n')
    arquivo.write(texto[:33])

In [38]:
# lendo arquivo
arquivo = open('Notebooks/arquivos/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()
print(conteudo)

Cientista de dados é 
Cientista de dados é a profissão 


## Manipulando arquivos csv(comma-separated values)

In [17]:
# importando modulo csv
import csv

In [18]:
with open('Notebooks/arquivos/numeros.csv', 'w') as arquivo:
    writer = csv.writer(arquivo)
    writer.writerow(('primeira','segunda','terceira'))
    writer.writerow((55,93,76)) 
    writer.writerow((62,14,86))

In [19]:
# leitura do arquivo csv
with open('Notebooks/arquivos/numeros.csv', 'r', encoding='utf8', newline = '\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 3
['55', '93', '76']
Número de colunas: 3
['62', '14', '86']


In [21]:
# gerando uma lista com dados do arquivo csv
# isto é muito importante porque transformamos arquivo em objeto em python.
with open('Notebooks/arquivos/numeros.csv', 'r', encoding='utf8', newline = '\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)
    
print(dados)
    

[['primeira', 'segunda', 'terceira'], ['55', '93', '76'], ['62', '14', '86']]


In [22]:
# iteragindo com a lista, tirando o cabeçalho
for linha in dados[1:]:
    print(linha)

['55', '93', '76']
['62', '14', '86']


## Manipulando arquivos JSON (java script object notation)
## <h4>Json(java script objetct notation) É uma maneira de armazenar informações de forma organizada, e de facíl acesso, Em outras palavras eles nos dá uma coleção legivél de dados que podem ser acessados de uma forma muito lógica, Pode ser uma fonte de Big Data.</h4>

In [23]:
# criando um dicionário
dict = {'nome': 'Guido Van Russum',
        'linguagem': 'Python', 
        'similar': ['c', 'modula-3', 'lisp'], 
       'users': 1000000}

In [25]:
# iteração em key e value do dicionario
for k, v in dict.items():
    print(k, v)

nome Guido Van Russum
linguagem Python
similar ['c', 'modula-3', 'lisp']
users 1000000


In [26]:
# importando o pacote json
import json

In [28]:
# convertendo um objeto dicionario para json
json.dumps(dict)

'{"nome": "Guido Van Russum", "linguagem": "Python", "similar": ["c", "modula-3", "lisp"], "users": 1000000}'

In [31]:
# criando um arquivo json
with open('C:/pythonFundamentos/Cap04/Notebooks/arquivos/dados.json', 'w') as arquivo:
    arquivo.write(json.dumps(dict))

In [32]:
# abrindo o arquivo json
with open('C:/pythonFundamentos/Cap04/Notebooks/arquivos/dados.json', 'r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)
    
print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


In [33]:
# acessando item do json apartir da chave
print(data['nome'])

Guido van Rossum


In [34]:
# imprimindo um arquivo json copiado da internet
from urllib.request import urlopen

response = urlopen('http://vimeo.com/api/v2/video/57733101.json').read().decode('utf-8')
data = json.loads(response)[0]

In [40]:
for k, v in data.items():
    print(k, ':', v)

id : 57733101
title : The Good Man trailer
description : Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />
<br />
Check out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/
url : https://vimeo.com/57733101
upload_date : 2013-01-19 04:01:15
thumbnail_small : http://i.vimeocdn.com/video/436057121_100x75.jpg
thumbnail_medium : http://i.vimeocdn.com/video/436057121_200x150.jpg
thumbnail_large : http://i.vimeocdn.com/video/436057121_640.jpg
user_id : 1334563
user_name : Manifesto Films
user_url : https://vimeo.com/manifestofilms
user_portrait

In [41]:
# acessando item do objeto
print('Titulo: ', data['title'])
print('URL: ', data['url'])
print('Duração: ', data['duration'])
print('Numero de visualizações: ', data['stats_number_of_plays'])

Titulo:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Numero de visualizações:  5867


In [46]:
# copiando dados de arquivo para outros, manipulando no S.O
import os
arquivo_fonte = 'C:/pythonFundamentos/Cap04/Notebooks/arquivos/dados.json'
arquivo_destino = 'C:/pythonFundamentos/Cap04/Notebooks/arquivos/json_data.txt'


In [50]:
# metodo 01, metodo with
with open('C:/pythonFundamentos/Cap04/Notebooks/arquivos/dados.json', 'r') as infile:
    texto = infile.read()
    with open('C:/pythonFundamentos/Cap04/Notebooks/arquivos/json_data.txt', 'w') as outfile:
        outfile.write(texto)

In [51]:
# metodo 02, metodos concatenados
open(arquivo_destino, 'w').write(open(arquivo_fonte, 'r').read())

107

In [53]:
# fazendo a leitura do arquivo
with open('C:/pythonFundamentos/Cap04/Notebooks/arquivos/json_data.txt') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


## Fim