# Fundamentos de Python

## Manipulação de arquivos

### Manipulando arquivos txt

In [23]:
texto = 'Cientista de dados é a profissão que mais tem crescido em todo o mundo.\n'
texto = texto + 'Esses profissionais precisam se especializar em programação, estatística e machine learning.\n'
texto += 'E claro, em Big Data.'

In [24]:
print(texto)

Cientista de dados é a profissão que mais tem crescido em todo o mundo.
Esses profissionais precisam se especializar em programação, estatística e machine learning.
E claro, em Big Data.


In [25]:
# importanto o módulo os
# os é um pacote para manipular um sistema operacional

import os

In [26]:
# criando um arquivo

arquivo = open(os.path.join('arquivos/cientista.txt'), 'w')

In [27]:
# gravando os dados no arquivo

for palavra in texto.split(): # texto.split() separa o texto por palavras!!!
    arquivo.write(palavra + ' ')

In [28]:
# fechando o arquivo

arquivo.close()

In [29]:
# lendo o arquivo

arquivo = open('arquivos/cientista.txt', 'r')

In [30]:
arquivo.read()

'Cientista de dados é a profissão que mais tem crescido em todo o mundo. Esses profissionais precisam se especializar em programação, estatística e machine learning. E claro, em Big Data. '

### Usando a expressão with

O método close() é executado automaticamente.

In [31]:
with open('arquivos/cientista.txt', 'r') as arquivo:
    conteudo = arquivo.read()

In [32]:
print(len(conteudo))

187


In [33]:
print(conteudo)

Cientista de dados é a profissão que mais tem crescido em todo o mundo. Esses profissionais precisam se especializar em programação, estatística e machine learning. E claro, em Big Data. 


In [34]:
with open('arquivos/cientista.txt', 'w') as arquivo:
    arquivo.write(texto[:21])
    arquivo.write('\n')
    arquivo.write(texto[:33])

In [35]:
# lendo o arquivo

arquivo = open('arquivos/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Cientista de dados é 
Cientista de dados é a profissão 


### Manipulando arquivos csv

In [36]:
# importando o módulo csv

import csv

In [37]:
# gravando um arquivo csv

with open('arquivos/numeros.csv', 'w') as arquivo:
    writer = csv.writer(arquivo) 
    writer.writerow(('primeira', 'segunda', 'terceira'))
    writer.writerow((55, 93, 76))
    writer.writerow((62, 14, 86))

In [38]:
# leitura do arquivo csv

with open('arquivos/numeros.csv', 'r') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 0
[]
Número de colunas: 3
['55', '93', '76']
Número de colunas: 0
[]
Número de colunas: 3
['62', '14', '86']
Número de colunas: 0
[]


In [39]:
# gerando uma lista com dados do arquivo csv

with open('arquivos/numeros.csv', 'r') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)
print(dados)

[['primeira', 'segunda', 'terceira'], [], ['55', '93', '76'], [], ['62', '14', '86'], []]


In [40]:
# imprimindo a partir da segunda linha

for linha in dados[1:]:
    print(linha)

[]
['55', '93', '76']
[]
['62', '14', '86']
[]


### Manipulando arquivos JSON (Java Script Object Notation)

JSON (Java Script Object Notation) é uma maneira de armazenar informações de forma organizada e de fácil acesso. Em poucas palavras, ele nos dá uma coleção legível de dados que podem ser acessados de forma muito lógica. Pode ser uma fonte de Big Data.

In [41]:
# criando um dicionário

dict = {'nome': 'Guido van Rossum', 
       'linguagem': 'Python',
       'similar': ['c', 'Modula-3', 'lisp'],
       'users': 1000000}

In [42]:
for k, v in dict.items():
    print(k, v)

nome Guido van Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [43]:
# importando o módulo JSON

import json

In [44]:
# convertendo o dicionário para um objeto json

json.dumps(dict)

'{"nome": "Guido van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [45]:
# criando um arquivo json

with open('arquivos/dados.json', 'w') as arquivo:
    arquivo.write(json.dumps(dict)) # escreve um arquivo jason dentro do objeto arquivo

In [47]:
# leitura de arquivos json

with open('arquivos/dados.json', 'r') as arquivo:
    texto = arquivo.read() # leitura do arquivo json dentro do objeto texto
    data = json.loads(texto) # carrega o arquivo json no objeto data

In [48]:
print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


In [49]:
print(data['nome'])

Guido van Rossum


In [55]:
# imprimindo um arquivo json copiado da internet

from urllib.request import urlopen

response = urlopen('http://vimeo.com/api/v2/video/57733101.json').read().decode('utf8')
data = json.loads(response)[0]

In [56]:
print('Título: ', data['title'])
print('URL: ', data['url'])
print('Duração: ', data['duration'])
print('Número de Visualizações: ', data['stats_number_of_plays'])

Título:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Número de Visualizações:  6005


In [57]:
# copiando o conteúdo de um arquivo para outro

import os

arquivo_fonte = 'arquivos/dados.json'
arquivo_destino = 'arquivos/json_data.txt'

In [58]:
# método 1

with open(arquivo_fonte, 'r') as infile:
    text = infile.read()
    with open(arquivo_destino, 'w') as outfile:
        outfile.writer(text)

{'id': 57733101, 'title': 'The Good Man trailer', 'description': 'Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/', 'url': 'https://vimeo.com/57733101', 'upload_date': '2013-01-19 04:01:15', 'thumbnail_small': 'http://i.vimeocdn.com/video/436057121_100x75.jpg', 'thumbnail_medium': 'http://i.vimeocdn.com/video/436057121_200x150.jpg', 'thumbnail_large': 'http://i.vimeocdn.com/video/436057121_640.jpg', 'user_id': 1334563, 'user_name': 'Manifesto Films', 'user_url': 'htt

In [60]:
# método 2

open(arquivo_destino, 'w').write(open(arquivo_fonte, 'r').read())

107

In [61]:
# leitura de arquivos json

with open('arquivos/json_data.txt', 'r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

In [62]:
print(data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


## Fim