# Manipulação de Arquivos

* Arquivos TXT
* Arquivos CSV 
* Arquivos JSON

## Manipulando Arquivos TXT

In [3]:
# Criando um arquivo de texto
texto = "Cientista de Dados é a profissão que mais tem crescido em todo mundo.\n"
texto = texto + "Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning.\n"
texto += "E claro, em Big Data."


In [4]:
# imprimindo  o arquivo texto
print(texto)

Cientista de Dados é a profissão que mais tem crescido em todo mundo.
Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning.
E claro, em Big Data.


In [5]:
# Importando o módulo OS (operating system)
import os

In [6]:
# Criando um arquivo 
arquivo = open(os.path.join('arquivos/cientista.txt'),'w')

In [8]:
# Gravando os dados no arquivo
for palavra in texto.split():
    arquivo.write(palavra +' ')

In [9]:
# Fechando o arquivo
arquivo.close()

In [10]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt','r')
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. 


## Usando a expressão `with` 

### O método close() é executado automaticamente

In [11]:
with open('arquivos/cientista.txt','r') as arquivo:
    conteudo = arquivo.read()

In [12]:
print(len(conteudo))

370


In [13]:
print(conteudo)

Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. Cientista de Dados é a profissão que mais tem crescido em todo mundo. Esses profissionais precisam se especializar em Programação, Estatística e Machine Learning. E claro, em Big Data. 


In [14]:
# fazendo um fatiamento do arquivo 
with open('arquivos/cientista.txt','w') as arquivo:
    arquivo.write(texto[:21])
    arquivo.write('\n')
    arquivo.write(texto[:33])

In [15]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt','r')
conteudo = arquivo.read()
arquivo.close()

print (conteudo)

Cientista de Dados é 
Cientista de Dados é a profissão 


## Manipulando Arquivos CSV (comma-separated values )

In [16]:
# Importando o módulo csv
import csv

In [17]:
with open('arquivos/numeros.csv','w') as arquivo:
    writer = csv.writer(arquivo)
    writer.writerow(('primeira','segunda','terceira'))
    writer.writerow((55,93,76)) 
    writer.writerow((62,14,86))

In [20]:
# Leitura de arquivos csv
with open('arquivos/numeros.csv','r') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print ('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 0
[]
Número de colunas: 3
['55', '93', '76']
Número de colunas: 0
[]
Número de colunas: 3
['62', '14', '86']
Número de colunas: 0
[]


In [21]:
# Código alternativo para eventuais problemas com linhas em branco no arquivo (encoding='utf8', newline = '\r\n')
with open('arquivos/numeros.csv','r', encoding='utf8', newline = '\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    for x in leitor:
        print ('Número de colunas:', len(x))
        print(x)

Número de colunas: 3
['primeira', 'segunda', 'terceira']
Número de colunas: 3
['55', '93', '76']
Número de colunas: 3
['62', '14', '86']


In [24]:
# Gerando uma lista com dados do arquivo csv
with open('arquivos/numeros.csv','r', encoding='utf8', newline = '\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)
    
    
print (dados)

[['primeira', 'segunda', 'terceira'], ['55', '93', '76'], ['62', '14', '86']]


In [25]:
# Impriminfo a partir da segunda linha
for linha in dados[1:]:
    print (linha)

['55', '93', '76']
['62', '14', '86']


## Manipulando Arquivos JSON (Java Script Object Notation )
* `JSON` (JavaScript Object Notation) é uma maneira de armazenar informações de forma organizada e de fácil acesso. Em poucas palavras, ele nos dá uma coleção legível de dados que podem ser acessados de forma muito lógica. Pode ser uma fonte de Big Data.

In [1]:
# Criando um dicionário
dict = {'nome': 'Nildo Pereira',
        'linguagem': 'Python',
        'similar': ['c','Modula-3','lisp'],
        'users': 1000000}

In [2]:
# imprimindo o dicionário
for k,v in dict.items():
    print (k,v)

nome Guido van Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [3]:
# Importando o módulo Json
import json

In [4]:
# Convertendo o dicionário criado para um objeto Json
json.dumps(dict)

'{"nome": "Guido van Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [5]:
# Criando um arquivo Json
with open('arquivos/dados.json','w') as arquivo:
    arquivo.write(json.dumps(dict))

In [6]:
# Leitura de arquivos Json
with open('arquivos/dados.json','r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)

In [7]:
# imprimindo a variável data
print (data)

{'nome': 'Guido van Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}


In [8]:
# Imprimindo um item do objeto json
print (data['nome'])

Guido van Rossum
