# Capítulo 03 - Manipulação de Arquivos - Parte 2

## Manipulando arquivos TXT

TXT é a extensão de arquivo para arquivos de texto puro. Não tem formatações.<br>
São utilizados para armazenar dados simples, como listas, notas e documentos de texto.

In [1]:
# Criando o texto para ser gravado
texto = "Cientista de Dados pode ser uma excelente alternativa de carreira.\n"
# concatenando mais um trecho de texto
texto += "Esses profissionais precisam saber como programar em Python.\n"
# concatenando mais um trecho de texto
texto += "E, claro, devem ser proficientes em Data Science."

In [2]:
# Imprimindo o texto
print(texto)

Cientista de Dados pode ser uma excelente alternativa de carreira.
Esses profissionais precisam saber como programar em Python.
E, claro, devem ser proficientes em Data Science.


In [3]:
# Importando o modo os para manipulação de arquivos do computador
import os

In [4]:
# Criando o arquivo e abrindo ele em modo de escrita
arquivo = open(os.path.join("arquivos/cientista.txt"), "w")

In [5]:
# Gravando os dados no arquivo separados por espaços
for palavra in texto.split():
    arquivo.write(palavra + " ")


In [6]:
# Fechando o arquivo
arquivo.close()

In [7]:
# Abrindo o arquivo em modo de leitura
arquivo = open("arquivos/cientista.txt", "r")
conteudo = arquivo.read()
arquivo.close()

print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em Python. E, claro, devem ser proficientes em Data Science. 


### Usando a Expressão `with`

Quando usamos essa expressão, o método `close()` é executado automaticamente.

In [8]:
# Abrindo o arquivo em modo leitura
with open("arquivos/cientista.txt", "r") as arquivo:
    # Atribuindo o conteúdo do arquivo em uma variável
    conteudo = arquivo.read()

In [9]:
# Imprimindo o conteúdo do arquivo
print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em Python. E, claro, devem ser proficientes em Data Science. 


In [10]:
# Imprimindo o texto que foi criado no começo deste notebook
print(texto)

Cientista de Dados pode ser uma excelente alternativa de carreira.
Esses profissionais precisam saber como programar em Python.
E, claro, devem ser proficientes em Data Science.


In [11]:
# Abrindo o arquivo em modo de escrita
with open("arquivos/cientista.txt", "w") as arquivo:
    # Pegando o conteúdo do arquivo do caractere 0 até 18
    arquivo.write(texto[:19])
    # Pulando uma linha (dando enter)
    arquivo.write("\n")
    # Pegando o conteúdo do arquivo do caractere 28 até 65
    arquivo.write(texto[28:66])
    

In [12]:
# Abrindo o arquivo em modo leitura
with open("arquivos/cientista.txt", "r") as arquivo:
    conteudo = arquivo.read()
    
# Imprimindo o conteúdo do arquivo
print(conteudo)

Cientista de Dados 
uma excelente alternativa de carreira.


## Manipulando Arquivos CSV

CSV (Comma-Separated Values) é um formato de arquivo que armazena dados tabulares em formato de texto plano. Cada linha do arquivo CSV representa uma linha da tabela e as colunas são separadas por vírgulas.<br>
Utilizada para exportar e importar dados em diferentes aplicações, como planilhas e banco de dados.<br>
CSV é uma opção simples e universal para compartilhar dados, pois pode ser aberto e editado por muitos aplicativos diferentes, incluindo programas de planilha e editores de texto.

In [13]:
# Importando o módulo CSV
import csv

In [14]:
# Abrindo o arquivo em modo de escrita
with open("arquivos/numeros.csv", "w") as arquivo:
    # Criando o objeto de gravação
    escrever = csv.writer(arquivo)
    
    # Gravando no arquivo linha a linha
    escrever.writerow(("nota1", "nota2", "nota3")) # cabeçalho
    escrever.writerow((63, 87, 92)) # linha 1
    escrever.writerow((61, 79, 76)) # linha 2
    escrever.writerow((72, 64, 91)) # linha 3

In [15]:
# Abrindo o arquivo em modo de leitura com caracteres especiais
with open("arquivos/numeros.csv", "r", encoding="utf8", newline = "\r\n") as arquivo:
    # Criando o objeto de leitura
    leitor = csv.reader(arquivo)
    
    # Imprimindo cada linha do arquivo
    for linha in leitor:
        print(linha)

['nota1', 'nota2', 'nota3']
['63', '87', '92']
['61', '79', '76']
['72', '64', '91']


In [16]:
# Abrindo o arquivo em modo de leitura
with open("arquivos/numeros.csv", "r") as arquivo:
    leitor = csv.reader(arquivo)
    # Gerando uma lista com os dados do arquivo
    dados = list(leitor) 

In [17]:
# Imprimindo a lista
print(dados)

[['nota1', 'nota2', 'nota3'], ['63', '87', '92'], ['61', '79', '76'], ['72', '64', '91']]


In [18]:
# Imprimindo os dados a partir da segunda linha
for linha in dados[1:]:
    print(linha)

['63', '87', '92']
['61', '79', '76']
['72', '64', '91']


## Manipulando Arquivos JSON

JSON (JavaScript Object Notation) é um formato de dados de texto simples e leve que é utilizado para transmitir informações em aplicações web.<br>
Baseado na estrutura de objetos JavaScript e usa pares chave-valor para representar os dados.<br>
Amplamente utilizado como formato de intercâmbio de dados em aplicações web modernas.

In [19]:
# Criando um dicionário
dict_guido = {
    "nome": "Guido Van Rossum",
    "linguagem": "Python",
    "similar": ["C", "Modula-3", "lisp"],
    "users": 1000000
}

In [20]:
# Imprimindo cada par chave-valor do dicionário
for chave, valor in dict_guido.items():
    print(chave, valor)

nome Guido Van Rossum
linguagem Python
similar ['C', 'Modula-3', 'lisp']
users 1000000


In [21]:
# Importando o módulo JSON
import json

In [22]:
# Convertendo o dicionário para um objeto json
json.dumps(dict_guido)

'{"nome": "Guido Van Rossum", "linguagem": "Python", "similar": ["C", "Modula-3", "lisp"], "users": 1000000}'

In [23]:
# Abrindo o arquivo em modo de escrita
with open("arquivos/dados.json", "w") as arquivo:
    # Escrevendo no arquivo a conversão de dicionário para JSON
    arquivo.write(json.dumps(dict_guido))

In [24]:
# Abrindo o arquivo em modo de leitura
with open("arquivos/dados.json", "r") as arquivo:
    # Atribuindo o conteúdo do arquivo na variável
    texto = arquivo.read()
    # Carregando o conteúdo do arquivo  em formato json
    dados = json.loads(texto)

In [25]:
# Imprimindo os dados
dados

{'nome': 'Guido Van Rossum',
 'linguagem': 'Python',
 'similar': ['C', 'Modula-3', 'lisp'],
 'users': 1000000}

In [26]:
# Imprimindo o valor de uma chave
print(dados["nome"])

Guido Van Rossum


### Extração de Arquivos da Web

In [27]:
# Importando o módulo urlopen
from urllib.request import urlopen

# Gravando o arquivo json de um link em uma variável
response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode("utf8")

# Salvando a primeira parte do arquivo carregado em uma variável
dados = json.loads(response)[0]

# Imprimindo os dados
dados

{'id': 57733101,
 'title': 'The Good Man trailer',
 'description': 'Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/',
 'url': 'https://vimeo.com/57733101',
 'upload_date': '2013-01-19 04:01:15',
 'thumbnail_small': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_100x75',
 'thumbnail_medium': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_200x150',
 '

In [28]:
# Imprimindo os dados
print(f"Título: {dados['title']}")
print(f"URL: {dados['url']}")
print(f"Duração: {dados['duration']}")
print(f"Número de visualizações: {dados['stats_number_of_plays']}")

Título: The Good Man trailer
URL: https://vimeo.com/57733101
Duração: 143
Número de visualizações: 6652


### Copiando o conteúdo de um arquivo para outro

In [29]:
# Nomes dos arquivos
arquivo_fonte = "arquivos/dados.json"
arquivo_destino = "arquivos/dados.txt"

In [30]:
# Método 1
with open(arquivo_fonte, "r") as infile:
    # Salvando o conteúdo do arquivo fonte
    text = infile.read()
    with open(arquivo_destino, 'w') as outfile:
        # Escrevendo o conteúdo para o arquivo destino
        outfile.write(text)

In [31]:
# Método 2
# Escrevendo no arquivo destino o conteúdo do arquivo fonte
open(arquivo_destino, "w").write(open(arquivo_fonte, "r").read())

107

In [32]:
# Leitura do arquivo txt
with open("arquivos/dados.txt", "r") as arquivo:
    texto = arquivo.read()
    dados = json.loads(texto)

In [33]:
# Imprimindo os dados
print(dados)

{'nome': 'Guido Van Rossum', 'linguagem': 'Python', 'similar': ['C', 'Modula-3', 'lisp'], 'users': 1000000}
