## <font color='blue'>Fundamentos de Linguagem Python Para Análise de Dados e Data Science</font>

In [1]:
from platform import python_version
print('Versão da Linguagem Python usada neste jupyter nogtebook: ', python_version())

Versão da Linguagem Python usada neste jupyter nogtebook:  3.11.6


### Manipulando de Arquivos TXT

TXT é a extensão de arquivo para arquivos de texto puro. Um arquivo TXT é um arquivo de texto simples sem formatação, como negrito, itálico ou fontes diferentes. Ele pode ser aberto e editado com muitos aplicativos diferentes, incluindo editores de texto, processadores de texto e IDEs. Arquivos TXT são amplamente utilizados para armazenar dados de texto simples, como listas, notas e documentos de texto. Eles são universais e podem ser lidos em praticamente qualquer dispositivo ou sistema operacional.

In [2]:
texto = "Cientista de Dados pode ser uma excelente alternativa de carreira. \n"
texto += "Esses profissionais precisam saber como programar em python.\n"
texto += "E, claro, devem ser proficientes em Data Science."

In [3]:
print(texto)

Cientista de Dados pode ser uma excelente alternativa de carreira. 
Esses profissionais precisam saber como programar em python.
E, claro, devem ser proficientes em Data Science.


In [4]:
# Importando o módulo OS
import os

In [5]:
# criando um arquivo

# Qual é a diferença entre os codigos abaixo: 
    
arquivo = open(os.path.join('arquivos/cientista.txt'), 'w')

arquivo = open('arquivos/cientista.txt', 'w')

In [6]:
# gravando os dados no arquivo
for palavra in texto.split():
    arquivo.write(palavra + ' ')

In [7]:
# fechando o arquivo
arquivo.close()

In [8]:
# lendo o arquivo
arquivo = open('arquivos/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()
print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em python. E, claro, devem ser proficientes em Data Science. 


### Usando a Expressão With

O método close() é executado automaticamente.

In [9]:
with open('arquivos/cientista.txt', 'r') as arquivo:
    conteudo = arquivo.read()

In [10]:
print(conteudo)

Cientista de Dados pode ser uma excelente alternativa de carreira. Esses profissionais precisam saber como programar em python. E, claro, devem ser proficientes em Data Science. 


In [11]:
print(len(conteudo))

178


In [12]:
with open('arquivos/cientista.txt', 'w') as arquivo:
    arquivo.write(texto[:19])
    arquivo.write('\n')
    arquivo.write(texto[28:66])

In [13]:
# Lendo o arquivo
arquivo = open('arquivos/cientista.txt', 'r')
conteudo = arquivo.read()
arquivo.close()
print(conteudo)

Cientista de Dados 
uma excelente alternativa de carreira.


### Manipulando arquivos CSV
CSV (Comma-Separated Values) é um formato de arquivo que armazena dados tabulares em formato de texto plano. Cada linha do arquivo CSV representa uma linha da tabela e as colunas são separadas por vírgulas. É amplamente utilizado para exportar e importar dados em diferentes aplicações, como planilhas e banco de dados. CSV é uma opção simples e universal para compartilhar dados, pois pode ser aberto e editado com muitos aplicativos diferentes, incluindo programas de planilha e editores de texto.

In [14]:
# Importando o módulo csv
import csv

In [15]:
with open('arquivos/numeros.csv', 'w') as arquivo:
    
    # cria o objecto de gravação
    objetoN = csv.writer(arquivo)
    
    # grava no arquivo linha a linha
    objetoN.writerow(('nota1', 'nota2', 'nota3'))
    objetoN.writerow((63,87,92))
    objetoN.writerow((61,79,76))
    objetoN.writerow((72,64,91))

In [16]:
# Leitura de arquivos csv
with open('arquivos/numeros.csv', 'r', encoding='utf8', newline = '\r\n') as arquivo:
    
    # cria o objecto de leitura
    leitor = csv.reader(arquivo)
    
    # loop
    for x in leitor:
        print(x)
        
# "\t" é uma tabulação, "\n" é uma nova linha e "\r" é um retorno de linha.

['nota1', 'nota2', 'nota3']
['63', '87', '92']
['61', '79', '76']
['72', '64', '91']


In [17]:
# Gerando uma lista com dados do arquivo csv
with open('arquivos/numeros.csv', 'r', newline = '\r\n') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)

In [18]:
print(dados)

[['nota1', 'nota2', 'nota3'], ['63', '87', '92'], ['61', '79', '76'], ['72', '64', '91']]


In [19]:
# Imprimir os dados a partir da segunda linha
for linha in dados[1:]:
    print(linha)

['63', '87', '92']
['61', '79', '76']
['72', '64', '91']


In [20]:
# Apresentando os dados com pandas
import pandas as pd

In [21]:
dadospd = pd.read_csv(open('arquivos/numeros.csv', 'r'))

In [22]:
dadospd.head()

Unnamed: 0,nota1,nota2,nota3
0,63,87,92
1,61,79,76
2,72,64,91


### Manipulando Arquivos JSON (Java Script Object Notation)

JSON (JavaScript Object Notation) é um formato de dados de texto simples e leve que é utilizado para transmitir informações em aplicações web. É baseado em uma estrutura de objetos JavaScript e usa pares de chave-valor para representar dados. JSON é facilmente lido e escrito por máquinas e é amplamente utilizado como formato de intercâmbio de dados em aplicações web modernas.

In [23]:
# Criando um dicionário
dict_guido = {'nome': 'Guido Vam Rossum',
              'linguagem': 'Python',
              'similar': ['c','Modula-3','lisp'],
              'users': 1000000}

In [24]:
for k,v in dict_guido.items():
    print(k,v)

nome Guido Vam Rossum
linguagem Python
similar ['c', 'Modula-3', 'lisp']
users 1000000


In [25]:
# importando o módulo JSON
import json

In [26]:
# convertendo o dicionário para um objecto json
json.dumps(dict_guido)

'{"nome": "Guido Vam Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [27]:
# criando um arquivo JSON --- dumps​ Serializa um objeto Python para uma string no formato JSON.
with open('arquivos/dados.json', 'w') as arquivo:
    arquivo.write(json.dumps(dict_guido))

In [28]:
# Leitura de arquivos Json
with open('arquivos/dados.json', 'r') as arquivo:
    texto = arquivo.read()
    dados = json.loads(texto) # O método json.loads() pode ser usado para analisar uma string JSON válida e convertê-la em um 
                              # dicionário Python.

json.load() pega um objeto de arquivo e retorna o objeto json. Ele é usado para ler dados codificados em JSON de um arquivo e convertê-los em um dicionário Python e desserializar o próprio arquivo, ou seja, aceita um objeto de arquivo.

In [29]:
type(texto)

str

In [30]:
texto

'{"nome": "Guido Vam Rossum", "linguagem": "Python", "similar": ["c", "Modula-3", "lisp"], "users": 1000000}'

In [31]:
# imprime o conteudo 
dados

{'nome': 'Guido Vam Rossum',
 'linguagem': 'Python',
 'similar': ['c', 'Modula-3', 'lisp'],
 'users': 1000000}

In [32]:
# imprimir o valor da chave nome
print(dados['nome'])

Guido Vam Rossum


### Extração de Arquivos da Web

In [33]:
# Imprimindo um arquivo JSON copiado da internet
import json
from urllib.request import urlopen

response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode('utf8')
dados = json.loads(response)[0]

In [34]:
dados

{'id': 57733101,
 'title': 'The Good Man trailer',
 'description': 'Trailer for the Manifesto Films production, The Good Man, now available in UK/Ireland/US/Canada/Australia/New Zealand on iTunes (https://itunes.apple.com/us/movie/the-good-man/id873130906) and DVD (http://www.amazon.co.uk/The-Good-Man-Aiden-Gillen/dp/B00IIK6CGU/). Co-production with Jet Black Entertainment (South Africa). Starring Aidan Gillen, Thabang Sidloyi, Kelly Campbell, Lunathi Mampofu. Written & directed by Phil Harrison. More info at www.thegoodmanfilm.com<br />\r\n<br />\r\nCheck out the Variety Magazine review here: http://www.variety.com/review/VE1117947909/',
 'url': 'https://vimeo.com/57733101',
 'upload_date': '2013-01-19 04:01:15',
 'thumbnail_small': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_100x75',
 'thumbnail_medium': 'https://i.vimeocdn.com/video/436057121-e828a1f5478ec0136e957753d107f2a1268c64def9b82faac37c8e30c031cff2-d_200x150',
 '

In [35]:
print('Título: ', dados['title'])
print('URL: ', dados['url'])
print('Duração: ', dados['duration'])
print('Número de Visualizações: ', dados['stats_number_of_plays'])

Título:  The Good Man trailer
URL:  https://vimeo.com/57733101
Duração:  143
Número de Visualizações:  6713


### Copiando o conteúdo de um arquivo para outro

In [36]:
# Nomes dos arquivos
arquivo_fonte =  'arquivos/dados.json'
arquivo_destino = 'arquivos/dados.txt'

In [37]:
# Método 1
with open(arquivo_fonte, 'r') as infile:
    text = infile.read()
    with open(arquivo_destino, 'w') as outfile:
        outfile.write(text)

In [38]:
# Método 2
open(arquivo_destino, 'w').write(open(arquivo_fonte, 'r').read())

107

In [39]:
# Leitura do arquivo txt
with open(arquivo_destino, 'r') as arquivo:
    txt2 = arquivo.read()
    dados2 = json.loads(txt2)

In [40]:
print(dados2)

{'nome': 'Guido Vam Rossum', 'linguagem': 'Python', 'similar': ['c', 'Modula-3', 'lisp'], 'users': 1000000}
