O Boto3 é a biblioteca oficial da AWS (Amazon Web Services) para Python, projetada para facilitar a interação com os serviços da AWS de forma programática

Session: Uma Session é usada para configurar as opções padrão para comunicação com os serviços da AWS.

Client: Um Client é usado para interagir com um serviço específico da AWS (por exemplo, S3, EC2, DynamoDB). Ele herda as configurações da sessão, mas você também pode especificar configurações específicas do serviço ao criar o client.

# Carregar arquivo no S3

put_object: O método put_object envia um objeto (arquivo) diretamente ao S3 a partir de um fluxo de bytes ou um arquivo aberto. É útil quando você já tem os dados em memória ou em um arquivo aberto que pode ser lido.

upload_file: O método upload_file carrega um arquivo local para o S3. Ele lida com a abertura e a leitura do arquivo para você, facilitando o processo de upload de arquivos locais.

Em resumo, use put_object quando você já tem os dados em memória ou em um arquivo aberto e quer enviar diretamente para o S3. Use upload_file quando você quer carregar um arquivo local para o S3 e não quer lidar com a abertura e a leitura do arquivo manualmente.

In [3]:
import pandas as pd
import boto3
from io import StringIO
#vamos criar um df de exemplo
data = {'id': [1, 2, 3, 4, 5],
        'nome': ['Alice', 'Bob', 'Charlie', 'David', 'Eve']}
df = pd.DataFrame(data)
# Convertendo o DataFrame para CSV em memória
csv_buffer = StringIO()
df.to_csv(csv_buffer, index=False)
# Carregar as credenciais e criar um cliente S3
#(carrego diretamente pois meu aws cli ja esta configurado "aws configure")
session = boto3.Session()
s3_client = session.client('s3')
# Especificar o nome do bucket e o nome do arquivo no S3
bucket_name = 'bucket-create-by-dev1'
file_name = 'tabela.csv'
# Carregar o arquivo CSV para o S3
s3_client.put_object(Bucket=bucket_name, Key=file_name, Body=csv_buffer.getvalue())

{'ResponseMetadata': {'RequestId': 'KM8DS62YNXDKBRQY',
  'HostId': 'dRL2IfBTDRg7mz0AI5q2MkheUjZ9krlS9kda0TbJ6rFehcYgCDtAWaQeY6Fctfv6MeWq+kLdbR8=',
  'HTTPStatusCode': 200,
  'HTTPHeaders': {'x-amz-id-2': 'dRL2IfBTDRg7mz0AI5q2MkheUjZ9krlS9kda0TbJ6rFehcYgCDtAWaQeY6Fctfv6MeWq+kLdbR8=',
   'x-amz-request-id': 'KM8DS62YNXDKBRQY',
   'date': 'Sat, 25 May 2024 02:46:34 GMT',
   'x-amz-server-side-encryption': 'AES256',
   'etag': '"3e9e21bfeb4b98ee196fca14bdb8e46d"',
   'server': 'AmazonS3',
   'content-length': '0'},
  'RetryAttempts': 0},
 'ETag': '"3e9e21bfeb4b98ee196fca14bdb8e46d"',
 'ServerSideEncryption': 'AES256'}

In [24]:
s3_client.upload_file('local_file.txt', bucket_name, 'remote_file.txt')


# Delete objects

In [2]:
import boto3
s3 = boto3.client('s3')

# Nome do bucket e chave do objeto (nome do arquivo) a ser deletado
bucket_name = 'bucket-create-by-dev1'
file_name = 'tabela.csv'

# Deletar o arquivo
s3.delete_object(Bucket=bucket_name, Key=file_name)

{'ResponseMetadata': {'RequestId': 'QG9VB0E1Y80T4EWX',
  'HostId': 'MHryddYBSZbD5nI8T4mG5SsBEg+A/V0szCk1hFhcdTs/qcpOZBzJe664jXmWoft4m1NtcLufUw0=',
  'HTTPStatusCode': 204,
  'HTTPHeaders': {'x-amz-id-2': 'MHryddYBSZbD5nI8T4mG5SsBEg+A/V0szCk1hFhcdTs/qcpOZBzJe664jXmWoft4m1NtcLufUw0=',
   'x-amz-request-id': 'QG9VB0E1Y80T4EWX',
   'date': 'Sat, 25 May 2024 02:44:59 GMT',
   'server': 'AmazonS3'},
  'RetryAttempts': 0}}

# Ler arquivo

In [4]:
import io
bucket_name = 'bucket-create-by-dev1'
file_name = 'tabela.csv'

obj = s3_client.get_object(Bucket=bucket_name, Key=file_name)
df = pd.read_csv(io.BytesIO(obj['Body'].read()))

In [5]:
df

Unnamed: 0,id,nome
0,1,Alice
1,2,Bob
2,3,Charlie
3,4,David
4,5,Eve
