In [23]:
import boto3
import s3fs
import rasterio
import xarray as xr
import rioxarray
from pystac_client import Client

In [17]:
client_s3 = boto3.client(service_name='s3')

fs = s3fs.S3FileSystem(anon=True)  # anon=True for public data

In [13]:
bucket = 'sentinel-cogs'
prefix = 'sentinel-s2-l2a-cogs/1/C/CV/2024/12'

In [14]:
response = client_s3.list_objects_v2(Bucket=bucket, Prefix=prefix)

for obj in response.get('Contents', []):
    print(obj['Key'])

sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/AOT.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B01.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B02.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B03.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B04.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B05.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B06.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B07.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B08.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B09.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B11.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B12.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/B8A.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/L2A_PVI.tif
sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV

In [20]:
URL = "sentinel-cogs/sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/AOT.tif"

In [18]:
with fs.open('sentinel-cogs/sentinel-s2-l2a-cogs/1/C/CV/2024/12/S2B_1CCV_20241201_0_L2A/AOT.tif') as f:
    data = f.read()

In [31]:
data

b'II*\x00\x08\x00\x00\x00\x13\x00\x00\x01\x03\x00\x01\x00\x00\x00&\x07\x00\x00\x01\x01\x03\x00\x01\x00\x00\x00&\x07\x00\x00\x02\x01\x03\x00\x01\x00\x00\x00\x10\x00\x00\x00\x03\x01\x03\x00\x01\x00\x00\x00\x08\x00\x00\x00\x06\x01\x03\x00\x01\x00\x00\x00\x01\x00\x00\x00\x15\x01\x03\x00\x01\x00\x00\x00\x01\x00\x00\x00\x1c\x01\x03\x00\x01\x00\x00\x00\x01\x00\x00\x00=\x01\x03\x00\x01\x00\x00\x00\x02\x00\x00\x00B\x01\x03\x00\x01\x00\x00\x00\x00\x01\x00\x00C\x01\x03\x00\x01\x00\x00\x00\x00\x01\x00\x00D\x01\x04\x00@\x00\x00\x00\xf2\x01\x00\x00E\x01\x04\x00@\x00\x00\x00\xf2\x00\x00\x00S\x01\x03\x00\x01\x00\x00\x00\x01\x00\x00\x00\x0e\x83\x0c\x00\x03\x00\x00\x00@\x03\x00\x00\x82\x84\x0c\x00\x06\x00\x00\x00X\x03\x00\x00\xaf\x87\x03\x00 \x00\x00\x00\x88\x03\x00\x00\xb1\x87\x02\x00\x1d\x00\x00\x00\xc8\x03\x00\x00\x80\xa4\x02\x00N\x00\x00\x00\xf2\x02\x00\x00\x81\xa4\x02\x00\x02\x00\x00\x000\x00\x00\x00\xe6\x03\x00\x00\x11\x04\x00\x00[\x02\x00\x00\xfd\x05\x00\x00\x95\x00\x00\x00\x95\x00\x00\x00\x95\x0

In [21]:
url = f"s3://{URL}"

with rasterio.open(url, 'r') as src:
    band_data = src.read(1)  # Reads the first band as a numpy array

In [None]:
# For public datasets, you can set AWS_NO_SIGN_REQUEST=YES in your environment.
# Or configure rasterio.env.Env with 'aws_no_sign_request': True.

# rasterio.env.Env = {'aws_no_sign_request': True}

In [32]:
band_data

array([[65, 65, 65, ...,  0,  0,  0],
       [65, 65, 65, ...,  0,  0,  0],
       [65, 65, 65, ...,  0,  0,  0],
       ...,
       [59, 59, 59, ...,  0,  0,  0],
       [59, 59, 59, ...,  0,  0,  0],
       [59, 59, 59, ...,  0,  0,  0]], dtype=uint16)

In [24]:
url = f"s3://{URL}"

ds = rioxarray.open_rasterio(url, 'r')
# ds is now an xarray DataArray you can manipulate, slice, and process.

In [33]:
ds

In [30]:
catalog = Client.open("https://earth-search.aws.element84.com/v0")
# search = catalog.search(collections=["sentinel-2-l2a"], bbox=[...], datetime="2024-12-01")
# items = list(search.get_items())

# # Each item contains assets with S3 URLs
# for item in items:
#     for band_key, asset in item.assets.items():
#         print(asset.href)  # S3 URL to the band data