# Download Sea Surface Temperature Data

Notebook này tải xuống dữ liệu nhiệt độ bề mặt nước biển toàn cầu từ Copernicus Climate Data Store (CDS).

**Nguồn dữ liệu:** [Satellite Sea Surface Temperature](https://cds.climate.copernicus.eu/datasets/satellite-sea-surface-temperature)

**Thông tin dữ liệu:**
- Dataset: satellite-sea-surface-temperature
- Processing Level: Level 4 (gridded, gap-free)
- Sensor: Combined product (nhiều vệ tinh)
- Version: 3.0
- Thời gian: 1980-2023, tất cả các tháng

**Yêu cầu:**
- Cài đặt `cdsapi`: `pip install cdsapi`
- Đăng ký tài khoản tại [CDS](https://cds.climate.copernicus.eu/)
- Cấu hình API key trong file `~/.cdsapirc`

## 1. Cài đặt thư viện cần thiết

In [26]:
!pip install cdsapi



## 2. Import thư viện

In [27]:
import cdsapi
import os
from pathlib import Path
from datetime import datetime
import time

## 3. Cấu hình API key

**Hướng dẫn lấy API key:**
1. Đăng nhập vào [CDS](https://cds.climate.copernicus.eu/)
2. Vào trang [API key](https://cds.climate.copernicus.eu/api-how-to)
3. Copy UID và API Key
4. Tạo file `~/.cdsapirc` với nội dung:
```
url: https://cds.climate.copernicus.eu/api
key: {UID}:{API Key}
```

**Lưu ý:** URL đã thay đổi, sử dụng `/api` thay vì `/api/v2`

Hoặc chạy cell dưới đây để cấu hình:

In [28]:
# Uncomment và điền thông tin API key của bạn
# import os
# os.makedirs(os.path.expanduser('~'), exist_ok=True)
# with open(os.path.expanduser('~/.cdsapirc'), 'w') as f:
#     f.write('url: https://cds.climate.copernicus.eu/api\n')
#     f.write('key: YOUR_UID:YOUR_API_KEY\n')
# print("API key đã được cấu hình!")

## 4. Thiết lập đường dẫn lưu dữ liệu

In [29]:
# Đường dẫn thư mục lưu dữ liệu
data_dir = Path("../../data/raw/sea_surface_temperature")
data_dir.mkdir(parents=True, exist_ok=True)

print(f"Dữ liệu sẽ được lưu tại: {data_dir}")

Dữ liệu sẽ được lưu tại: ../../data/raw/sea_surface_temperature


## 5. Tải dữ liệu từ CDS API (theo từng năm)

**Lưu ý:** 
- Do giới hạn kích thước request, chúng ta sẽ tải dữ liệu theo từng năm
- Mỗi năm sẽ được lưu thành 1 file riêng
- Quá trình này sẽ mất nhiều thời gian
- Có thể merge các file sau bằng xarray

In [30]:
# Khởi tạo CDS API client
try:
    client = cdsapi.Client()
    print("✓ Kết nối CDS API thành công!")
except Exception as e:
    print(f"✗ Lỗi kết nối CDS API: {e}")
    print("Vui lòng kiểm tra lại file ~/.cdsapirc")
    raise

# Định nghĩa dataset
dataset = "satellite-sea-surface-temperature"

# Danh sách các năm cần tải (bỏ qua 1979 vì có thể không có dữ liệu đầy đủ)
years = list(range(1980, 2024))  # 1980-2023

print(f"Bắt đầu tải dữ liệu lúc: {datetime.now()}")
print(f"Tổng số năm cần tải: {len(years)}")
print(f"Dataset: {dataset}")
print("=" * 60)

# Tải dữ liệu theo từng năm
success_count = 0
failed_years = []

for year in years:
    year_str = str(year)
    output_file = data_dir / f"sst_{year}.nc"
    
    # Bỏ qua nếu file đã tồn tại
    if output_file.exists():
        print(f"✓ Năm {year}: File đã tồn tại, bỏ qua")
        success_count += 1
        continue
    
    # Request cho 1 năm, chỉ lấy ngày 15 mỗi tháng
    request = {
        "processinglevel": "level_4",
        "sensor_on_satellite": "combined_product",
        "version": "3_0",
        "year": [year_str],
        "month": ["01", "02", "03", "04", "05", "06", 
                  "07", "08", "09", "10", "11", "12"],
        "day": ["15"],  # Chỉ lấy giữa tháng
        "variable": "all"
    }
    
    print(f"\n[{success_count + 1}/{len(years)}] Đang tải năm {year}...")
    
    try:
        # Tải dữ liệu
        result = client.retrieve(dataset, request)
        result.download(str(output_file))
        
        # Kiểm tra file size
        file_size_mb = os.path.getsize(output_file) / (1024 * 1024)
        print(f"  ✓ Thành công! Kích thước: {file_size_mb:.2f} MB")
        success_count += 1
        
        # Đợi 2 giây giữa các request để tránh quá tải server
        if year != years[-1]:
            time.sleep(2)
            
    except Exception as e:
        print(f"  ✗ Lỗi: {e}")
        failed_years.append(year)
        continue

# Tổng kết
print("\n" + "=" * 60)
print("KẾT QUẢ TỔNG KẾT:")
print(f"✓ Tải thành công: {success_count}/{len(years)} năm")
if failed_years:
    print(f"✗ Tải thất bại: {len(failed_years)} năm: {failed_years}")
print(f"Hoàn thành lúc: {datetime.now()}")
print(f"Dữ liệu được lưu tại: {data_dir}")

✓ Kết nối CDS API thành công!
Bắt đầu tải dữ liệu lúc: 2026-01-15 02:29:51.359399
Tổng số năm cần tải: 43
Dataset: satellite-sea-surface-temperature

[1/43] Đang tải năm 1981...


2026-01-15 02:29:52,241 INFO Request ID is 08f65aa6-a2c5-4d6c-9ee0-f5f1182e30d2
2026-01-15 02:29:52,519 INFO status has been updated to accepted
2026-01-15 02:30:07,218 INFO status has been updated to running
2026-01-15 02:30:45,632 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 182.51 MB

[2/43] Đang tải năm 1982...


2026-01-15 02:31:54,941 INFO Request ID is 7654ba4d-3c30-4af6-9a52-05ba6379ddb0
2026-01-15 02:31:55,263 INFO status has been updated to accepted
2026-01-15 02:32:09,967 INFO status has been updated to running
2026-01-15 02:32:29,568 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.85 MB

[3/43] Đang tải năm 1983...


2026-01-15 02:33:32,499 INFO Request ID is f3ee7c8e-c479-43bd-822d-bbbb8053ddbc
2026-01-15 02:33:32,768 INFO status has been updated to accepted
2026-01-15 02:33:38,381 INFO status has been updated to running
2026-01-15 02:34:06,951 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 184.76 MB

[4/43] Đang tải năm 1984...


2026-01-15 02:35:02,416 INFO Request ID is 177494e6-b746-4a80-961b-b8080351777e
2026-01-15 02:35:02,684 INFO status has been updated to accepted
2026-01-15 02:35:11,956 INFO status has been updated to running
2026-01-15 02:35:36,862 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 187.51 MB

[5/43] Đang tải năm 1985...


2026-01-15 02:36:35,569 INFO Request ID is 37865daf-37da-4a6e-b37f-053bf1a3241c
2026-01-15 02:36:35,831 INFO status has been updated to accepted
2026-01-15 02:36:45,097 INFO status has been updated to running
2026-01-15 02:37:10,155 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 190.85 MB

[6/43] Đang tải năm 1986...


2026-01-15 02:38:05,320 INFO Request ID is ecc508c9-69b8-4266-bcf7-a66e60e01070
2026-01-15 02:38:05,613 INFO status has been updated to accepted
2026-01-15 02:38:14,967 INFO status has been updated to running
2026-01-15 02:38:40,053 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 189.90 MB

[7/43] Đang tải năm 1987...


2026-01-15 02:39:46,163 INFO Request ID is 2c2c7898-e320-4aa1-884e-badc23ab32be
2026-01-15 02:39:46,511 INFO status has been updated to accepted
2026-01-15 02:40:01,361 INFO status has been updated to running
2026-01-15 02:40:20,919 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.95 MB

[8/43] Đang tải năm 1988...


2026-01-15 02:41:26,914 INFO Request ID is 89cf142f-96a8-431f-93e2-4f4ce66be152
2026-01-15 02:41:27,376 INFO status has been updated to accepted
2026-01-15 02:41:42,019 INFO status has been updated to running
2026-01-15 02:42:01,556 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.58 MB

[9/43] Đang tải năm 1989...


2026-01-15 02:43:03,865 INFO Request ID is 3092f163-10b1-4ad5-bd46-7fd54816327a
2026-01-15 02:43:04,248 INFO status has been updated to accepted
2026-01-15 02:43:13,594 INFO status has been updated to running
2026-01-15 02:43:56,369 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 188.83 MB

[10/43] Đang tải năm 1990...


2026-01-15 02:44:54,532 INFO Request ID is 6d8e83c3-f28b-4bc4-aa48-2eeef3e505d1
2026-01-15 02:44:54,840 INFO status has been updated to accepted
2026-01-15 02:45:09,483 INFO status has been updated to running
2026-01-15 02:45:29,042 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.97 MB

[11/43] Đang tải năm 1991...


2026-01-15 02:46:26,796 INFO Request ID is 4b91b365-1fdd-4119-9e6e-eabafcea6b6e
2026-01-15 02:46:27,063 INFO status has been updated to accepted
2026-01-15 02:46:41,848 INFO status has been updated to running
2026-01-15 02:47:18,713 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 187.21 MB

[12/43] Đang tải năm 1992...


2026-01-15 02:48:19,214 INFO Request ID is 09affd99-f7cb-4e29-b923-3a2b0d187dbf
2026-01-15 02:48:19,936 INFO status has been updated to accepted
2026-01-15 02:48:35,206 INFO status has been updated to running
2026-01-15 02:48:54,867 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 190.07 MB

[13/43] Đang tải năm 1993...


2026-01-15 02:49:59,794 INFO Request ID is 0e4f22e5-c4a8-4b82-af6b-37060e12540c
2026-01-15 02:50:00,103 INFO status has been updated to accepted
2026-01-15 02:50:22,631 INFO status has been updated to running
2026-01-15 02:50:52,023 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 190.88 MB

[14/43] Đang tải năm 1994...


2026-01-15 02:52:02,293 INFO Request ID is befcf691-34b2-4daf-9422-49f23a84652a
2026-01-15 02:52:02,582 INFO status has been updated to accepted
2026-01-15 02:52:17,432 INFO status has been updated to running
2026-01-15 02:52:37,014 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 191.25 MB

[15/43] Đang tải năm 1995...


2026-01-15 02:54:07,497 INFO Request ID is c8a8e3b9-ad19-4dad-9686-c0c95e512f03
2026-01-15 02:54:07,827 INFO status has been updated to accepted
2026-01-15 02:54:18,206 INFO status has been updated to running
2026-01-15 02:54:31,515 INFO status has been updated to accepted
2026-01-15 02:54:43,176 INFO status has been updated to running
2026-01-15 02:55:00,566 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 193.56 MB

[16/43] Đang tải năm 1996...


2026-01-15 02:55:57,183 INFO Request ID is cac4fb3d-4b17-46d1-9454-f7c8f242cb39
2026-01-15 02:55:57,446 INFO status has been updated to accepted
2026-01-15 02:56:12,148 INFO status has been updated to running
2026-01-15 02:56:31,707 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.47 MB

[17/43] Đang tải năm 1997...


2026-01-15 02:58:19,193 INFO Request ID is b8154a31-6e88-4075-94c2-ee026d01bfb9
2026-01-15 02:58:19,491 INFO status has been updated to accepted
2026-01-15 02:58:28,859 INFO status has been updated to running
2026-01-15 02:58:53,739 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 183.46 MB

[18/43] Đang tải năm 1998...


2026-01-15 02:59:44,205 INFO Request ID is 6c9bf829-c41a-48c9-ae65-aa0ab332a3de
2026-01-15 02:59:44,556 INFO status has been updated to accepted
2026-01-15 02:59:59,488 INFO status has been updated to running
2026-01-15 03:00:36,865 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 183.35 MB

[19/43] Đang tải năm 1999...


2026-01-15 03:02:17,967 INFO Request ID is 88479418-6e7d-4b10-88c3-6b4f1ce87e2d
2026-01-15 03:02:18,246 INFO status has been updated to accepted
2026-01-15 03:02:33,094 INFO status has been updated to running
2026-01-15 03:03:36,069 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 183.30 MB

[20/43] Đang tải năm 2000...


2026-01-15 03:04:39,073 INFO Request ID is b5087fd9-9c54-4c30-a240-b673d2a76f9c
2026-01-15 03:04:39,336 INFO status has been updated to accepted
2026-01-15 03:04:48,781 INFO status has been updated to running
2026-01-15 03:06:36,410 INFO status has been updated to successful
                                                                                        

  ✓ Thành công! Kích thước: 183.24 MB

[21/43] Đang tải năm 2001...


2026-01-15 03:07:43,374 INFO Request ID is 05b151a4-197a-4b10-81ec-a8d05cf51010
2026-01-15 03:07:43,657 INFO status has been updated to accepted
2026-01-15 03:07:58,196 INFO status has been updated to running
2026-01-15 03:08:35,123 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 183.38 MB

[22/43] Đang tải năm 2002...


2026-01-15 03:09:53,146 INFO Request ID is f03757c3-ad36-4254-9b62-e973f5df1bf1
2026-01-15 03:09:53,428 INFO status has been updated to accepted
2026-01-15 03:10:02,748 INFO status has been updated to running
2026-01-15 03:10:45,040 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.69 MB

[23/43] Đang tải năm 2003...


2026-01-15 03:11:43,512 INFO Request ID is b937c68d-87db-49a2-97e9-dfa41e03600f
2026-01-15 03:11:43,774 INFO status has been updated to accepted
2026-01-15 03:11:53,114 INFO status has been updated to running
2026-01-15 03:12:35,357 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.24 MB

[24/43] Đang tải năm 2004...


2026-01-15 03:13:25,582 INFO Request ID is e68b6764-24eb-4106-9d57-6d36022ab2ac
2026-01-15 03:13:25,835 INFO status has been updated to accepted
2026-01-15 03:13:40,354 INFO status has been updated to running
2026-01-15 03:14:17,219 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.14 MB

[25/43] Đang tải năm 2005...


2026-01-15 03:15:10,127 INFO Request ID is 1c746cd4-af50-4bc5-85d9-ddd2b6a8f747
2026-01-15 03:15:10,468 INFO status has been updated to accepted
2026-01-15 03:15:25,316 INFO status has been updated to running
2026-01-15 03:16:02,284 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.20 MB

[26/43] Đang tải năm 2006...


2026-01-15 03:17:08,891 INFO Request ID is d5f3cdbf-ff2e-47f5-b5c1-2d88732eece9
2026-01-15 03:17:09,168 INFO status has been updated to accepted
2026-01-15 03:17:18,473 INFO status has been updated to running
2026-01-15 03:18:26,774 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.33 MB

[27/43] Đang tải năm 2007...


2026-01-15 03:19:27,308 INFO Request ID is a9969793-1780-4128-b919-7ec266a6d974
2026-01-15 03:19:27,797 INFO status has been updated to accepted
2026-01-15 03:19:42,346 INFO status has been updated to running
2026-01-15 03:20:01,818 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.57 MB

[28/43] Đang tải năm 2008...


2026-01-15 03:20:48,879 INFO Request ID is 24c61a2c-e458-45a5-b9be-1fcd7f833dcf
2026-01-15 03:20:49,141 INFO status has been updated to accepted
2026-01-15 03:21:03,866 INFO status has been updated to running
2026-01-15 03:21:40,931 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 180.83 MB

[29/43] Đang tải năm 2009...


2026-01-15 03:22:47,492 INFO Request ID is 8300cf72-a8d3-4660-9fba-b74a14177e66
2026-01-15 03:22:47,758 INFO status has been updated to accepted
2026-01-15 03:22:57,024 INFO status has been updated to running
2026-01-15 03:23:39,202 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 180.63 MB

[30/43] Đang tải năm 2010...


2026-01-15 03:24:40,537 INFO Request ID is dd2f0de4-5351-46cc-8793-191d0add89b2
2026-01-15 03:24:40,845 INFO status has been updated to accepted
2026-01-15 03:24:55,690 INFO status has been updated to running
2026-01-15 03:25:32,655 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.26 MB

[31/43] Đang tải năm 2011...


2026-01-15 03:26:12,986 INFO Request ID is 80516d07-4361-4a04-ba6b-97df617b8636
2026-01-15 03:26:13,269 INFO status has been updated to accepted
2026-01-15 03:26:22,436 INFO status has been updated to running
2026-01-15 03:27:04,814 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 180.57 MB

[32/43] Đang tải năm 2012...


2026-01-15 03:28:06,125 INFO Request ID is 8acf521f-e6a3-46cf-8f19-10cd1fd7ed49
2026-01-15 03:28:06,454 INFO status has been updated to accepted
2026-01-15 03:28:15,773 INFO status has been updated to running
2026-01-15 03:28:58,055 INFO status has been updated to successful
                                                                                        

  ✓ Thành công! Kích thước: 179.90 MB

[33/43] Đang tải năm 2013...


2026-01-15 03:29:43,951 INFO Request ID is f70f1096-e6d7-483b-8ce7-f597f7351818
2026-01-15 03:29:44,231 INFO status has been updated to accepted
2026-01-15 03:29:53,623 INFO status has been updated to running
2026-01-15 03:31:40,875 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 176.59 MB

[34/43] Đang tải năm 2014...


2026-01-15 03:32:40,017 INFO Request ID is 50e3a078-d3e6-4bf7-8f15-ec0e3bcbdb0a
2026-01-15 03:32:40,284 INFO status has been updated to accepted
2026-01-15 03:32:49,608 INFO status has been updated to running
2026-01-15 03:34:36,686 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 176.22 MB

[35/43] Đang tải năm 2015...


2026-01-15 03:35:40,453 INFO Request ID is efebbcd9-0bd7-43e3-8af1-7c8eb7d9b40c
2026-01-15 03:35:40,797 INFO status has been updated to accepted
2026-01-15 03:35:50,423 INFO status has been updated to running
2026-01-15 03:36:59,250 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 176.08 MB

[36/43] Đang tải năm 2016...


2026-01-15 03:38:50,204 INFO Request ID is bddd1401-fee1-48db-8f80-6ead1e75f27c
2026-01-15 03:38:50,543 INFO status has been updated to accepted
2026-01-15 03:38:59,861 INFO status has been updated to running
2026-01-15 03:39:42,049 INFO status has been updated to successful
                                                                                        

  ✓ Thành công! Kích thước: 180.75 MB

[37/43] Đang tải năm 2017...


2026-01-15 03:40:32,921 INFO Request ID is f35152ca-ca8d-4989-91ba-c9850ef8618b
2026-01-15 03:40:33,252 INFO status has been updated to accepted
2026-01-15 03:40:42,810 INFO status has been updated to running
2026-01-15 03:41:25,066 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 181.55 MB

[38/43] Đang tải năm 2018...


2026-01-15 03:42:15,267 INFO Request ID is a815fdf9-0093-4713-85b7-5ffd491da4dc
2026-01-15 03:42:15,550 INFO status has been updated to accepted
2026-01-15 03:42:24,825 INFO status has been updated to running
2026-01-15 03:42:49,653 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 183.02 MB

[39/43] Đang tải năm 2019...


2026-01-15 03:43:52,121 INFO Request ID is 01d88a73-7884-4a4f-9b24-3e1366f24e77
2026-01-15 03:43:52,393 INFO status has been updated to accepted
2026-01-15 03:44:01,739 INFO status has been updated to running
2026-01-15 03:44:44,070 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 185.20 MB

[40/43] Đang tải năm 2020...


2026-01-15 03:45:43,455 INFO Request ID is af54a993-eb03-4afe-992b-0bb2cf880ee2
2026-01-15 03:45:43,730 INFO status has been updated to accepted
2026-01-15 03:45:52,945 INFO status has been updated to running
2026-01-15 03:46:35,278 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 185.39 MB

[41/43] Đang tải năm 2021...


2026-01-15 03:47:24,742 INFO Request ID is 0ebe6dff-d6cb-498a-8e53-ce774a557528
2026-01-15 03:47:25,061 INFO status has been updated to accepted
2026-01-15 03:47:34,325 INFO status has been updated to running
2026-01-15 03:47:59,206 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 187.39 MB

[42/43] Đang tải năm 2022...


2026-01-15 03:49:25,944 INFO Request ID is 08d48755-ff50-4b35-9951-ecc70be7d3d4
2026-01-15 03:49:26,210 INFO status has been updated to accepted
2026-01-15 03:49:40,868 INFO status has been updated to running
2026-01-15 03:50:17,757 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 186.78 MB

[43/43] Đang tải năm 2023...


2026-01-15 03:51:16,742 INFO Request ID is fd918bfb-5f90-4a99-9622-cdc6c0bb73e3
2026-01-15 03:51:17,004 INFO status has been updated to accepted
2026-01-15 03:51:39,881 INFO status has been updated to running
2026-01-15 03:52:34,973 INFO status has been updated to successful
                                                                                         

  ✓ Thành công! Kích thước: 187.10 MB

KẾT QUẢ TỔNG KẾT:
✓ Tải thành công: 43/43 năm
Hoàn thành lúc: 2026-01-15 03:53:35.621046
Dữ liệu được lưu tại: ../../data/raw/sea_surface_temperature




## 6. Kiểm tra dữ liệu đã tải

In [31]:
import os

# Liệt kê tất cả các file đã tải
files = sorted(data_dir.glob("sst_*.nc"))

if files:
    total_size = sum(os.path.getsize(f) for f in files)
    total_size_mb = total_size / (1024 * 1024)
    
    print(f"✓ Đã tải {len(files)} file thành công!")
    print(f"  - Tổng kích thước: {total_size_mb:.2f} MB")
    print(f"  - Thư mục: {data_dir}")
    print("\nDanh sách file:")
    for f in files:
        size_mb = os.path.getsize(f) / (1024 * 1024)
        print(f"  - {f.name}: {size_mb:.2f} MB")
else:
    print("✗ Chưa có file nào được tải xuống.")

✓ Đã tải 43 file thành công!
  - Tổng kích thước: 7925.31 MB
  - Thư mục: ../../data/raw/sea_surface_temperature

Danh sách file:
  - sst_1981.nc: 182.51 MB
  - sst_1982.nc: 186.85 MB
  - sst_1983.nc: 184.76 MB
  - sst_1984.nc: 187.51 MB
  - sst_1985.nc: 190.85 MB
  - sst_1986.nc: 189.90 MB
  - sst_1987.nc: 186.95 MB
  - sst_1988.nc: 186.58 MB
  - sst_1989.nc: 188.83 MB
  - sst_1990.nc: 186.97 MB
  - sst_1991.nc: 187.21 MB
  - sst_1992.nc: 190.07 MB
  - sst_1993.nc: 190.88 MB
  - sst_1994.nc: 191.25 MB
  - sst_1995.nc: 193.56 MB
  - sst_1996.nc: 186.47 MB
  - sst_1997.nc: 183.46 MB
  - sst_1998.nc: 183.35 MB
  - sst_1999.nc: 183.30 MB
  - sst_2000.nc: 183.24 MB
  - sst_2001.nc: 183.38 MB
  - sst_2002.nc: 181.69 MB
  - sst_2003.nc: 181.24 MB
  - sst_2004.nc: 181.14 MB
  - sst_2005.nc: 181.20 MB
  - sst_2006.nc: 181.33 MB
  - sst_2007.nc: 181.57 MB
  - sst_2008.nc: 180.83 MB
  - sst_2009.nc: 180.63 MB
  - sst_2010.nc: 181.26 MB
  - sst_2011.nc: 180.57 MB
  - sst_2012.nc: 179.90 MB
  - ss

## 7. Merge các file thành 1 file duy nhất (Optional)

Sử dụng xarray để merge tất cả các file theo thứ tự thời gian:

In [32]:
# Uncomment để cài đặt
# !pip install xarray netCDF4

In [33]:
# Uncomment để merge các file
# import xarray as xr
# 
# print("Đang merge các file...")
# files = sorted(data_dir.glob("sst_*.nc"))
# 
# # Mở và merge tất cả các file
# datasets = [xr.open_dataset(f) for f in files]
# merged_ds = xr.concat(datasets, dim='time')
# 
# # Lưu file merged
# output_merged = data_dir.parent / "sea_surface_temperature_1981-2023_merged.nc"
# merged_ds.to_netcdf(output_merged)
# 
# # Đóng các dataset
# for ds in datasets:
#     ds.close()
# merged_ds.close()
# 
# print(f"✓ Đã merge thành công!")
# print(f"  - File output: {output_merged}")
# print(f"  - Kích thước: {os.path.getsize(output_merged) / (1024**2):.2f} MB")

## 8. Xem thông tin dữ liệu (Optional)

In [34]:
# Uncomment để xem thông tin dữ liệu của 1 năm bất kỳ
# import xarray as xr
# 
# # Mở file của năm đầu tiên
# files = sorted(data_dir.glob("sst_*.nc"))
# if files:
#     ds = xr.open_dataset(files[0])
#     
#     print("Thông tin dataset mẫu (năm đầu tiên):")
#     print(ds)
#     
#     print("\nCác biến trong dataset:")
#     for var in ds.data_vars:
#         print(f"  - {var}: {ds[var].attrs.get('long_name', 'N/A')}")
#     
#     ds.close()

## Kết thúc

Dữ liệu nhiệt độ bề mặt nước biển đã được tải xuống thành công theo từng năm!

**Ưu điểm của phương pháp này:**
- Tránh lỗi "request too large"
- Có thể tiếp tục tải nếu bị gián đoạn
- Dễ dàng quản lý và kiểm tra từng năm

**Các bước tiếp theo:**
1. Merge các file thành 1 file (nếu cần)
2. Xử lý và làm sạch dữ liệu
3. Phân tích xu hướng nhiệt độ theo thời gian
4. Tích hợp với dữ liệu mực nước biển