In [8]:
import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import json
import zipfile
import os

In [3]:
# Función para descargar los datos
def download_coco_data(url, save_path):
    response = requests.get(url, stream=True)
    with open(save_path, 'wb') as file:
        for chunk in response.iter_content(chunk_size=8192):
            file.write(chunk)
    print(f'Data downloaded to {save_path}')

In [4]:
# URL base para descargar el dataset de COCO
base_url = 'http://images.cocodataset.org/annotations/annotations_trainval2017.zip'

In [7]:
# Descargar los datos del dataset de COCO
save_path = '../01_ML-CV/data/coco_annotations_trainval2017.zip'
download_coco_data(base_url, save_path)

Data downloaded to ../01_ML-CV/data/coco_annotations_trainval2017.zip


In [9]:
with zipfile.ZipFile(save_path, 'r') as zip_ref:
    zip_ref.extractall('coco_data')
    print('Data extracted to coco_data/')

Data extracted to coco_data/


In [10]:
# Cargar y leer el archivo JSON de anotaciones
annotations_path = 'coco_data/annotations/instances_val2017.json'
with open(annotations_path, 'r') as file:
    coco_data = json.load(file)

In [11]:
# Imprimir algunas estadísticas básicas
print(f"Number of images: {len(coco_data['images'])}")
print(f"Number of annotations: {len(coco_data['annotations'])}")
print(f"Number of categories: {len(coco_data['categories'])}")

Number of images: 5000
Number of annotations: 36781
Number of categories: 80


In [12]:
# Imprimir las categorías disponibles
print("Categories:")
for category in coco_data['categories']:
    print(f"ID: {category['id']}, Name: {category['name']}")

Categories:
ID: 1, Name: person
ID: 2, Name: bicycle
ID: 3, Name: car
ID: 4, Name: motorcycle
ID: 5, Name: airplane
ID: 6, Name: bus
ID: 7, Name: train
ID: 8, Name: truck
ID: 9, Name: boat
ID: 10, Name: traffic light
ID: 11, Name: fire hydrant
ID: 13, Name: stop sign
ID: 14, Name: parking meter
ID: 15, Name: bench
ID: 16, Name: bird
ID: 17, Name: cat
ID: 18, Name: dog
ID: 19, Name: horse
ID: 20, Name: sheep
ID: 21, Name: cow
ID: 22, Name: elephant
ID: 23, Name: bear
ID: 24, Name: zebra
ID: 25, Name: giraffe
ID: 27, Name: backpack
ID: 28, Name: umbrella
ID: 31, Name: handbag
ID: 32, Name: tie
ID: 33, Name: suitcase
ID: 34, Name: frisbee
ID: 35, Name: skis
ID: 36, Name: snowboard
ID: 37, Name: sports ball
ID: 38, Name: kite
ID: 39, Name: baseball bat
ID: 40, Name: baseball glove
ID: 41, Name: skateboard
ID: 42, Name: surfboard
ID: 43, Name: tennis racket
ID: 44, Name: bottle
ID: 46, Name: wine glass
ID: 47, Name: cup
ID: 48, Name: fork
ID: 49, Name: knife
ID: 50, Name: spoon
ID: 51, Name

In [13]:
# Imprimir información de la primera imagen
first_image = coco_data['images'][0]
print(f"First image info:\nID: {first_image['id']}\nFile name: {first_image['file_name']}\nWidth: {first_image['width']}\nHeight: {first_image['height']}")

First image info:
ID: 397133
File name: 000000397133.jpg
Width: 640
Height: 427


# Archivos JSON del Dataset COCO y sus Contenidos

## instances_train2017.json
- **Descripción**: Contiene anotaciones de los objetos en las imágenes del conjunto de entrenamiento de 2017.
- **Datos**:
  - **images**: Lista de imágenes con sus metadatos.
    - `id`: Identificador único de la imagen.
    - `width`: Ancho de la imagen.
    - `height`: Alto de la imagen.
    - `file_name`: Nombre del archivo de la imagen.
    - Otros metadatos como `license` y `date_captured`.
  - **annotations**: Lista de anotaciones de los objetos en las imágenes.
    - `id`: Identificador único de la anotación.
    - `image_id`: Identificador de la imagen a la que pertenece la anotación.
    - `category_id`: Identificador de la categoría del objeto anotado.
    - `bbox`: Caja delimitadora del objeto (coordenadas [x, y, width, height]).
    - `segmentation`: Información de segmentación del objeto (si está disponible).
    - `area`: Área del objeto anotado.
    - `iscrowd`: Indicador de si el objeto es un grupo de objetos.
  - **categories**: Lista de categorías de los objetos anotados.
    - `id`: Identificador único de la categoría.
    - `name`: Nombre de la categoría.
    - `supercategory`: Supercategoría a la que pertenece la categoría (opcional).

## instances_val2017.json
- **Descripción**: Contiene anotaciones de los objetos en las imágenes del conjunto de validación de 2017.
- **Datos**:
  - **images**: Lista de imágenes con sus metadatos.
    - `id`: Identificador único de la imagen.
    - `width`: Ancho de la imagen.
    - `height`: Alto de la imagen.
    - `file_name`: Nombre del archivo de la imagen.
    - Otros metadatos como `license` y `date_captured`.
  - **annotations**: Lista de anotaciones de los objetos en las imágenes.
    - `id`: Identificador único de la anotación.
    - `image_id`: Identificador de la imagen a la que pertenece la anotación.
    - `category_id`: Identificador de la categoría del objeto anotado.
    - `bbox`: Caja delimitadora del objeto (coordenadas [x, y, width, height]).
    - `segmentation`: Información de segmentación del objeto (si está disponible).
    - `area`: Área del objeto anotado.
    - `iscrowd`: Indicador de si el objeto es un grupo de objetos.
  - **categories**: Lista de categorías de los objetos anotados.
    - `id`: Identificador único de la categoría.
    - `name`: Nombre de la categoría.
    - `supercategory`: Supercategoría a la que pertenece la categoría (opcional).

## image_info_test2017.json
- **Descripción**: Contiene información de las imágenes del conjunto de prueba de 2017.
- **Datos**:
  - **images**: Lista de imágenes con sus metadatos.
    - `id`: Identificador único de la imagen.
    - `width`: Ancho de la imagen.
    - `height`: Alto de la imagen.
    - `file_name`: Nombre del archivo de la imagen.
    - Otros metadatos como `license` y `date_captured`.
