In [1]:
# Clonar os repositórios
!git clone https://github.com/lyuwenyu/RT-DETR.git
!git clone https://github.com/pedrozamboni/individual_urban_tree_crown_detection.git

Cloning into 'RT-DETR'...
remote: Enumerating objects: 986, done.[K
remote: Counting objects: 100% (8/8), done.[K
remote: Compressing objects: 100% (7/7), done.[K
remote: Total 986 (delta 1), reused 4 (delta 1), pack-reused 978 (from 1)[K
Receiving objects: 100% (986/986), 620.84 KiB | 20.69 MiB/s, done.
Resolving deltas: 100% (459/459), done.
Cloning into 'individual_urban_tree_crown_detection'...
remote: Enumerating objects: 696, done.[K
remote: Total 696 (delta 0), reused 0 (delta 0), pack-reused 696 (from 1)[K
Receiving objects: 100% (696/696), 184.86 MiB | 16.05 MiB/s, done.
Resolving deltas: 100% (6/6), done.
Updating files: 100% (677/677), done.


In [2]:
import os
from os.path import exists, join, basename, splitext

# Alterando para o diretório correto, onde o repositório foi clonado
%cd /content/RT-DETR

# Instalar as dependências, se necessário
!pip install torch==2.0.1
!pip install torchvision==0.15.2
!pip install onnx==1.14.0
!pip install onnxruntime==1.15.1
!pip install pycocotools
!pip install PyYAML
!pip install scipy

# Adicionar o repositório RT-DETR ao sys.path para importar os módulos
import sys
sys.path.append('/content/RT-DETR')


/content/RT-DETR
Collecting torch==2.0.1
  Downloading torch-2.0.1-cp310-cp310-manylinux1_x86_64.whl.metadata (24 kB)
Collecting nvidia-cuda-nvrtc-cu11==11.7.99 (from torch==2.0.1)
  Downloading nvidia_cuda_nvrtc_cu11-11.7.99-2-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu11==11.7.99 (from torch==2.0.1)
  Downloading nvidia_cuda_runtime_cu11-11.7.99-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cuda-cupti-cu11==11.7.101 (from torch==2.0.1)
  Downloading nvidia_cuda_cupti_cu11-11.7.101-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu11==8.5.0.96 (from torch==2.0.1)
  Downloading nvidia_cudnn_cu11-8.5.0.96-2-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu11==11.10.3.66 (from torch==2.0.1)
  Downloading nvidia_cublas_cu11-11.10.3.66-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cufft-cu11==10.9.0.58 (from torch==2.0.1)
  Downloading nvidia_cufft_cu11-10.9.

In [3]:
import os
import shutil
import json
import random
from PIL import Image

# Caminhos das pastas
base_dir = '/content/individual_urban_tree_crown_detection/'
images_dir = os.path.join(base_dir, 'rgb')
annotations_dir = os.path.join(base_dir, 'bbox_txt')
img_list_dir = os.path.join(base_dir, 'img_list/0')

# Novos diretórios
output_dir = '/content/individual_urban_tree_crown_detection/'
output_images_dir = os.path.join(output_dir, 'images')
output_annotations_dir = os.path.join(output_dir, 'annotations')

# Certifique-se de que os diretórios de saída existem
os.makedirs(output_images_dir, exist_ok=True)
os.makedirs(output_annotations_dir, exist_ok=True)

# Função para processar o conjunto (train, val, test)
def process_set(set_name, image_files, annotation_files, verbose=True):
    # Criar diretório para as imagens do conjunto
    set_images_dir = os.path.join(output_images_dir, set_name)
    os.makedirs(set_images_dir, exist_ok=True)

    images = []
    annotations = []
    annotation_id = 1  # ID único para cada anotação

    for image_id, image_file in enumerate(image_files, 1):
        # Copiar a imagem para o diretório correspondente
        src_image_path = os.path.join(images_dir, image_file)
        dst_image_path = os.path.join(set_images_dir, image_file)
        shutil.copyfile(src_image_path, dst_image_path)
        if verbose: print(f"Copiando imagem '{image_file}'...")

        # Obter as dimensões da imagem
        with Image.open(src_image_path) as img:
            width, height = img.size
            if verbose: print(f"Dimensões da imagem '{image_file}': {width}x{height}")

        # Adicionar entrada para a imagem
        images.append({
            'id': image_id,
            'file_name': image_file,
            'width': width,
            'height': height
        })

        # Ler o arquivo de anotações correspondente
        annotation_file = os.path.splitext(image_file)[0] + '.txt'
        annotation_path = os.path.join(annotation_files, annotation_file)
        if os.path.exists(annotation_path):
            with open(annotation_path, 'r') as f:
                lines = f.readlines()

            for line in lines:
                line = line.strip()
                if not line:
                    continue

                parts = line.split()
                if len(parts) != 4:
                    print(f"Aviso: Formato inválido na linha '{line}' do arquivo '{annotation_path}'.")
                    continue

                try:
                    x_min, y_min, x_max, y_max = map(float, parts)
                except ValueError:
                    print(f"Aviso: Valores não numéricos na linha '{line}' do arquivo '{annotation_path}'.")
                    continue

                # Garantir que as coordenadas estão dentro dos limites da imagem
                x_min = max(0, min(x_min, width - 1))
                y_min = max(0, min(y_min, height - 1))
                x_max = max(0, min(x_max, width - 1))
                y_max = max(0, min(y_max, height - 1))

                bbox_width = x_max - x_min
                bbox_height = y_max - y_min

                if bbox_width <= 0 or bbox_height <= 0:
                    continue

                # Alterar o category_id para 1 (evitar o erro do KeyError)
                annotations.append({
                    'id': annotation_id,
                    'image_id': image_id,
                    'category_id': 1,  # Alterar para 1
                    'bbox': [x_min, y_min, bbox_width, bbox_height],
                    'area': bbox_width * bbox_height,
                    'iscrowd': 0
                })
                annotation_id += 1
        else:
            print(f"Aviso: Arquivo de anotação '{annotation_path}' não encontrado.")

    return images, annotations

# Função para dividir os dados e processar o conjunto de treino, validação e teste
def process_all_sets():
    # Ler a lista de imagens
    set_list_file = os.path.join(img_list_dir, 'train.txt')
    with open(set_list_file, 'r') as f:
        image_files = [line.strip() for line in f.readlines()]

    # Definir a porcentagem para o conjunto de validação (10% do total)
    val_size = int(len(image_files) * 0.1)
    val_image_files = random.sample(image_files, val_size)
    train_image_files = [img for img in image_files if img not in val_image_files]

    # Separar as imagens restantes para o conjunto de teste (caso necessário)
    # Exemplo: 10% para teste, 45% para treino, 45% para validação
    test_size = len(image_files) - val_size - len(train_image_files)
    test_image_files = random.sample([img for img in image_files if img not in train_image_files and img not in val_image_files], test_size)

    # Diretórios para anotações
    train_annotations = annotations_dir
    val_annotations = annotations_dir
    test_annotations = annotations_dir

    # Processar o conjunto de treino
    train_images, train_annotations_data = process_set('train', train_image_files, train_annotations)
    # Processar o conjunto de validação
    val_images, val_annotations_data = process_set('val', val_image_files, val_annotations)
    # Processar o conjunto de teste
    test_images, test_annotations_data = process_set('test', test_image_files, test_annotations)

    # Criar a estrutura final para os arquivos JSON
    coco_format_train = {
        'images': train_images,
        'annotations': train_annotations_data,
        'categories': [
            {
                'id': 1,  # Alterar para 1
                'name': 'Copa de Arvore',
                'supercategory': 'none'
            }
        ]
    }

    coco_format_val = {
        'images': val_images,
        'annotations': val_annotations_data,
        'categories': [
            {
                'id': 1,  # Alterar para 1
                'name': 'Copa de Arvore',
                'supercategory': 'none'
            }
        ]
    }

    coco_format_test = {
        'images': test_images,
        'annotations': test_annotations_data,
        'categories': [
            {
                'id': 1,  # Alterar para 1
                'name': 'Copa de Arvore',
                'supercategory': 'none'
            }
        ]
    }

    # Salvar os arquivos JSON para treino, validação e teste
    with open(os.path.join(output_annotations_dir, 'instances_train.json'), 'w') as f:
        json.dump(coco_format_train, f, indent=4)

    with open(os.path.join(output_annotations_dir, 'instances_val.json'), 'w') as f:
        json.dump(coco_format_val, f, indent=4)

    with open(os.path.join(output_annotations_dir, 'instances_test.json'), 'w') as f:
        json.dump(coco_format_test, f, indent=4)

    print(f"Processamento completo! Arquivos 'instances_train.json', 'instances_val.json' e 'instances_test.json' foram gerados.")

# Chamar a função para processar todos os conjuntos
process_all_sets()


Copiando imagem '100.png'...
Dimensões da imagem '100.png': 512x512
Copiando imagem '35.png'...
Dimensões da imagem '35.png': 512x512
Copiando imagem '125.png'...
Dimensões da imagem '125.png': 512x512
Copiando imagem '19.png'...
Dimensões da imagem '19.png': 512x512
Copiando imagem '53.png'...
Dimensões da imagem '53.png': 512x512
Copiando imagem '40.png'...
Dimensões da imagem '40.png': 512x512
Copiando imagem '122.png'...
Dimensões da imagem '122.png': 512x512
Copiando imagem '22.png'...
Dimensões da imagem '22.png': 512x512
Copiando imagem '93.png'...
Dimensões da imagem '93.png': 512x512
Copiando imagem '43.png'...
Dimensões da imagem '43.png': 512x512
Copiando imagem '1.png'...
Dimensões da imagem '1.png': 512x512
Copiando imagem '103.png'...
Dimensões da imagem '103.png': 512x512
Copiando imagem '130.png'...
Dimensões da imagem '130.png': 512x512
Copiando imagem '42.png'...
Dimensões da imagem '42.png': 512x512
Copiando imagem '49.png'...
Dimensões da imagem '49.png': 512x512
Co

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [12]:
!python3 /content/RT-DETR/rtdetr_pytorch/tools/train.py \
-c /content/RT-DETR/rtdetr_pytorch/configs/rtdetr/rtdetr_r101vd_6x_coco.yml


2024-12-01 21:39:44.905355: I tensorflow/core/util/port.cc:153] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2024-12-01 21:39:44.924401: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:485] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-12-01 21:39:44.945644: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:8454] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-12-01 21:39:44.952121: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1452] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2024-12-01 21:39:44.967162: I tensorflow/core/platform/cpu_feature_guar

In [23]:
import torch
import cv2
import os
from pathlib import Path

# Função para carregar o modelo
def load_model(model_path):
    # Carregar o modelo (supondo que seja um modelo PyTorch)
    model = torch.load(model_path)
    model.eval()  # Definir o modelo como modo de avaliação
    return model

# Função para pré-processar a imagem
def preprocess_image(image_path):
    # Carregar a imagem
    image = cv2.imread(image_path)

    # Realizar o pré-processamento necessário (exemplo: redimensionamento, normalização, etc.)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # Converter para RGB
    image = torch.tensor(image).float()  # Converter para tensor PyTorch (assumindo que o modelo aceite esse formato)
    image = image.permute(2, 0, 1).unsqueeze(0)  # Mudar a forma para [1, C, H, W]
    return image

# Função para fazer a inferência na imagem
def run_inference(model, image):
    # Realizar a inferência no modelo
    with torch.no_grad():
        result = model(image)  # Adaptar dependendo da implementação exata do modelo
    return result

# Função para salvar e exibir resultados
def save_and_display_results(result, output_dir):
    output_path = os.path.join(output_dir, "result.jpg")

    # Aqui você pode fazer qualquer coisa com os resultados, como desenhar caixas delimitadoras.
    # Exemplo: Salvar imagem de saída com caixas desenhadas.
    cv2.imwrite(output_path, result)
    print(f'Resultado salvo em: {output_path}')

    # Exibir a imagem
    cv2.imshow("Resultado", result)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

# Caminho para o arquivo de pesos do modelo
model_path = '/content/RT-DETR/rtdetr_pytorch/checkpoints/rtdetr_r101vd_6x_coco.pth'

# Caminho da imagem de entrada
image_path = '/content/individual_urban_tree_crown_detection/images/val/your_image.jpg'

# Diretório de saída
output_dir = '/content/output_results'

# Criar o diretório de saída, se não existir
Path(output_dir).mkdir(parents=True, exist_ok=True)

# Carregar o modelo
model = load_model(model_path)

# Pré-processar a imagem
image = preprocess_image(image_path)

# Realizar a inferência no modelo
result = run_inference(model, image)

# Salvar e exibir os resultados
save_and_display_results(result, output_dir)


FileNotFoundError: [Errno 2] No such file or directory: '/content/RT-DETR/rtdetr_pytorch/checkpoints/rtdetr_r101vd_6x_coco.pth'

In [19]:
!pip install mmcv-full


Collecting mmcv-full
  Downloading mmcv-full-1.7.2.tar.gz (607 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/607.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m607.9/607.9 kB[0m [31m36.8 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting addict (from mmcv-full)
  Using cached addict-2.4.0-py3-none-any.whl.metadata (1.0 kB)
Collecting yapf (from mmcv-full)
  Using cached yapf-0.43.0-py3-none-any.whl.metadata (46 kB)
Using cached addict-2.4.0-py3-none-any.whl (3.8 kB)
Using cached yapf-0.43.0-py3-none-any.whl (256 kB)
Building wheels for collected packages: mmcv-full
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mpython setup.py bdist_wheel[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m See above for output.
  
  [1;35mnote[0m: This error originates from a subprocess, and is likely not 