<a href="https://colab.research.google.com/github/tntnu/20242R0136COSE41600/blob/main/20242R0136COSE41600.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
from google.colab import drive

drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
pip install open3d

Collecting open3d
  Downloading open3d-0.18.0-cp310-cp310-manylinux_2_27_x86_64.whl.metadata (4.2 kB)
Collecting dash>=2.6.0 (from open3d)
  Downloading dash-2.18.2-py3-none-any.whl.metadata (10 kB)
Collecting configargparse (from open3d)
  Downloading ConfigArgParse-1.7-py3-none-any.whl.metadata (23 kB)
Collecting ipywidgets>=8.0.4 (from open3d)
  Downloading ipywidgets-8.1.5-py3-none-any.whl.metadata (2.3 kB)
Collecting addict (from open3d)
  Downloading addict-2.4.0-py3-none-any.whl.metadata (1.0 kB)
Collecting pyquaternion (from open3d)
  Downloading pyquaternion-0.9.9-py3-none-any.whl.metadata (1.4 kB)
Collecting werkzeug>=2.2.3 (from open3d)
  Downloading werkzeug-3.0.6-py3-none-any.whl.metadata (3.7 kB)
Collecting dash-html-components==2.0.0 (from dash>=2.6.0->open3d)
  Downloading dash_html_components-2.0.0-py3-none-any.whl.metadata (3.8 kB)
Collecting dash-core-components==2.0.0 (from dash>=2.6.0->open3d)
  Downloading dash_core_components-2.0.0-py3-none-any.whl.metadata (2.9 

## 데이터 로드

In [None]:
import open3d as o3d
import os

def load_all_pcd_files(folder_path):
    pcd_files = []
    for file_name in os.listdir(folder_path):
        if file_name.endswith('.pcd'):
            file_path = os.path.join(folder_path, file_name)
            pcd = o3d.io.read_point_cloud(file_path)
            pcd_files.append(pcd)
    return pcd_files

# PCD 폴더 경로
folders = [
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/01_straight_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/02_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/03_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/04_zigzag_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/05_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/06_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/07_straight_walk/pcd"
]

# 각 폴더의 PCD 파일 로딩
all_pcd_files = []
for folder in folders:
    pcd_files = load_all_pcd_files(folder)
    all_pcd_files.extend(pcd_files)

print(f"총 {len(all_pcd_files)}개의 PCD 파일이 로드되었습니다.")



# downsampling

In [3]:
import open3d as o3d
import os

def load_all_pcd_files(folder_path):
    """폴더에서 모든 PCD 파일을 로드"""
    pcd_files = []
    if not os.path.exists(folder_path):
        print(f"[ERROR] 경로가 존재하지 않습니다: {folder_path}")
        return pcd_files

    for file_name in os.listdir(folder_path):
        if file_name.endswith('.pcd'):
            file_path = os.path.join(folder_path, file_name)
            try:
                pcd = o3d.io.read_point_cloud(file_path)
                pcd_files.append(pcd)
            except Exception as e:
                print(f"[ERROR] 파일 로드 실패: {file_path} ({e})")
    return pcd_files



In [4]:
def preprocess_point_cloud(pcd, voxel_size=0.2):
    """PCD 데이터 전처리 (노이즈 제거 및 다운샘플링)"""
    # 노이즈 제거
    try:
        pcd, ind = pcd.remove_statistical_outlier(nb_neighbors=20, std_ratio=2.0)
    except Exception as e:
        print(f"[ERROR] 노이즈 제거 실패: {e}")
        return None

    # 다운샘플링
    try:
        pcd = pcd.voxel_down_sample(voxel_size=voxel_size)
    except Exception as e:
        print(f"[ERROR] 다운샘플링 실패: {e}")
        return None

    return pcd




In [5]:
# PCD 폴더 경로
folders = [
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/01_straight_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/02_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/03_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/04_zigzag_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/05_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/06_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/07_straight_walk/pcd"
]



In [6]:
# 각 폴더의 PCD 파일 로딩 및 전처리
all_processed_pcds = []
for folder in folders:
    print(f"[INFO] 폴더 처리 중: {folder}")
    pcd_files = load_all_pcd_files(folder)
    print(f"[INFO] {len(pcd_files)}개의 파일 로드 완료")

    for pcd in pcd_files:
        processed_pcd = preprocess_point_cloud(pcd, voxel_size=0.2)
        if processed_pcd:
            all_processed_pcds.append(processed_pcd)

print(f"총 {len(all_processed_pcds)}개의 PCD 파일이 로드되고 전처리되었습니다.")



[INFO] 폴더 처리 중: /content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/01_straight_walk/pcd
[INFO] 288개의 파일 로드 완료


KeyboardInterrupt: 

In [None]:
# 간단한 결과 확인 (첫 번째 PCD 시각화)
if all_processed_pcds:
    print(f"첫 번째 PCD의 점 개수: {len(all_processed_pcds[0].points)}")
    o3d.visualization.draw_geometries([all_processed_pcds[0]])
else:
    print("[WARNING] 처리된 PCD 데이터가 없습니다.")

# 계층적 샘플링

In [30]:
import os
import random
from collections import defaultdict

def get_files_by_behavior(folders):
    """
    각 행동(폴더)에서 PCD 파일을 분류하여 반환.
    """
    behavior_files = defaultdict(list)
    for folder in folders:
        behavior_name = os.path.basename(os.path.dirname(folder))  # 폴더 이름을 행동 이름으로 사용
        for file_name in os.listdir(folder):
            if file_name.endswith('.pcd'):
                file_path = os.path.join(folder, file_name)
                behavior_files[behavior_name].append(file_path)
    return behavior_files


In [31]:
def stratified_sampling(behavior_files, behavior_ratios):
    """
    각 행동별로 설정된 비율로 데이터를 샘플링.
    """
    sampled_files = []
    for behavior, files in behavior_files.items():
        sample_ratio = behavior_ratios.get(behavior, 0.3)  # 비율이 지정되지 않은 경우 기본값 0.3
        sample_size = int(len(files) * sample_ratio)  # 행동별 샘플링 개수
        sampled_behavior_files = random.sample(files, min(sample_size, len(files)))  # 샘플링
        sampled_files.extend(sampled_behavior_files)  # 결과에 추가
        print(f"[{behavior}] 총 {len(files)}개 중 {len(sampled_behavior_files)}개 샘플링")
    return sampled_files


In [32]:
# 행동별 PCD 파일이 저장된 폴더 리스트
folders = [
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/01_straight_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/02_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/03_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/04_zigzag_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/05_straight_duck_walk/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/06_straight_crawl/pcd",
    "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/data/07_straight_walk/pcd"
]

In [33]:
# 행동별 샘플링 비율 설정
behavior_ratios = {
    "01_straight_walk": 0.6,
    "02_straight_duck_walk": 0.5,
    "03_straight_crawl": 0.3,
    "04_zigzag_walk": 0.5,
    "05_straight_duck_walk": 0.5,
    "06_straight_crawl": 0.4,
    "07_straight_walk": 0.5
}

In [34]:
# 1. 행동별 파일 리스트 가져오기
behavior_files = get_files_by_behavior(folders)

In [35]:
# 각 행동별 파일 수 출력 (디버깅용)
for behavior, files in behavior_files.items():
    print(f"[{behavior}] 총 파일 수: {len(files)}")

[01_straight_walk] 총 파일 수: 288
[02_straight_duck_walk] 총 파일 수: 549
[03_straight_crawl] 총 파일 수: 1260
[04_zigzag_walk] 총 파일 수: 364
[05_straight_duck_walk] 총 파일 수: 577
[06_straight_crawl] 총 파일 수: 774
[07_straight_walk] 총 파일 수: 443


In [36]:
# 2. 계층적 샘플링 수행
sampled_files = stratified_sampling(behavior_files, behavior_ratios)

print("\n샘플링된 총 파일 수:", len(sampled_files))

[01_straight_walk] 총 288개 중 172개 샘플링
[02_straight_duck_walk] 총 549개 중 274개 샘플링
[03_straight_crawl] 총 1260개 중 378개 샘플링
[04_zigzag_walk] 총 364개 중 182개 샘플링
[05_straight_duck_walk] 총 577개 중 288개 샘플링
[06_straight_crawl] 총 774개 중 309개 샘플링
[07_straight_walk] 총 443개 중 221개 샘플링

샘플링된 총 파일 수: 1824


In [37]:
import shutil

In [42]:
# 3. 샘플링된 파일 저장

def save_sampled_files(sampled_files, output_folder):
    """
    샘플링된 파일을 지정된 폴더에 저장.
    """
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    for file_path in sampled_files:
        file_name = os.path.basename(file_path)
        shutil.copy(file_path, os.path.join(output_folder, file_name))

# 3. 샘플링된 파일 저장
output_folder = "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_data_v1/sampled_pcd_files"
save_sampled_files(sampled_files, output_folder)

# 저장된 파일 목록 출력 (디버깅용)
saved_files = os.listdir(output_folder)
print(f"저장된 파일 목록: {saved_files}")

저장된 파일 목록: ['pcd_000170.pcd', 'pcd_000039.pcd', 'pcd_000135.pcd', 'pcd_000196.pcd', 'pcd_000274.pcd', 'pcd_000242.pcd', 'pcd_000015.pcd', 'pcd_000052.pcd', 'pcd_000019.pcd', 'pcd_000081.pcd', 'pcd_000042.pcd', 'pcd_000145.pcd', 'pcd_000286.pcd', 'pcd_000080.pcd', 'pcd_000191.pcd', 'pcd_000204.pcd', 'pcd_000031.pcd', 'pcd_000139.pcd', 'pcd_000027.pcd', 'pcd_000213.pcd', 'pcd_000233.pcd', 'pcd_000004.pcd', 'pcd_000152.pcd', 'pcd_000120.pcd', 'pcd_000217.pcd', 'pcd_000026.pcd', 'pcd_000254.pcd', 'pcd_000011.pcd', 'pcd_000008.pcd', 'pcd_000216.pcd', 'pcd_000202.pcd', 'pcd_000024.pcd', 'pcd_000100.pcd', 'pcd_000230.pcd', 'pcd_000079.pcd', 'pcd_000261.pcd', 'pcd_000250.pcd', 'pcd_000198.pcd', 'pcd_000062.pcd', 'pcd_000193.pcd', 'pcd_000221.pcd', 'pcd_000157.pcd', 'pcd_000239.pcd', 'pcd_000126.pcd', 'pcd_000246.pcd', 'pcd_000143.pcd', 'pcd_000060.pcd', 'pcd_000041.pcd', 'pcd_000037.pcd', 'pcd_000092.pcd', 'pcd_000185.pcd', 'pcd_000272.pcd', 'pcd_000173.pcd', 'pcd_000211.pcd', 'pcd_000022.pcd'

# .

In [3]:
# 시각화에 필요한 라이브러리 불러오기
import open3d as o3d
import numpy as np
import matplotlib.pyplot as plt

# pcd 파일 불러오기, 필요에 맞게 경로 수정
file_path = "/content/drive/MyDrive/ColabNotebooks/20242R0136COSE41600/COSE416_HW1_tutorial/COSE416_HW1_tutorial/test_data/1727320101-665925967.pcd"
# PCD 파일 읽기
original_pcd = o3d.io.read_point_cloud(file_path)

In [4]:
# Voxel Downsampling 수행
voxel_size = 0.5  # 필요에 따라 voxel 크기를 조정하세요. 0.2 -> 0.5로 수정
downsample_pcd = original_pcd.voxel_down_sample(voxel_size=voxel_size)

In [5]:
# Radius Outlier Removal (ROR) 적용
cl, ind = downsample_pcd.remove_radius_outlier(nb_points=6, radius=1.2)
ror_pcd = downsample_pcd.select_by_index(ind)

In [6]:
# RANSAC을 사용하여 평면 추정
plane_model, inliers = ror_pcd.segment_plane(distance_threshold=0.1,
                                             ransac_n=3,
                                             num_iterations=2000)

In [7]:
# 도로에 속하지 않는 포인트 (outliers) 추출
final_point = ror_pcd.select_by_index(inliers, invert=True)

In [8]:
# DBSCAN 클러스터링 적용
with o3d.utility.VerbosityContextManager(o3d.utility.VerbosityLevel.Debug) as cm:
    labels = np.array(final_point.cluster_dbscan(eps=0.5, min_points=5, print_progress=True)) # eps = 0.3 -> 0.5, min_points = 10 -> 5 값 수정 후 클러스터링 성공

[Open3D DEBUG] Precompute neighbors.
[Open3D DEBUG] Done Precompute neighbors.
[Open3D DEBUG] Compute Clusters
[Open3D DEBUG] Done Compute Clusters: 350


In [9]:
# 노이즈 포인트는 검정색, 클러스터 포인트는 파란색으로 지정
colors = np.zeros((len(labels), 3))  # 기본 검정색 (노이즈)
colors[labels >= 0] = [0, 0, 1]  # 파란색으로 지정

final_point.colors = o3d.utility.Vector3dVector(colors)

In [10]:
# 포인트 클라우드를 시각화하는 함수
def visualize_point_cloud(pcd, window_name="Point Cloud", point_size=1.0):
    vis = o3d.visualization.Visualizer()
    vis.create_window(window_name=window_name)
    vis.add_geometry(pcd)
    vis.get_render_option().point_size = point_size
    vis.run()
    vis.destroy_window()

In [13]:
# 시각화 (포인트 크기를 원하는 크기로 조절 가능)
visualize_point_cloud(final_point, point_size=2.0)

# 세션 다운 됨



AttributeError: 'NoneType' object has no attribute 'point_size'