# **_preliminaries: Install Libraries_**
> **외부 라이브러리 설치**

In [1]:
%%capture
!yes | pip install trimesh==3.21.6
!yes | pip install open3d==0.17.0
!yes | pip install natsort==8.3.1

# **_preliminaries: Import Libraries_**
> **필요한 라이브러리를 임포팅**

In [2]:
from typing import Tuple
from natsort import natsorted
from tqdm import tqdm

import os
import json
import errno
import random

import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
%matplotlib inline
import IPython.display as IPd

import plotly.express as px
import plotly.graph_objs as go

import torch
from torch.utils.data import Dataset, DataLoader

import trimesh
import open3d as o3d

from sklearn.decomposition import PCA

from sklearn.svm import SVC



Jupyter environment detected. Enabling Open3D WebVisualizer.
[Open3D INFO] WebRTC GUI backend enabled.
[Open3D INFO] WebRTCWindowSystem: HTTP handshake server disabled.


# **_preliminaries: Set Random seed_**
> **랜덤 시드 고정**

In [3]:
seed = 42

random.seed(seed)
np.random.seed(seed)
os.environ["PYTHONHASHSEED"] = str(seed)

o3d.utility.random.seed(seed)

torch.manual_seed(seed)

<torch._C.Generator at 0x7af9af1d0290>

# **_preliminaries: Set Input Path_**


In [4]:
BASE_PATH = '/kaggle/input/modelnet10-classification/modelnet10'

DATA_PATH   = os.path.join(BASE_PATH, 'dataset')
LABEL_PATH  = os.path.join(BASE_PATH, 'class2Label.json')
SUBMIT_PATH = os.path.join(BASE_PATH, 'sample_submit.csv')

# __ModelNet10__

> **[ModelNet10 Dataset](https://modelnet.cs.princeton.edu/)은 3D 모델 분류를 위한 데이터 셋 중 하나로, 다양한 형태와 크기를 가진 10 종류의 클래스 (bathtub, bed, chair, desk, dresser, monitor, night_stand, sofa, table, toilet)에 속하는 총 4,899개의 3D CAD 모델로 구성되어 있습니다.**
> 
> **ModelNet10은 다양한 각도에서 촬영된 3D CAD 모델로, 이를 통해 물체의 다양한 시점에서의 모습을 포착할 수 있습니다.**

<h3><center>ModelNet10 Preview</center></h3>
<center><img src="https://www.researchgate.net/publication/330933095/figure/fig4/AS:960275410857998@1605958907799/The-some-samples-retrieval-result-on-ModelNet-10.png" width="600" height="500"/></center>
<h4></h4>
<h4><center><a href="https://arxiv.org/pdf/1406.5670.pdf">[source paper] 3D ShapeNets: A Deep Representation for Volumetric Shapes [Zhirong et al.]</a></center></h4>

# __*Visualization*__
> **3D 데이터를 로드 및 시각화**

In [5]:
class_name_list = sorted(os.listdir(os.path.join(DATA_PATH, 'train')))

scene_list = list()

for class_name in class_name_list:
    off = random.choice(os.listdir(os.path.join(DATA_PATH, 'train', class_name)))
    
    mesh = trimesh.load(os.path.join(DATA_PATH, 'train', class_name, off))
    
    scene = trimesh.Scene()
    
    scene.add_geometry(mesh)
    
    scene_list.append(scene)

In [6]:
for class_name, scene in zip(class_name_list, scene_list):
    IPd.display(IPd.HTML(f"<h4 style='text-align:center;'>{class_name}</h4>"))
    IPd.display(scene.show())

# **_Dataset_**

In [7]:
class ModelNet10(Dataset):
    def __init__(self, root: str, split: str, class2label:dict):
        self.root = root
        self.split = split.lower()
        assert split in ['train', 'test']
        
        if class2label is not None:
            self.class2label = class2label
        
        self.path, self.label = list(), list()
        
        if self.split == 'train':
            self.classes = sorted(os.listdir(os.path.join(self.root, self.split)))
            self.le = {self.classes[i]: self.class2label[self.classes[i]] for i in range(len(self.classes))}
        
            for class_name in self.classes:
                class_path = os.path.join(self.root, self.split, class_name)

                for off in os.listdir(class_path):
                    if off.endswith('off'):
                        self.path.append(os.path.join(class_path, off))
                        self.label.append(self.le[class_name])
                    else:
                        raise FileNotFoundError(errno.ENOENT, os.strerror(errno.ENOENT), off)
                        
        elif self.split == 'test':
            fname_list = natsorted(os.listdir(os.path.join(self.root, self.split)))
            for fname in fname_list:
                self.path.append(os.path.join(self.root, self.split, fname))
            
    def __getitem__(self, index):
        if self.split == 'train':
            return self.path[index], self.label[index]
        elif self.split == 'test':
            return self.path[index]
    
    def __len__(self):
        return len(self.path)

In [8]:
# class2Label 파일 로드
with open(LABEL_PATH, 'r') as j:
    class2label = json.load(j)

In [9]:
# 학습 데이터 셋(train_dataset) 및 학습 데이터로더(train_dataloader) 생성
train_dataset = ModelNet10(root=DATA_PATH, split='train', class2label=class2label)
train_dataloader = DataLoader(train_dataset, batch_size=1, shuffle=True)

# 평가 데이터 셋(test_dataset) 및 평가 데이터로더(test_dataloader) 생성
test_dataset = ModelNet10(root=DATA_PATH, split='test', class2label=None)
test_dataloader = DataLoader(test_dataset, batch_size=1, shuffle=False)

In [10]:
# 반복문을 통해 학습 데이터로더로부터 데이터 디렉토리(off)와 정수형 라벨(label)을 받음
for off, label in train_dataloader:
    print(f'TRAIN DATALOADER\npath: {off}\nlabel: {label}\n')
    print(f'TRAIN DATALOADER\npath: {off[0]}\nlabel: {label.item()}'); break
    
# 반복문을 통해 평가 데이터로더로부터 데이터 디렉토리(off)를 받음
for off in test_dataloader:
    print(f'\nTEST  DATALODER\npath: {off[0]}'); break

TRAIN DATALOADER
path: ('/kaggle/input/modelnet10-classification/modelnet10/dataset/train/bathtub/bathtub_0098.off',)
label: tensor([0])

TRAIN DATALOADER
path: /kaggle/input/modelnet10-classification/modelnet10/dataset/train/bathtub/bathtub_0098.off
label: 0

TEST  DATALODER
path: /kaggle/input/modelnet10-classification/modelnet10/dataset/test/0.off


# **_Feature Extraction_**
> **<span style="color:red">다음은 3D 데이터를 표현하는 세 방법(Point Cloud, Voxel, Mesh)에 대한 설명입니다.</span>**

### **<span style="color:CornflowerBlue">I. Point Cloud</span>**
<center><img src="https://upload.wikimedia.org/wikipedia/commons/4/4c/Point_cloud_torus.gif"></center>

> **Point Cloud는 3D 공간 상의 점(Point)들의 집합을 의미합니다. <span style='background-color:yellow'>3D 데이터는 일반적으로 3차원 상의 (x, y, z) 점들을 이용하여 표현하는데, 이들의 집합을 Point Cloud라고 명합니다.</span>**
>
> **Point Cloud는 점(Point)들의 위치와 색상 정보를 담고 있으며, 이를 이용하여 3D 객체를 구성하고 객체의 특징을 추출하여 분석할 수 있는 지표로 활용할 수 있습니다.**

### **<span style="color:CornflowerBlue">II. Voxel</span>**

<center><img src="https://www.ifp.uni-stuttgart.de/img/forschung/computer_vision/ALS-fig2.JPG" width="500" height="400"></center>

> **Voxel은 Volume + Pixel의 합성어로, 3차원 공간에서의 픽셀 형식으로 표현한 방법입니다.**
>
> **<span style='background-color:yellow'>3차원 공간에서 일정한 크기의 정육면체를 이용해 데이터를 표현</span>하며, 각 Voxel에는 해당 위치의 밀도, 질량, 색상 등의 정보를 담고 있습니다.**
>
> **해당 정보를 통해 전체 3D 모델을 표현할 수 있으며, 이산적인 공간을 가지는 Voxel의 특성 상 다른 3D 모델링 방식과는 표현의 차이가 있습니다.**

### **<span style="color:CornflowerBlue">III. Mesh</span>**

<center><img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F99BCFB4C5C360FD426" width="600" height="400"></center>

> **Mesh는 3D 모델링에서 사용되는 격자 구조의 표현 방법으로, 정점(Vertex), 선(Edge), 면(Polygon, Face)을 토대로 물체를 표현하고 인식합니다.**
>
> **그 중 <span style='background-color:yellow'>정점(Vertex)은 Point Cloud의 한 Point와 동일하게 3차원 공간 상의 한 지점의 좌표 (x, y, z)로 표현됩니다.</span>**
>
> **선(Edge)은 정점 간의 연결을 나타내며, 하나의 선은 두 정점을 필요로하므로 두 좌표 (x1, y1, z1), (x2, y2, z2)로 표현됩니다.**
>
> **<span style='background-color:yellow'>면(Polygon, Face)은 정점과 선을 이용하여 구성된 평면 도형으로, 최소 셋 이상의 정점(삼각형)을 필요로 합니다.</span>**

- **아래는 Voxel, Point cloud, Mesh(Polygon mesh)의 그림 및 데이터의 특성을 나타내는 표입니다.**
<center><img src="https://i.ytimg.com/vi/vziVsrCaMHY/maxresdefault.jpg" width="700" height="700"></center>

# **_Read File_**
> **해당 3D 데이터 셋은 OFF 확장자 형식의 파일(.off)로 구성되어 있습니다.**
>
> **<span style='background-color:yellow'>OFF 파일은 3D 모델링에서 자주 사용되는 파일 형식 중 하나로, 다각형 Mesh를 포함하는 3D 객체를 표현하는데 사용됩니다.</span>**
>
> **따라서 OFF 파일로부터 정점(Vertex)과 면(Face)의 정보를 얻을 수 있으며, 아래는 해당 형식의 데이터 파일에 대한 예시와 설명입니다.**

- **OFF 확장자 형식 데이터 파일 예시**

```HTML
OFF
3 1 0
0.0 0.0 0.0
1.0 0.0 0.0
0.0 1.0 0.0
3 0 1 2
```

- **위 예시는 세 정점(Vertex)과 하나의 면(Face)으로 구성된 객체를 표현합니다.**
    - **첫 번째 줄의 OFF는 해당 파일이 .off 확장자 형식임을 나타내는 구분자 역할을 합니다.**
    - **두 번째 줄은 각각 객체의 Vertex, Face, Edge의 총 개수를 나타냅니다.**
        - **<span style="color:gray">이 때 .off 파일 형식은 Edge 정보를 포함하지 않으므로, Edge 개수는 항상 0이 됩니다.</span>**
    - **다음의 세 번째 줄부터 Vertex 개수 만큼의 줄 (3-5줄)은 3차원 상의 Vertex의 좌표 (x, y, z)를 나타냅니다.** 
        - **<span style="color:gray">위 예시에서의 Vertex 좌표의 집합은 Float형 좌표 (x, y, z) = (0.0, 0.0, 0.0), (1.0, 0.0, 0.0), (0.0, 1.0, 0.0)을 포함합니다.</span>**
    - **마지막으로, 여섯 번째 줄부터는 Face를 구성하는 다각형과 Vertex의 인덱스를 나타냅니다.**
        - **<span style="color:gray">위 예시에서의 Face는 (3 0 1 2)로, 차례대로 3은 Face의 형태(삼각형)을, 0, 1, 2는 Vertex의 0 번째 인덱스 (0.0, 0.0, 0.0)와 1 번째 인덱스 (1.0, 0.0, 0.0), 2 번째 인덱스 (0.0, 1.0, 0.0)로 구성되어 있음을 의미합니다.</span>**

In [11]:
def read_off(off: str) -> Tuple[np.array, np.array]:
    with open(off, 'r') as f:
        # [1-1] 예외 처리
        if 'OFF' != f.readline().strip():
            raise ValueError('Not a valid OFF header')
            
        # [1-2] Vertex, Face, Edge의 수
        n_vertex, n_face, n_edge = tuple([int(v) for v in f.readline().strip().split()])
        
        # [1-3] 리스트에 Vertex 정보 추가
        vertices = list()
        for _ in range(n_vertex):
            vertices.append([float(v) for v in f.readline().strip().split()])
            
        # [1-4] 리스트에 Face 정보 추가
        faces = list()
        for _ in range(n_face):
            faces.append([int(v) for v in f.readline().strip().split()][1:])
        
        # Vertex들의 정보를 담은 리스트(vertices)와 Face들의 정보를 담은 리스트(faces)를 각각 numpy array로 변환하여 튜플 형식으로 반환
        return np.array(vertices), np.array(faces)

# **_Select Method_**

In [12]:
method = 'mesh'

# **<span style="color:CornflowerBlue">I. Point Cloud</span>**

## **_Visualization_**
> **Train data를 Point Cloud로 시각화**

In [13]:
class_name = 'chair'

off = random.choice(os.listdir(os.path.join(DATA_PATH, 'train', class_name)))

vertices, faces = read_off(os.path.join(DATA_PATH, 'train', class_name, off))

layout = go.Layout(title={'text':off, 'xanchor':'center', 'yanchor':'top'})
plot_points = go.Scatter3d(x=vertices[:, 0], y=vertices[:, 1], z=vertices[:, 2], 
                           mode='markers', marker=dict(size=3))

fig = go.Figure(data=[plot_points], layout=layout)

fig.show()

## **_Visualization_**
> **Test data를 Point Cloud로 시각화**

- **아래는 Test data 중 하나의 OFF 파일 Point Cloud로 시각화하는 과정입니다.**
    - **해당 과정은 상단 셀과 동일합니다.**

In [14]:
off = random.choice(os.listdir(os.path.join(DATA_PATH, 'test')))

vertices, _ = read_off(os.path.join(DATA_PATH, 'test', off))

layout = go.Layout(title={'text':off, 'xanchor':'center', 'yanchor':'top'})
plot_points = go.Scatter3d(x=vertices[:, 0], y=vertices[:, 1], z=vertices[:, 2], 
                           mode='markers', marker=dict(size=3))

fig = go.Figure(data=[plot_points], layout=layout)

fig.show()

# **_Feature Extraction (Point Cloud)_**

> - **우선, <span style='background-color:yellow'>Point Cloud로부터 Normal Vector(법선 벡터)를 추정합니다. Point Cloud는 3차원 상 한 점을 의미하므로, Normal Vector는 Point Cloud 근처의 점들을 활용하여 추정할 수 있습니다.</span> 다음은 Normal Vector 추정 파이프라인을 설명합니다.**
> - **Normal Vector 추론 파이프라인**
>>
>> **1. Point Cloud의 한 점 P의 Nearest Neigbor(최근접 이웃점, P_K) 획득합니다.**
>>
>> **2. P와 P_K 간의 Covariance Matrix(공분산 행렬, C)를 계산합니다.**
>>
>> **3. C로부터 EigenValues(고유값)와 EigenVectors(고유벡터)를 추정합니다.**
>>
>> **4. EigenValues를 기준으로 EigenVectors를 내림차순으로 정렬합니다.**
>>
>> **5. EigenValues 중 최소 EigenValue에 해당하는 EigenVector를 Normal Vector로 추정합니다.**
>> - **<span style="color:gray">EigenValue는 Point Cloud의 집합인 P와 P_K로 구성된 평면의 기울기를 의미하며, 최소 EigenValue는 평면의 기울기가 가장 작은 방향으로, 해당 EigenValue에 해당하는 EigenVector를 P의 Normal Vector로 추정할 수 있습니다.</span>**
>
> - **위의 Point Cloud로부터 Normal Vector를 추정하는 과정은 open3d 라이브러리의 함수를 통해 구할 수 있습니다.**

> **<span style='background-color:yellow'>Normal Vector의 x, y, z 각 축의 데이터를 히스토그램을 이용하여 Feature를 추출합니다.</span>**
> - **Histogram(히스토그램)**
>> **히스토그램이란 데이터의 빈도를 그래프로 나타내는 방법입니다. 히스토그램은 전체 데이터를 일정한 간격으로 나누고, 각 구간에 속하는 데이터의 빈도를 막대 그래프로 나타냅니다.**
>>
>> **아래의 Example of Histogram of Normal Vector에서 오른쪽 그래프는 히스토그램을 의미합니다. 히스토그램은 데이터를 일정 구간으로 정하여 표현할 수 있는 장점으로 인해, Feature Extraction을 위해 자주 사용되는 방법입니다.**


- **<span style='background-color:yellow'>Point Cloud로부터 Normal Vector를 추정하고, 추정된 Normal Vector의 축 별 히스토그램을 쌓아 데이터를 표현하는 방식을 통해 Point Cloud의 Geometric한 Feature를 기술할 수 있습니다.</span>**

<center><img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fu51mL%2FbtqPPCiAG3h%2FpbxiYSKY4i9iqJjwaElEf1%2Fimg.png" width="500" height="500"></center>
<h5><center>Example of Normal Vector of Point Cloud</center></h5>

<center><img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fd9Nghi%2FbtqPYjhHHNI%2F4xDT51NNLhQzNHwMKu6GXK%2Fimg.png" width="600" height="600"></center>
<h5><center>Example of Histogram of Normal Vector</center></h5>
<h4><center><a href="https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=990988">[source paper] 3D Object Recognition from Range Images using Local Feature Histograms [Hetzel et al., 2001]</a></center></h4>

- **Point Cloud로부터 Normal Vector(법선 벡터)를 추정합니다.**

> **[2-1] <span style="color:RoyalBlue">Point Cloud를 받아 인스턴스 변수에 저장</span>** 
>
> - **인스턴스의 points에 함수 인자로 받은 point_cloud를 3D Point Cloud Vector 형태로 저장합니다.**
>> **<span style="color:Red">o3d.utility.Vector3dVector() 함수를 사용합니다.</span>**
>> - **해당 함수는 인자로 받은 point_cloud를 Open3D에서 사용하는 3D Vector Point Cloud 형태로 변환하여 Open3D형 인스턴스의 함수를 사용할 수 있도록 합니다.**
>
> **[2-2] <span style="color:RoyalBlue">Open3D 인스턴스로부터 Normal Vector 추정</span>**
>
> - **인스턴스 변수로부터 Open3D의 내장 함수를 사용하여 법선 벡터를 추정합니다.**
>> **<span style="color:Red">Open3D 인스턴스 내장 함수인 estimate_normals() 함수를 사용합니다.</span>** 
>> - **해당 함수가 정상적으로 작동되려면 [2-1]에서의 구현이 정상적으로 작동되어, 인스턴스의 points 속성에 Open3D형 Point Cloud 데이터가 포함되어 있어야합니다.**
>>
>> **estimate_normals() 함수의 파라미터로는 다음이 사용됩니다.**
>> - **search_param: 법선 추정을 위해 사용되는 검색 알고리즘입니다. 이번에는 KD-Tree와 Ball-Tree 검색 알고리즘을 혼합한 방식이 사용됩니다. (o3d.geometry.KDTreeSearchParamHybrid())**
>> - **다시, KDTreeSearchParamHybrid()함수는 radius와 max_nn 파라미터를 받아 사용합니다.**
>>     - **<span style="color:gray">radius는 주변 이웃 점(Point)을 검색하기 위한 반경을, max_nn은 최대 이웃 점의 개수를 의미합니다.</span>**
>
> **[2-3] <span style="color:RoyalBlue">추정된 Normal Vector를 반환</span>**
>
> - **추정된 Normal Vector는 Open3D 인스턴스 내 normals에 저장되어 있습니다. 이를 numpy array 형식으로 변환하여 반환합니다.**

- **참고: [Open3D Gemotry Documentation](http://www.open3d.org/docs/release/python_api/open3d.geometry.html#)**

In [15]:
def estimate_normal_vector_from_point_cloud(point_cloud, radius: int = None, max_nn: int = None) -> np.array:
    # Open3D 라이브러리에서 제공하는 Point Cloud 데이터를 다루는 함수를 활용해 인스턴스 변수 pcd를 반환받음
    pcd = o3d.geometry.PointCloud()
    
    # [2-1] Point Cloud 인자(point_cloud)로부터 3D Vector인 Point Cloud 형으로 인스턴스의 points(pcd.points)에 저장 
    pcd.points = o3d.utility.Vector3dVector(point_cloud)
    # [2-2] Open3D 인스턴스로부터 Normal Vector 추정
    pcd.estimate_normals(search_param=o3d.geometry.KDTreeSearchParamHybrid(radius=radius, max_nn=max_nn))
    # [2-3] Open3D 인스턴스로부터 추정된 Normal Vector를 numpy array로 변환하여 반환
    return np.array(pcd.normals)

- **Normal Vector (x, y, z)의 각 축 (x축, y축, z축)의 데이터를 히스토그램을 이용하여 Feature를 추출합니다.**

In [16]:
def compute_histogram_of_normal_vector(normal_vector, n_bins: int = 10, n_range: tuple = (-1,1)):
    # [3-1] Normal Vector의 축 별 히스토그램 생성
    x_normal_histogram, _ = np.histogram(normal_vector[:, 0], bins=n_bins, range=n_range)
    y_normal_histogram, _ = np.histogram(normal_vector[:, 1], bins=n_bins, range=n_range)
    z_normal_histogram, _ = np.histogram(normal_vector[:, 2], bins=n_bins, range=n_range)
    # [3-2] 생성된 1차원 히스토그램 배열 결합
    histogram_feature = np.concatenate((x_normal_histogram, y_normal_histogram, z_normal_histogram), axis=0)
    # [3-3] 결합한 배열 정규화
    normalized_feature = histogram_feature / np.sum(histogram_feature)
    # [3-3]에서 정규화한 배열을 반환
    return normalized_feature

In [17]:
if method == 'point_cloud':
    # 학습 데이터 (x_train_point_cloud), 학습 라벨 (y_train_point_cloud)을 담을 리스트 생성
    x_train_point_cloud, y_train_point_cloud = list(), list()
    
    # pbar 변수는 tqdm(반복문의 진행 상황을 시각화하여 보여주는 라이브러리)을 담음
    pbar = tqdm(enumerate(train_dataloader, start=1))
    for i, (off_, label_) in pbar:
        # off: OFF 확장자 파일 디렉토리, label: off 파일에 해당하는 정수형 라벨
        off, label = off_[0], label_.item()
        
        # [4-1] 데이터 파일을 읽어 Point Cloud를 추출
        vertices, _ = read_off(off)
        # [4-2] 추출한 Point Cloud로부터 Normal Vector 추정 (estimate_normal_vector_from_point_cloud() 함수 사용)
        normal = estimate_normal_vector_from_point_cloud(vertices, radius=5, max_nn=30)
        # [4-3] 추정된 Normal Vector로부터 히스토그램 기반 학습 Feature 생성 (compute_histogram_of_normal_vector() 함수 사용)
        feature = compute_histogram_of_normal_vector(normal, n_bins=32, n_range=(-1, 1))
        # [4-3]에서 생성한 학습 Feature를 학습 데이터(x_train_point_cloud)에 추가
        x_train_point_cloud.append(feature)
        y_train_point_cloud.append(label)

        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(train_dataset) * 100:.1f}%')

    # 학습 데이터와 학습 라벨을 numpy array 형식으로 변환
    x_train_point_cloud = np.asarray(x_train_point_cloud)
    x_train_point_cloud = np.asarray(x_train_point_cloud)

In [18]:
if method == 'point_cloud':
    # 평가 데이터 (x_test_point_cloud)을 담을 리스트 생성
    x_test_point_cloud = list()
    
    # 상단 셀에서의 예시와 같이, tqdm은 test_dataloader를 받습니다.
    pbar = tqdm(enumerate(test_dataloader, start=1))
    for i, (off_) in pbar:
        # off: OFF 확장자 파일 디렉토리, test_dataloader는 라벨이 없이 off 파일만 존재
        off = off_[0]
        
        # [5-1] 데이터 파일을 읽어 Point Cloud를 추출
        vertices, _ = read_off(off)
        # [5-2] 추출한 Point Cloud로부터 Normal Vector 추정 (estimate_normal_vector_from_point_cloud() 함수 사용)
        normal = estimate_normal_vector_from_point_cloud(vertices, radius=5, max_nn=30)
        # [5-3] 추정된 Normal Vector로부터 히스토그램 기반 평가 Feature 생성 (compute_histogram_of_normal_vector() 함수 사용)
        feature = compute_histogram_of_normal_vector(normal, n_bins=32, n_range=(-1, 1))
        # [5-3]에서 생성한 학습 Feature를 평가 데이터(x_test_point_cloud)에 추가
        x_test_point_cloud.append(feature)
        
        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(test_dataset) * 100:.1f}%')

    # 평가 데이터를 numpy array 형식으로 변환
    x_test_point_cloud = np.asarray(x_test_point_cloud)

> **Voxel로부터 Hand-Crafted Feature를 기술하는 전체 파이프라인은 다음과 같습니다.**
>
- **<span style="color:Red">Voxelization</span>**
> **<span style='background-color:yellow'>Voxelization이란 3D 모델을 표현하는 Point Cloud를 일정한 Grid 형태의 3D Voxel Grid로 변환하는 과정입니다.</span>** 
>
> **Voxelization을 통해 3D 모델을 Voxel 단위로 분할하여 3D 데이터를 보다 쉽게 다룰 수 있는 장점이 있습니다.**
>
- **<span style="color:Red">Compute Occupancy in Voxel Grid</span>**
> **<span style='background-color:yellow'> 일정한 간격의 Voxel Grid 내 Point Cloud (x, y, z)가 차지하는 비율을 구합니다.</span>** 
>
> **총 Voxel 수, Point Cloud가 있는 Voxel 수, Voxel Grid 내 Point Cloud가 차지한 비율을 구하여 Feature로 가공합니다.**

- **Occupancy 기반 Feature Extraction은 Naive한 접근 방식으로, 특히 로봇 공학 분야에서 많이 사용되는 3D 표현 방식 중 하나입니다.**


<center><img src="https://davidstutz.de/wordpress/wp-content/uploads/2018/04/voxelization-screenshot.jpg" width="600" height="400"></center>
<h5><center>Example of Voxelization and Occupancy Grid</center></h5>
<h4><center><a href="http://graphics.stanford.edu/courses/cs233-21-spring/ReferencedPapers/voxnet_07353481.pdf">[source paper] Voxnet: A 3d convolutional neural network for real-time object recognition [Maturana et al., 2015]</a></center></h4>

- **Point Cloud로부터 Voxel Grid를 생성합니다.**

> **[6-1] <span style="color:RoyalBlue">Point Cloud를 받아 인스턴스 변수에 저장</span>** 
>
> - **해당 과정은 [2-1]과 동일합니다.**
>
> **[6-2] <span style="color:RoyalBlue">Point Cloud를 Voxel Grid로 변환</span>**
>
> - **Open3D의 함수를 사용하여 Point Cloud를 Voxel Grid로 변환합니다.**
>> **<span style="color:Red">o3d.geometry.VoxelGrid.create_from_point_cloud() 함수를 사용합니다.</span>**
>>
>> - **해당 함수는 point_cloud를 입력 인자로 받으며, voxel_size, min_bound, max_bound의 파라미터를 가집니다. Baseline에서는 입력 point_cloud 외의 파라미터를 디폴트로 설정하여 진행합니다.**
>>
>> - **해당 함수는 Voxelization 과정을 직접 구현하여 실행 시, 데이터 양으로 인한 Kaggle RAM이 부족하여 세션이 종료되는 이슈를 극복하고자 사용되었습니다.**

```python
def create_voxel_grid(point_cloud, voxel_size):
    min_bounds = np.min(point_cloud, axis=0)
    max_bounds = np.max(point_cloud, axis=0)

    voxel_counts = np.ceil((max_bounds - min_bounds) / voxel_size).astype(int)
    x_count, y_count, z_count = voxel_counts

    voxel_grid = np.zeros((x_count, y_count, z_count), dtype=bool)

    voxel_indices = ((point_cloud - min_bounds) / voxel_size).astype(int)

    voxel_grid[voxel_indices[:, 0], voxel_indices[:, 1], voxel_indices[:, 2]] = True

    return voxel_grid
```

> **[6-3] <span style="color:RoyalBlue">Voxel의 인덱스 정보 추출</span>**
>
> - **[6-2] 에서 구한 Voxel Grid로부터 인덱스 정보를 추출하여 stack합니다.**
>
> - **인덱스 정보는 Point Cloud가 있는 Voxel Grid의 인덱스를 의미합니다.**
>> **<span style="color:Red">np.stack() 함수를 사용합니다.</span>**

In [19]:
def create_voxel_grid(point_cloud, voxel_size: int) -> np.array:
    # Open3D 라이브러리에서 제공하는 Point Cloud 데이터를 다루는 함수를 활용해 인스턴스 변수 pcd를 반환받음
    pcd = o3d.geometry.PointCloud()
    
    # [6-1] Point Cloud 인자(point_cloud)로부터 3D Vector인 Point Cloud 형으로 인스턴스의 points(pcd.points)에 저장 
    pcd.points = o3d.utility.Vector3dVector(point_cloud)
    # [6-2] Point Cloud를 Voxel Grid로 변환하여 변수에 저장
    voxel_grid = o3d.geometry.VoxelGrid.create_from_point_cloud(pcd, voxel_size=voxel_size)
    # 모든 Voxel의 정보(Voxel의 좌표(center), 크기 (extent), 인덱스(grid_index))를 담은 리스트를 추출
    voxels = voxel_grid.get_voxels()
    # [6-3] 모든 voxels의 인덱스 정보 (grid_index)를 쌓은 numpy 배열을 생성
    indices = np.stack([vx.grid_index for vx in voxels])
    # [6-3]에서 생성한 numpy 배열을 반환
    return np.array(indices)

### **Compute Occupancy in Voxel Grid**

- **Voxel Grid 내 Occupancy(점유율)을 구합니다.**

> - **Voxel Grid의 크기 (n_voxels), Voxel Grid 내 Point Cloud가 존재하는 Grid의 수 (n_occupied_voxels), 점유율 (occupancy)를 구합니다.**
>
> - **이 때, 점유율 (occupancy)은 Point Cloud가 존재하는 Grid의 수를 Voxel Grid의 크기로 나누어 구합니다.**
>
> **[7-1] <span style="color:RoyalBlue">Voxel Grid의 각 축 (x, y, z)에서 점유율을 구함</span>** 
>> **<span style="color:Red">np.count_nonzero(), np.sum(), np.column_stack() 함수를 사용합니다.</span>**
>
> - **x축에서의 점유율을 구하는 파이프라인 예시는 다음과 같습니다.**
>> **1. Voxel Grid에서 y축과 z축에 해당하는 열을 모은 2차원 배열을 만듭니다 <span style="color:Red">(np.column_stack())</span>**
>>
>> **2. 2차원 배열의 합을 통해 x축에 대한 Voxel의 분포를 구합니다. <span style="color:Red">(np.sum(axis=1))</span>**
>>
>> **2-1. 2차원 배열의 합은 y축, z축의 인덱스 값을 더한 것을 나타내며, 이를 통해 x축에 대한 Voxel의 분포를 알 수 있습니다.**
>>
>> **3. x축의 분포 중, 0이 아닌 요소의 수를 구합니다. 이는 Point Cloud의 x축 방향으로의 분포 정도를 의미합니다. <span style="color:Red">(np.count_nonzero())</span>**
>
> **[7-2] <span style="color:RoyalBlue">축 별 점유율을 numpy array로 column 방향으로 쌓은 후 정규화</span>** 
>
> - **[7-1]에서 각 축 (x, y, z) 별로 구한 점유율을 열 방향으로 쌓은 이후, Voxel Grid의 크기로 나누어 정규화합니다.**
>
> - **정규화한 배열을 점유율 (axis)과 결합하여 학습 Feature로 사용합니다.**
>> **<span style="color:Red">np.array([list, list, list]) 혹은 np.column_stack() 함수를 사용합니다.</span>**

In [20]:
def compute_occupancy(voxel_grid) -> Tuple[np.array, np.array]:
    # Voxel Grid의 크기 (n_voxels), Voxel Grid 내 Point Cloud가 존재하는 Voxel의 수 (n_occupied_voxels), 점유율 (occupancy)을 구함
    # n_occupied_voxels는 Voxel Grid 내 z축의 인덱스 (voxel_grid[:, -1])가 0이 아닌 수를 세어 구함
    n_voxels = voxel_grid.shape[0]
    n_occupied_voxels = np.count_nonzero(voxel_grid[:, -1])
    occupancy = n_occupied_voxels / n_voxels
    
    # [7-1] Voxel Grid의 각 축 (x, y, z)에서의 점유율을 구합니다.
    occupied_x = np.count_nonzero(np.sum(np.column_stack((voxel_grid[:, 1], voxel_grid[:, 2])), axis=1))
    occupied_y = np.count_nonzero(np.sum(np.column_stack((voxel_grid[:, 0], voxel_grid[:, 2])), axis=1))
    occupied_z = np.count_nonzero(np.sum(np.column_stack((voxel_grid[:, 0], voxel_grid[:, 1])), axis=1))
    # [7-2] 축 별 점유율을 numpy array로 column 방향으로 쌓은 후 정규화
    axis_occupancy = np.array([occupied_x, occupied_y, occupied_z]) / n_voxels
    # [7-2]에서 구한 numpy array 변수를 axis_occupancy라고 명함
    return np.array([occupancy]), axis_occupancy

In [21]:
if method == 'voxel':
    # 학습 데이터 (x_train_voxel), 학습 라벨 (y_train_voxel)을 담을 리스트 생성
    x_train_voxel  = list()
    y_train_voxel = list()
    
    pbar = tqdm(enumerate(train_dataloader, start=1))
    for i, (off_, label_) in pbar:
        off, label = off_[0], label_.item()
        
        # [8-1] 데이터 파일을 읽어 Point Cloud를 추출
        vertices, _ = read_off(off)
        # [8-2] Voxelization 이후 Voxel Grid 내 차지한 인덱스 반환 (create_voxel_grid() 함수 사용)
        indices = create_voxel_grid(vertices, voxel_size=8)
        # [8-3] Voxel Grid 내 Point Cloud의 점유율 (occupancy)과 각 축 별 점유율 (axis_occupancy)을 구함 (compute_occupancy() 함수 사용)
        occupancy, axis_occupancy = compute_occupancy(indices)
        # [8-4] 이전 단계에서 구한 점유율과 축 별 점유율을 순서대로 결합하여 학습 Feature 생성
        feature = np.concatenate((occupancy, axis_occupancy), axis=0)
        # [8-4]에서 생성한 학습 Feature를 학습 데이터(x_train_voxel)에 추가
        x_train_voxel.append(feature)
        y_train_voxel.append(label)

        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(train_dataset) * 100:.1f}%')
    
    # 학습 데이터와 학습 라벨을 numpy array 형식으로 변환
    x_train_voxel = np.array(x_train_voxel)
    y_train_voxel = np.array(y_train_voxel)

In [22]:
if method == 'voxel':
    # 평가 데이터 (x_test_voxel) 담을 리스트 생성
    x_test_voxel = list()
    
    pbar = tqdm(enumerate(test_dataloader, start=1))
    for i, (off_) in pbar:
        off = off_[0]
        
        # [9-1] 데이터 파일을 읽어 Point Cloud를 추출
        vertices, _ = read_off(off)
        # [9-2] Voxelization 이후 Voxel Grid 내 차지한 인덱스 반환 (create_voxel_grid() 함수 사용)
        indices = create_voxel_grid(vertices, voxel_size=8)
        # [9-3] Voxel Grid 내 Point Cloud의 점유율 (occupancy)과 각 축 별 점유율 (axis_occupancy)을 구함 (compute_occupancy() 함수 사용)
        occupancy, axis_occupancy = compute_occupancy(indices)
        # [9-4] 이전 단계에서 구한 점유율과 축 별 점유율을 결합하여 평가 Feature 생성
        feature = np.concatenate((occupancy, axis_occupancy), axis=0)
        # [9-4]에서 생성한 평가 Feature를 평가 데이터(x_test_voxel)에 추가
        x_test_voxel.append(feature)
        
        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(test_dataset) * 100:.1f}%')
    
    # 평가 데이터를 numpy array 형식으로 변환
    x_test_voxel = np.array(x_test_voxel)

# **<span style="color:CornflowerBlue">III. Mesh</span>**

# **_Feature Extraction (Mesh)_**
> **Mesh로부터 Hand-Crafted Feature를 기술하고, 이를 학습 및 평가 데이터로 가공하는 과정을 다룹니다.**
>
> **Mesh로부터 Hand-Crafted Feature를 기술하는 전체 파이프라인은 다음과 같습니다.**
>
> **<span style='background-color:yellow'>Mesh (Polygon, Face)로부터 Normal Vector(법선 벡터)를 구합니다.</span>** 
>
> - **Feature Extraction 방식은 Point Cloud로부터 Normal Vector를 추정하는 과정과 비슷하나, 다음의 차이점이 있습니다.**
>     - **Point Cloud는 한 Point (x,y,z)의 최근접 이웃점을 이용하여 해당 Point가 가질 수 있는 Normal Vector를 추정합니다.**
>     - **<span style='background-color:yellow'>그러므로 Point Cloud는 Normal Vector를 추정 (Estimate), Mesh는 Normal Vector를 계산 (Calculate)한다는 점에서 차이가 있습니다.</span>**
>

> **Normal Vector에 PCA를 적용하여 3차원 공간 상에서 법선 벡터를 표현하는 새로운 벡터를 생성하여 Feature로 가공합니다.** 
>
> **PCA는 OFF 확장자 형식의 데이터 파일마다 Face의 수가 달라, Normal Vector를 계산 시 차원이 달라지는 것을 학습 Feature로 가공하기 위해 사용합니다.**

- **Normal Vector 기반 Feature Extraction은 Naive한 접근 방식으로, 특히 얼굴 인식 분야에서 많이 사용되는 방식입니다.**
    - **<span style="color:gray">아래 source paper는 얼굴 정보를 담은 Mesh 데이터로부터 Normal Vector와 Curvature (Mesh의 곡률)를 결합한 Feature에 PCA를 적용한 학습 Feature를 생성하여 SVM으로 얼굴 표정을 분류하는 방식을 사용합니다.</span>**

<center><img src="https://upload.wikimedia.org/wikipedia/commons/thumb/c/cc/Surface_normals.svg/512px-Surface_normals.svg.png" width="600" height="500"></center>
<h5><center>Example of Normal Vector from Mesh</center></h5>
<h4><center><a href="https://dl.acm.org/doi/abs/10.1145/3446999.3447022">[source paper] Fusing Normal Vector and Curvature Features on the Mesh for 3D Facial Expression Recognition [Yu Gu et al., 2021]</a></center></h4>

### **Mesh (Face)로부터 Normal Vector를 계산합니다.**

> **[10-1] <span style="color:RoyalBlue">Mesh (Face)로부터 Face를 구성하는 Point를 구함</span>** 
>
> - **read_off()로부터 Face (Mesh)에 해당하는 Vertex (Point) 데이터를 읽어 변수(예: P, Q, R)에 저장합니다.**
>     - **OFF 파일에서 추출한 두 인자 (vertices, faces)의 연관성을 생각하면 됩니다.**
>
> **[10-2] <span style="color:RoyalBlue">Point로부터 Face의 Normal Vector를 계산</span>** 
>> **<span style="color:Red">np.cross() 함수를 사용합니다.</span>**
>
> - **Point들이 이루는 평면의 Normal Vector를 계산합니다. 아래는 Normal Vector를 계산하는 전체 파이프라인 예시입니다.**
>> **1. Face를 구성하는 세 Point를 P, Q, R이라고 명할때, P, Q, R으로 구성된 도형은 △PQR 입니다.**
>>
>> **2. 평면 △PQR의 법선 벡터는 PQ 벡터와 PR 벡터에 동시에 수직입니다.**
>>
>> **3. 결과적으로 △PQR의 법선 벡터는 PQ 벡터와 PR 벡터의 외적으로 표현할 수 있습니다. (<span style="color:Red">np.cross()</span>)**
>
> **[10-3] <span style="color:RoyalBlue">계산한 Normal Vector를 리스트에 담은 후, 반환</span>** 
>
> - **전체 Face에 대해, 하나의 Face에 대한 Normal Vector를 계산하여 리스트에 담습니다. 반복이 마친 후, numpy array로 변환하여 반환합니다.**

In [23]:
def calculate_normal_vector_from_mesh(vertices, faces) -> np.array:
    # Face들의 법선 벡터를 담을 리스트 생성
    normal_vector = list()
    
    # 전체 Face (faces)에 대해 반복
    for face in faces:
        # [10-1] Face를 구성하는 Point를 구함 
        P, Q, R = vertices[face[0]], vertices[face[1]], vertices[face[2]]
        # [10-2] Point로부터 Face의 Normal Vector를 계산
        normal = np.cross(Q - P, R - P)
        # [10-3] 계산한 Normal Vector를 리스트 (normal_vector)에 담은 후, 반환
        normal_vector.append(normal)
        
    return np.array(normal_vector)

- **PCA를 통해 Normal Vector를 주성분 개수가 3개인 3차원 공간에서 표현하는 새로운 벡터를 생성합니다.**

> **[11-1] <span style="color:RoyalBlue">주성분 개수가 3개인 PCA 객체를 생성 및 적용</span>** 
>
> - **주성분 개수가 3개인 PCA 객체를 생성한 다음, Normal Vector에 적용합니다.**
>
> **[11-2] <span style="color:RoyalBlue">주성분 추출</span>** 
>> **<span style="color:Red">PCA.components_를 사용합니다.</span>**
> - **Normal Vector에 적용한 PC의 주성분 벡터를 추출하여, 각 축 (x, y, z)에 해당하는 변수에 할당합니다.** 
> - **해당 벡터는 Normal Vector를 3차원 공간에서 표현하는 새로운 벡터입니다.**
>
> **[11-3] <span style="color:RoyalBlue">벡터의 축 별로 결합하여 학습 Feature 기술</span>**
> - **각 축 별로 결합하여 학습 Feature를 구성합니다.**

In [24]:
def pca_normal_vector(normal_vector) -> np.array:
    # [11-1] 주성분 개수가 3개인 PCA 객체를 생성 및 적용
    pca = PCA(n_components=3, random_state=seed)
    pca.fit_transform(normal_vector)
    # [11-2] 주성분 추출 (PCA.components_)
    x_axis, y_axis, z_axis = pca.components_
    # [11-3] 주성분을 numpy array로 결합 (axis=0)하여 학습 Feature 기술 (np.concatenate() 함수 사용)
    feature = np.concatenate((x_axis, y_axis, z_axis), axis=0)
    # [11-3]에서 기술한 학습 Feature 반환
    return feature

### **Train Feature Extraction (Mesh)**

In [25]:
if method == 'mesh':
    # 학습 데이터 (x_train_mesh) 담을 리스트 생성
    x_train_mesh, y_train_mesh = list(), list()

    pbar = tqdm(enumerate(train_dataloader, start=1))
    for i, (off_, label_) in pbar:
        off, label = off_[0], label_.item()
        
        # [12-1] 데이터 파일을 읽어 Point Cloud와 Face 추출
        vertices, faces = read_off(off)
        # [12-2] Face를 구성하는 Point Cloud 데이터를 활용하여 Normal Vector 계산
        normal = calculate_normal_vector_from_mesh(vertices, faces)
        # [12-3] PCA를 통해 Normal Vector로부터 학습 Feature를 생성
        feature = pca_normal_vector(normal)
        x_train_mesh.append(feature)
        y_train_mesh.append(label)

        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(train_dataset) * 100:.1f}%')

    # 학습 데이터와 학습 라벨을 numpy array 형식으로 변환
    x_train_mesh = np.array(x_train_mesh)
    y_train_mesh = np.array(y_train_mesh)

Processing: desk_0057.off	Percentage: 100.0%: : 1000it [10:40,  1.56it/s]


### **Test Feature Extraction (Mesh)**

In [26]:
if method == 'mesh':
    # 평가 데이터 (x_test_mesh) 담을 리스트 생성
    x_test_mesh = list()

    pbar = tqdm(enumerate(test_dataloader, start=1))
    for i, (off_) in pbar:
        off = off_[0]
        
        # [13-1] 데이터 파일을 읽어 Point Cloud와 Face 추출
        vertices, faces = read_off(off)
        # [13-2] Face를 구성하는 Point Cloud 데이터를 활용하여 Normal Vector 계산
        normal = calculate_normal_vector_from_mesh(vertices, faces)
        # [13-3] PCA를 통해 Normal Vector로부터 평가 Feature를 생성
        feature = pca_normal_vector(normal)
        x_test_mesh.append(feature)

        pbar.set_description(f'Processing: {os.path.basename(off)}\tPercentage: {i / len(test_dataset) * 100:.1f}%')

    # 평가 데이터를 numpy array 형식으로 변환
    x_test_mesh = np.array(x_test_mesh)

Processing: 299.off	Percentage: 100.0%: : 300it [02:32,  1.97it/s]


# **_Model Train (SVM)_**
> **3D 모델 데이터를 표현하는 세 방법 (Point Cloud, Voxel, Mesh)를 통해 Hand-crafted Feature를 기술한 이후, 기계학습 분류 모델을 사용하여 분류합니다.**
>
> **Baseline에서는 Support Vector Machine의 분류 모델인 SVC를 사용하였으며, 파라미터는 다음과 같이 설정하였습니다.**
> - **<span style='background-color:yellow'>C=10, random_state=seed</span>**

In [27]:
# method는 상단 셀의 Select Method에서 정한 값으로 설정됩니다.
print(f'Select Method is {method}')

if method == 'point_cloud':
    x_train, y_train = x_train_point_cloud, y_train_point_cloud
    x_test = x_test_point_cloud

elif method == 'voxel':
    x_train, y_train = x_train_voxel, y_train_voxel
    x_test = x_test_voxel

elif method == 'mesh':
    x_train, y_train = x_train_mesh, y_train_mesh
    x_test = x_test_mesh
    
# [14-1] 학습 데이터 및 학습 라벨을 통한 모델 학습
clf = SVC(C=10, random_state=seed)

clf.fit(x_train, y_train)
# [14-2] 평가 데이터를 통한 모델 분류 예측
predict = clf.predict(x_test)

Select Method is mesh


# **_Submit to CSV_**
- **마지막으로, 예측한 분류 데이터를 CSV 형식의 파일로 저장합니다.**

In [28]:
# [15-1] sample_submit.csv (SUBMIT_PATH)에 분류 예측 값을 대입
submit = pd.read_csv(SUBMIT_PATH)

submit.Label = predict
# submit 파일 저장
submit.to_csv(f"{method}_baseline.csv", index=False)