# Lidarデータの処理(pdal pilepine 編)
---
このNotebookでは`pdal`をpythonで扱う`pipeline`処理に焦点を当てています。

PDAL（Point Data Abstraction Library）は、点群データの変換と操作に用いられるC++ライブラリです。PDALはCLIで操作する事もできますが、python内で操作する事も可能です。

このNotebookでは`OpenNagasaki`からダウンロード可能な`.las`フォーマットのデータを題材に pdal の基本的な使い方を学習していきます。

 - [PDAL Document](https://pdal.io/en/2.7-maintenance/)

 - [PDAL Python](https://pdal.io/en/2.7-maintenance/python.html)
 
 - [PDAL Filters](https://opennagasaki.nerc.or.jp/)

 - [PDAL Pipeline](https://pdal.io/en/2.7-maintenance/pipeline.html)

 - [PDAL Pipeline example](https://github.com/PDAL/PDAL/tree/master/test/data/pipeline)

 - [オープンナガサキ](https://opennagasaki.nerc.or.jp/)


## Import modules.

In [1]:
import json
from pprint import pprint

import geopandas as gpd
import k3d
import laspy
import numpy as np
import pandas as pd
import pdal
import shapely


input_las = "../datasets/01ID7913_org.las"

In [2]:
# url = 'https://www.keene.edu/campus/maps/tool/'
# IFrame(url, width=1200, height=500)

## データの概要を確認する。
---
データを処理するPipelineを作成する前にデータの中身を見てみましょう。中身を確認しない事には、どの様な処理が必要かを決める事が出来ません。

事前に`.json`ファイルにPipelineの処理を書いておいても構いませんが、せっかくpythonを使用するので、辞書型のオブジェクトに処理を記述して動作させてみましょう。

In [3]:
# `reader.las`ではなく`readers.las`なので注意
sentence = \
    {
        "pipeline": [
            {
                "type": "readers.las",
                "filename": input_las
            }
        ]
    }

pipeline = pdal.Pipeline(json.dumps(sentence))
pipeline.execute()
metadata = pipeline.metadata
pprint(metadata)

{'metadata': {'filters.merge': {},
              'readers.las': {'comp_spatialreference': '',
                              'compressed': False,
                              'copc': False,
                              'count': 6684582,
                              'creation_doy': 0,
                              'creation_year': 0,
                              'dataformat_id': 2,
                              'dataoffset': 227,
                              'filesource_id': 0,
                              'global_encoding': 0,
                              'global_encoding_base64': 'AAA=',
                              'header_size': 227,
                              'major_version': 1,
                              'maxx': -3000,
                              'maxy': 38250,
                              'maxz': 1302.339999,
                              'minor_version': 2,
                              'minx': -4000,
                              'miny': 37500,
                 

上記でprintしたデータの中の`spatialreference`には空の文字列が入力されています。Spatial Reference(srs: Spatial Reference System)とは空間参照系の事です。crs(Coordinate Reference System: 座標参照系)と書かれている場合もあります。

空間参照系とは現実世界の位置を特定する為のルールの事であり、空間参照系の種類によって原点となる位置が異なります。今回使用するオープンナガサキのデータは、JGD2011の1系(EPSG:6669)であり、原点は長崎県の海にあります。

空間参照系を定義する前に、まずこのデータの示す範囲を地図で見てみましょう。


In [4]:
meta_data_readers = metadata.get('metadata').get('readers.las')
max_x = meta_data_readers.get('maxx')
max_y = meta_data_readers.get('maxy')
min_x = meta_data_readers.get('minx')
min_y = meta_data_readers.get('miny')
boundary = shapely.box(*[max_x, max_y, min_x, min_y])

# geopandasを使用し動的なMapに投影してみましょう。実際にダウンロードした場所と同じ範囲が表示されるはずです。
crs = 'EPSG:6669'
gdf = gpd.GeoDataFrame(geometry=[boundary], crs=crs)
# gdf.explore()

## 座標参照系を定義する
---
データでは空間参照系が定義されていませんでしたが、Pipeline処理で空間参照系を定義する場合は、定義というよりも変換という表現の方がいいかもしれません。データでは定義されていなくとも、必ず入力する必要があるからです。今回はデータの空間参照系が分かっているので、`in_srs`と`out_srs` の両方に同じ値を入力しておきます。

空間参照系を定義したら、そのまま新たなデータとして出力します。

[※ここにオープンナガサキのデータの座標参照系が書いてあります。](https://opennagasaki.nerc.or.jp/terms.html?20240228)

In [5]:
sentence = \
    {
        "pipeline": [
            {
                'type': 'readers.las',
                'filename': input_las
            },
            {
                'type': 'filters.reprojection',
                'in_srs': crs,
                'out_srs': crs,
            }
        ]
    }

pipeline = pdal.Pipeline(json.dumps(sentence))
pipeline.execute()
pprint(pipeline.metadata)

{'metadata': {'filters.reprojection': {'comp_spatialreference': 'PROJCS["JGD2011 '
                                                                '/ Japan Plane '
                                                                'Rectangular '
                                                                'CS '
                                                                'I",GEOGCS["JGD2011",DATUM["Japanese_Geodetic_Datum_2011",SPHEROID["GRS '
                                                                '1980",6378137,298.257222101,AUTHORITY["EPSG","7019"]],AUTHORITY["EPSG","1128"]],PRIMEM["Greenwich",0,AUTHORITY["EPSG","8901"]],UNIT["degree",0.0174532925199433,AUTHORITY["EPSG","9122"]],AUTHORITY["EPSG","6668"]],PROJECTION["Transverse_Mercator"],PARAMETER["latitude_of_origin",33],PARAMETER["central_meridian",129.5],PARAMETER["scale_factor",0.9999],PARAMETER["false_easting",0],PARAMETER["false_northing",0],UNIT["metre",1,AUTHORITY["EPSG","9001"]],AXIS["Northing",NORTH],AXIS["Easti

## データのビジュアライズ
----

### 座標データの用意

In [6]:
arys = pipeline.arrays
arys

[array([(-3999.7200002 , 37554.73      , 249.50999987, 121, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 12593, 20303, 22616),
        (-3966.03000069, 37517.36999991, 253.99999994, 122, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 12079, 17733, 19018),
        (-3972.01000013, 37543.96999932, 253.37999986,  95, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 16448, 21588, 21074),
        ...,
        (-3000.        , 37897.95999958, 323.77999955,  92, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 65535, 65535, 65535),
        (-3000.16000075, 37897.93999931, 323.77999955, 167, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 22102, 26471, 24158),
        (-3000.16000075, 37912.35999957, 317.51999955,  24, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0., 0, 29, 12850, 21331, 22873)],
       dtype=[('X', '<f8'), ('Y', '<f8'), ('Z', '<f8'), ('Intensity', '<u2'), ('ReturnNumber', 'u1'), ('NumberOfReturns', 'u1'), ('ScanDirectionFlag', 'u1'), ('EdgeOfFlightLine', 'u1'), ('Classification', 'u1'), ('Synthetic', 'u1'), ('KeyPoint', 'u1'), ('Withheld', 

In [7]:
df = pd.DataFrame(arys[0])
df.describe()

Unnamed: 0,X,Y,Z,Intensity,ReturnNumber,NumberOfReturns,ScanDirectionFlag,EdgeOfFlightLine,Classification,Synthetic,KeyPoint,Withheld,Overlap,ScanAngleRank,UserData,PointSourceId,Red,Green,Blue
count,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0,6684582.0
mean,-3484.883,37868.42,315.4099,167.6435,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,20393.56,24929.39,24611.09
std,288.1643,216.7067,68.70402,61.71454,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,8347.707,6574.589,5020.808
min,-4000.0,37500.0,142.85,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,514.0,7196.0,1799.0
25%,-3731.85,37680.77,267.26,134.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,13107.0,19275.0,20817.0
50%,-3475.22,37865.58,295.9,179.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,19275.0,24158.0,23644.0
75%,-3233.75,38055.21,356.69,212.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,26985.0,29812.0,27756.0
max,-3000.0,38250.0,1302.34,255.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,29.0,65535.0,65535.0,65535.0


In [8]:
# point_cloud = gdf[['X', 'Y', 'Z']].to_numpy()
# plot = k3d.plot(camera_auto_fit=True)
# plot += k3d.points(point_cloud, point_size=0.1, shader="3d")
# plot.display()

## 条件式を使用した外れ値の除去
---
metadataにも書かれていましたが、z値にどうやらおかしな値が紛れ込んでいるようです。ビジュアライズして確認すると全体の高さはそこまででもない様なので、800m以上あるデータは取り除いてしまいましょう。


In [9]:
sentence = \
    {
        "pipeline": [
            {
                'type': 'readers.las',
                'filename': input_las
            },
            {
                'type': 'filters.reprojection',
                'in_srs': crs,
                'out_srs': crs,
            },
            {
                "type":"filters.expression",
                "expression":"(Z >= 0 && Z <= 800)"
            }
        ]
    }

pipeline = pdal.Pipeline(json.dumps(sentence))
pipeline.execute()

df = pd.DataFrame(pipeline.arrays[0])
print(f"max z: {df['Z'].max()}")

max z: 519.6199996727147


In [11]:
point_cloud = df[['X', 'Y', 'Z']].to_numpy()
plot = k3d.plot(camera_auto_fit=True)
plot += k3d.points(point_cloud, point_size=0.1, shader="3d")
# plot.display()

