In [1]:
from osgeo import gdal
from osgeo import ogr
from osgeo import osr
from osgeo import gdal_array
from osgeo import gdalconst

In [2]:
import random
import struct
import numpy
import os, os.path, shutil

**GDAL/OGR** - либы для чтения/записи геоданных

Библиотека единой абстрактной модели геоданных GDAL, первоначально была просто библиотекой для работы с растровыми геоданными, в то время как библиотека 0GR предназначалась для работы с векторными данными.

Теперь либы объединены. Стандартная версия gdal позволяет читать в 100 форматах, а писать в 71. ogr читает вы 42 форматах, пишет в 39.

Для чтения и записи данных в растровом формате библиотека GDAL исполь?
зует специальный объект dataset.

![](img/001.png)

- размер растра - общая ширина в пикселах и высота в строках. Каждая ячейка привязана географически - ей присвоены координаты в результате применения некой модели трансформации
- система координат включает картографическую проекцию, геодезический датум, единицы измерения и масштаб
- метадата содержит доп.информацию о наборе
- размер растрового канала - размер пикселов в ширину и линий в высоту для данных внутри канала.
- таблица цветности описывает как значения пикселов транислируются в цвет

каждая ячейка содержит целое число и число с плавающей точкой. gdal поддерживает отсутствие значяений

Так как у каждого растрового канала обычно имеются тысячи (и даже миллионы) ячеек, то к ним обычно обращаются не поэлементно. Вместо этого для получения доступа ко всем данным канала целиком можно воспользоваться одним из двух возможных методов:

- можно воспользоваться методом band. ReadRaster (), чтобы прочитать часть или все данные канала в двоичную строку и затем для конвертирования этой строки в массив значений использовать встроенную библиотеку struct;
- можно воспользоваться методом band.ReadArray(), чтобы прочитать часть данных канала, сохраняя значения ячеек непосредственно в объект-массив библиотеки NumPy.

#### Запись  растровых данных

Рассмотрим использование библиотеки GDAL для записи растровых данных в файл формата GeoTIFF. Для примера разделим всю поверхность Земли на 360 ячеек по горизонтали и 180 ячеек по вертикали, с тем чтобы каждая ячейка покрывала один градус широты и долготы. Для каждой ячейки сгенерируем одно случайное число между 1 и 100.

In [3]:
driver = gdal.GetDriverByName("GTiff")
dstFile = driver.Create("output/example.tiff", 
                        360, 180, 1, gdal.GDT_Int16)

Метод gdal.driver.Create() принимает следующие параметры:

- имя растрового файла; 
- нужное число ячеек по горизонтали; 
- нужное число ячеек по вертикали; 
- нужное число каналов в файле; 
- константа, задающая тип информации, хранимой в каждой ячейке. В на шем случае каждая ячейка будет содержать 16-разрядное целочисленное значение.

In [4]:
# создадим проекцию что бы спозиционировать 
# ячейки на поверхность Земли
# Вспользуемся датумом WGS84
spatialReference = osr.SpatialReference()
spatialReference.SetWellKnownGeogCS("WGS84")
dstFile.SetProjection(spatialReference.ExportToWkt())

0

модель трансформации данных задается списком из шести числе (матрица афинных преобразований)

Мы можем проигнорировать математику аффинных трансформаций и задать матрицу при помощи всего четырех значений: 

- позиция Х и Y верхнего левого угла верхней левой ячейки; 
- ширина каждой ячейки, измеряемая в градусах долготы; 
- высота каждой ячейки, измеряемая в градусах широты

In [5]:
# зададим модель трансформации
originX = -180
originY = 90
cellWidth = 1.0
cellHeight = 1.0

dstFile.SetGeoTransform([originX, cellWidth, 0,
                         originY, 0, -cellHeight])

0

In [6]:
# ссылка на объект gdal.Band для сохраненеия данных в растровом канале
band = dstFile.GetRasterBand(1)

In [7]:
# сгенерируем данные для растрового канала
values = []
for row in range(180):
    row_data = []
    for col in range(360):
        row_data.append(random.randint(1, 100))
    values.append(row_data)

In [8]:
# пишем построчно в файл через стракт
# fmt = "<" + ("h" * band.XSize)

# for row in range(180):
#     scanline = struct.pack(fmt, *values[row])
#     band.WriteRaster(0, row, 360, 1, scanline)

In [9]:
# другой вариант - пишем целиком массив нампи
array = numpy.array(values, dtype=numpy.int16)
band.WriteArray(array)

0

In [10]:
# нужно закерывать файл (или присваивать ему None)
del dstFile

#### Чтение растровых данных

In [11]:
srcFile = gdal.Open("output/example.tiff")
band = srcFile.GetRasterBand(1)

In [12]:
# чтение для стракт
# fmt = "<" + ("h" * band.XSize)

# for row in range(band.YSize):
#     scanline = band.ReadRaster(0, row, band.XSize, 1,
#                                band.XSize, 1,
#                                band.DataType)
#     row_data = struct.unpack(fmt, scanline)
#     print(row_data)

In [13]:
# чтение для numpy
values = band.ReadAsArray()
for row in range(band.XSize):
    print(values[row])

[ 37  45  90  67 100  19  52  49  35  56  79  13  24  77  11  60  31  84
  86   8  18  16  87  26  22  13   4  85  72  88  95  25  47  39  99  65
  88  88  91  92  80  92  81  73  14  88  11  17  93  60  68  71  33  88
  26   9  68  13  65  38  22  44  95   9  33  81  31  36  89  29  13   4
  52  64  48  25   2   2  20  82  60  25  85  84  53  85  24  26   9  38
  54  17  66  38  54  62   1  41  65  54  63   7   3   9   4  38  55  70
  58  70  45  32  77   7  25  45  34  28  27  10  98  68  80  11   9  27
  42  40  67  38  50  61  25  31  74  34  32  86  13   8  44  49  94  12
  41  41  90  48  38  60  62  70  47  53  46  93  70  21  80  55  21  83
  89  17  19  77  87  77  71  36  51  93  81  46  75  41  33  88  15  84
  78  23  83  65  78  35  97  56   9  52  23  61   4   5  29  97   7  39
  30  20  83  63  63  50   7  39  20  76  92  27  41  21  24  28  18  77
  44  91  87  63  87  66  54  93  96  78  61   9  38  52  59  92  88  74
  39  40  60  62  59  51  51  87  22  73  82  81  1

IndexError: index 180 is out of bounds for axis 0 with size 180

Структура данных в растре

![](img/002.png)

#### Запись векторных данных

Сгенерируем набор произвольных геометрий точки и сохраним их в файле фигур вместе с некоторой атрибутивной информацией.

In [14]:
if os.path.exists("output/test-shapefile"):
    shutil.rmtree("output/test-shapefile")
os.mkdir("output/test-shapefile")

In [15]:
# зададим драйвер
driver = ogr.GetDriverByName("ESRI Shapefile")
path = os.path.join("output/test-shapefile", "shapefile.shp")
datasource = driver.CreateDataSource(path)

In [16]:
# определим слой
spatialReference = osr.SpatialReference()
spatialReference.SetWellKnownGeogCS('WGS84')

0

In [17]:
# создадим слой
layer = datasource.CreateLayer("layer", spatialReference)

In [18]:
# добавим в слой типы данных и атрибуты, 
# которые мы планируем там хранить
field = ogr.FieldDefn("ID", ogr.OFTInteger)
field.SetWidth(4)
layer.CreateField(field)

field = ogr.FieldDefn("NAME", ogr.OFTString)
field.SetWidth(20)
layer.CreateField(field)

0

In [19]:
# добавим немного данных в слой
for i in range(100):
    id_ = 1000 + i
    lat  = random.uniform(-90, +90)
    long = random.uniform(-180, +180)
    name = "point-{}".format(i)

    # тут определим геометрию точки
    wkt = "POINT({} {})".format(long, lat)    
    geometry = ogr.CreateGeometryFromWkt(wkt)

    # для каждой точки создадим объект ogr.Feature
    # и сохраним в нем все данные
    feature = ogr.Feature(layer.GetLayerDefn())
    feature.SetGeometry(geometry)
    feature.SetField("ID", id_)
    feature.SetField("NAME", name)

    # разместим объект в слове
    layer.CreateFeature(feature)

In [20]:
# осовобождаем ресурсы
feature.Destroy()
datasource.Destroy()
del datasource

#### Чтение векторых ф-лов

In [21]:
shapefile = ogr.Open("output/test-shapefile/shapefile.shp")
layer = shapefile.GetLayer(0)

for i in range(layer.GetFeatureCount()):
    feature = layer.GetFeature(i)
    id_ = feature.GetField("ID")
    name = feature.GetField("NAME")
    geometry = feature.GetGeometryRef()
    print(i, id_, name, geometry.GetX(), geometry.GetY())

0 1000 point-0 20.846295252853082 -15.913483533852144
1 1001 point-1 -122.59296420415373 36.44785065965658
2 1002 point-2 -70.54278492885794 67.78068851617917
3 1003 point-3 -84.06629658291037 17.78732869863599
4 1004 point-4 115.44325016389735 -9.88491278827189
5 1005 point-5 -94.55714658295793 -22.849663109305
6 1006 point-6 172.59728546212432 49.033419891858784
7 1007 point-7 87.26390603244153 58.56292835471419
8 1008 point-8 -82.12438430507385 -8.856893942282738
9 1009 point-9 100.49314242378063 -36.171479366394514
10 1010 point-10 -69.52375820651052 -41.913678485014714
11 1011 point-11 4.633262381534621 -68.7325135689307
12 1012 point-12 121.77769017122637 84.68409069600969
13 1013 point-13 -127.52863269552171 -30.546165369511357
14 1014 point-14 -141.02243692850007 85.33629180186205
15 1015 point-15 16.01223839621818 68.78210274660034
16 1016 point-16 -25.744793103384865 13.088225237675957
17 1017 point-17 -40.52001480038024 -46.16847327923666
18 1018 point-18 -92.60362961981475 

#### Работа с проекциями в pyproj

![](img/003.png)

Класс Proj выполняет преобразования значений долготы и широты в прямоугольные координаты (х, у) и наоборот, тогда как класс Geod выполняет различные расчеты на дуге большого круга и углов. Оба реализованы поверх динамической библиотеки PR0J.4

In [22]:
import pyproj
print(pyproj.__version__)

2.6.1.post1


Пример использования pyproj

Указание географического положения в координатах 17-й зоны проекции Меркатора (UTM), затем при помощи двух объектов Proj, один с заданной 17-й зоной UTM и другой с координатной проекцией (широта и долгота), выполняет перевод прямоугольных координат этого географического положения в значения широты и долготы

In [23]:
UTM_X = 565718.5235
UTM_Y = 3980998.9244

srcProj = pyproj.Proj(proj="utm", zone="11", ellps="clrk66", units="m")
dstProj = pyproj.Proj(proj="longlat", ellps="WGS84", datum="WGS84")

long,lat = pyproj.transform(srcProj, dstProj, UTM_X, UTM_Y)

print("UTM zone 17 coordinate " +
      "({:.4f}, {:.4f}) ".format(UTM_X, UTM_Y) +
       "= {:.4f}, {:.4f}".format(long, lat))

UTM zone 17 coordinate (565718.5235, 3980998.9244) = -116.2711, 35.9730


  import sys


**В pyproj2 новый пайплайн!!!**

[изменеения в версиях pyproj](https://pyproj4.github.io/pyproj/stable/gotchas.html#upgrading-to-pyproj-2-from-pyproj-1)

In [24]:
from pyproj import Transformer

transformer = Transformer.from_crs("epsg:4326", "epsg:3857")
transformer.transform(12, 12)

(1335833.8895192828, 1345708.4084091093)

Второй пример принимает эти расчетные значения широты и долготы и при помощи объекта Geod вычисляет еще одну точку в 10 км к северо-востоку от этого географического положения:

In [25]:
angle   = 315 # 315 degrees = northeast.
distance = 10000

geod = pyproj.Geod(ellps="WGS84")
long2,lat2,invAngle = geod.fwd(long, lat, angle, distance)

print("{:.4f}, {:.4f}".format(lat2, long2) +
      " is 10km northeast of " +
      "{:.4f}, {:.4f}".format(lat, long))

36.0367, -116.3496 is 10km northeast of 35.9730, -116.2711


#### Геоанализ и геообработка с помошью shapely

Библиотека Shapely разделена на ряд отдельных модулей, которые импортируются по мере необходимости. Наиболее часто используемые модули следующие: 
- shapely.geometry: задает все используемые в Shapely классы базовых геометрических фигур;
- shapely.wkt: предоставляет функции конвертирования объектов геометрии Shapely в строки в формате стандартного текстового представления WKT и наоборот;
- shapely.wkb: предоставляет функции конвертирования объектов геометрии Shapely в двоичные данные в формате стандартного двоичного представления WKB и наоборот;
- shapely. ops: предоставляет функции для выполнения пакетных операций на ряде объектов геометрии

Библиотека Shapely поддерживает 8 фундаментальных типов геометрий, или геометрических примитивов:

![](img/005.png)

- shapely.geometry.Point (точка) изображает отдельную точку в пространстве. Точки могут быть двумерными (х, у) или трехмерными (х, у, z);
- shapely.geometry.LineString (полилиния) изображает ломаную, то есть последовательность точек, объединенных в линию. Ломаные линии могут быть простыми (без пересекающихся отрезков) или сложными (где два отрезка ломаной самопересекаются);
- shapely.geometry.LinearRing (линейное кольцо) изображает ломаную линию, где первая и последняя координаты совпадают. Отрезки внутри линейного кольца не могут самопересекаться или касаться друг друга;
- shapely.geometry.Polygon (многоугольник) изображает заполненную область, внутри которой дополнительно может быть одна или несколько «дыр»;
- shapely.geometry.Multipoint (мультиточка) изображает составную точку, то есть коллекцию точек;
- shapely.geometry.MultiLineString (мультиполилиния) изображает составную ломаную, то есть коллекцию ломаных линий;
- shapely.geometry.MultiPolygon (мультимногоугольник) изображает составной многоугольник, то есть коллекцию многоугольников;
- shapely.geometry.GeometryCollection (коллекция геометрий) представляет коллекцию, состоящую из любой комбинации точек, линий, линейных колец и многоугольников.

Shapely - это библиотека управления пространственными, а не
геопространственными данными. В ней не предусмотрено понятие географических координат. Вместо этого в ней предполагается, что геоданные, прежде чем ими начнут управлять, уже спроецированы, то есть перенесены, на двумерную координатную плоскость, и результаты при желании могут быть конвертированы в географические координаты

In [26]:
# создает два геометрических объекта Shapely - круг и квадрат - 
# и вычисляет их пересечение. 
# Пересечением является многоугольник в форме четверти круга

import shapely.geometry
import shapely.wkt

pt = shapely.geometry.Point(0, 0)
circle = pt.buffer(1.0)

square = shapely.geometry.Polygon([(0, 0), (1, 0),
                                   (1, 1), (0, 1),
                                   (0, 0)])

intersect = circle.intersection(square)

for x,y in intersect.exterior.coords:
    print(x,y)
print(shapely.wkt.dumps(intersect))

0.0 0.9999999999999999
0.09801714032955743 0.9951847266721972
0.1950903220161248 0.9807852804032311
0.29028467725445867 0.9569403357322099
0.3826834323650859 0.9238795325112884
0.47139673682599365 0.8819212643483572
0.5555702330195982 0.8314696123025479
0.6343932841636415 0.7730104533627402
0.7071067811865436 0.7071067811865515
0.7730104533627332 0.63439328416365
0.8314696123025418 0.5555702330196074
0.8819212643483519 0.4713967368260034
0.9238795325112841 0.38268343236509617
0.9569403357322067 0.29028467725446927
0.980785280403229 0.1950903220161357
0.9951847266721962 0.09801714032956847
1.0 8.238535137130597e-15
1.0 0.0
0.0 0.0
0.0 0.9999999999999999
POLYGON ((0.0000000000000000 0.9999999999999999, 0.0980171403295574 0.9951847266721972, 0.1950903220161248 0.9807852804032311, 0.2902846772544587 0.9569403357322099, 0.3826834323650859 0.9238795325112884, 0.4713967368259936 0.8819212643483572, 0.5555702330195982 0.8314696123025479, 0.6343932841636415 0.7730104533627402, 0.707106781186543

#### Визуализация геоданных mapnik

In [27]:
# import mapnik
# print(mapnik.__file__)

В mapnik используется объект Map, представляющий карту целиком. Сам объект состоит из следующих компонентов;

![](img/004.png)