## 4. Segy header map

In [1]:
import numpy as np
import pandas as pd

In [5]:
import seismo_reader as sr

### 4.1 Описание класса

Маппинг полей заголовков трасс представляет из себя соответствие между названиями величин, хранящимися в заголовках трасс, и их расположением в байтовом представлении заголовка и типом данных. Например, координата X источника (Source X) в различных SEG-Y файлах может быть расположена в различных местах заголовка (по стандарту значение Source X расположено на байтах 73-76 от начала заголовка и имеет тип integer).

Маппинг полей заголовков трасс осуществляется при помощи класса __sr.segy_header_map__. Описание методов класса можно получить по команде help:

In [6]:
help(sr.segy_header_map)

Help on class segy_header_map in module seismo_reader:

class segy_header_map(header_map)
 |  Method resolution order:
 |      segy_header_map
 |      header_map
 |      pybind11_builtins.pybind11_object
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __init__(...)
 |      __init__(*args, **kwargs)
 |      Overloaded function.
 |      
 |      1. __init__(self: seismo_reader.segy_header_map) -> None
 |      
 |      2. __init__(self: seismo_reader.segy_header_map, map_type: seismo_reader.header_map_type) -> None
 |      
 |      3. __init__(self: seismo_reader.segy_header_map, dict: Dict[str, Tuple[seismic_data_type, int, int, bool]]) -> None
 |      
 |      4. __init__(self: seismo_reader.segy_header_map, header_map: seismo_reader.segy_header_map) -> None
 |      
 |      5. __init__(self: seismo_reader.segy_header_map, header_map: seismo_reader.header_map) -> None
 |  
 |  ----------------------------------------------------------------------
 |  Methods inherited fr

Класс представляет из себя хранилище по типу словаря, которое имеет вид __{ имя_поля : (тип данных, байтовая позиция, флаг обязательного поля) }__. Над хранилищем доступны следующие операции:
>получение элемента<br>
>изменение элемента<br>
>добавление элемента<br>

Класс поддерживает операции удаления всех полей, преобразования в __dict__ и из него.

Перечисление __sr.header_map_type__ содержит доступные шаблоны для маппинга. Пока что их всего 1 - стандартный.

Так же реализованы различные конструкторы класса, позволяющие создавать __segy_header_map__ по шаблону, из словаря и из существующего объекта типа __segy_header_map__.

Рассмотрим функционал класса __segy_header_map__ на примерах.

### 4.2 Создание и просмотр

Создадим пустой объект класса __segy_header_map__.

In [7]:
hm = sr.segy_header_map()

Преобразование маппинга в __dict__ осуществляется при помощи метода __segy_header_map.to_dict__():

In [8]:
hm.to_dict()

{'Alias filter freq': (seismic_data_type.USHORT, 140, 2, False),
 'Alias filter slope': (seismic_data_type.USHORT, 142, 2, False),
 'CDP': (seismic_data_type.INT, 20, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Coord units': (seismic_data_type.USHORT, 88, 2, False),
 'Correlated': (seismic_data_type.USHORT, 124, 2, False),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'Data use': (seismic_data_type.SHORT, 34, 2, False),
 'Day': (seismic_data_type.USHORT, 158, 2, False),
 'Dhotpoint no': (seismic_data_type.INT, 196, 4, False),
 'Energy src point': (seismic_data_type.INT, 16, 4, False),
 'Ensemble trc no': (seismic_data_type.INT, 24, 4, False),
 'Gain const': (seismic_data_type.SHORT, 120, 2, False),
 'Gain init': (seismic_data_type.SHORT, 122, 2, False),
 'Gain type': (seismic_data_type.USHORT, 118, 2, False),
 'Gap size': (seismic_data_type.USHORT, 176, 2, False),
 'Gph grp lst trc': (seismic_data_type.USHORT, 17

Как видим, созданный пустой маппинг содержит довольно много полей, так как по умолчанию пустой конструктор создают маппинг по стандартному шаблону. В этом можно убедиться, вызвав метод __segy_header_map.type()__:

In [9]:
hm.type()

header_map_type.STANDARD

Запомним полученный словарь и создадим маппинг при помощи конструктора __init__ __(dict)__.

In [10]:
d = hm.to_dict()
hm = sr.segy_header_map(d)

In [11]:
d == hm.to_dict()

True

Так же доступен конструктор копирования:

In [12]:
hm = sr.segy_header_map(hm)

In [13]:
d == hm.to_dict()

True

Чтобы создать пустой маппинг, необходимо вызвать конструктор __init__ __(self, map_type)__ с параметром __header_map_type.CUSTOM__.

In [14]:
hm = sr.segy_header_map(sr.header_map_type.CUSTOM)

In [15]:
hm.to_dict()

{'CDP': (seismic_data_type.INT, 20, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'Inline': (seismic_data_type.INT, 188, 4, True),
 'Sample interval': (seismic_data_type.SHORT, 116, 2, True),
 'Samples count': (seismic_data_type.SHORT, 114, 2, True),
 'Scalar coords': (seismic_data_type.SHORT, 70, 2, True),
 'Src X': (seismic_data_type.INT, 72, 4, True),
 'Src Y': (seismic_data_type.INT, 76, 4, True),
 'Trace units': (seismic_data_type.SHORT, 202, 2, True)}

Получившийся маппинг непустой. Это связанно с тем, что есть некоторый набор обязательных полей маппинга, без которых работа с SEG-Y файлом будет невозможной. Таких полей порядка 10 и их невозможно удалить, можно только редактировать их тип и байтовое расположение.

Краткое описание полей можно получить, вызвав метод __segy_header_map.description()__:

In [16]:
hm.description()

{'CDP': 'CDP, CMP, CRP, etc',
 'CDP X': 'X coordinate of ensemble (CDP) position of this trace (scalar in Standard TraceHeader bytes 71-72 applies)',
 'CDP Y': 'Y coordinate of ensemble (CDP) position of this trace (scalar in Standard TraceHeader bytes 71-72 applies)',
 'Crossline': 'For 3-D poststack data, this field should be used for the cross-line number',
 'Inline': 'For 3-D poststack data, this field should be used for the in-line number',
 'Sample interval': 'Sample interval for this trace',
 'Samples count': 'Number of samples in this trace',
 'Scalar coords': 'Scalar to be applied to all coordinates specified in Standard Trace Header bytes73-88 and to bytes Trace Header 181-188 to give the real value',
 'Src X': 'Source coordinate - X',
 'Src Y': 'Source coordinate - Y',
 'Trace units': 'Trace value measurement unit: -1 = Other; 0 = Unknown; 1 = Pascal (Pa); 2 = Volts (v); 3 = Millivolts (mV); 4 = Amperes (A); 5 = Meters (m); 6 = Meters per second (m/s);7 = Meters per second s

Создадим новый маппинг и приведем его информацию в более красивый вид для вывода пользователю-интерпретатору.

Для этого сделаем следующее:<br>
>1. Заполним два DataFrame, один с полями, второй с описаниями полей<br>
>2. Сольем полученные DataFrame в один<br>
>3. Разобьем снова на 2 по значению столбца Required, удалим этот столбец и отсортируем в порядке Byte position

In [17]:
hm = sr.segy_header_map()
d = hm.to_dict()
dd = hm.description()

In [18]:
# Заполним отдельно 2 DataFrame'а, один со значениями полей, второй с описанием
type = []
pos = []
size = []
req = []
for v in list(d.values()):
    type.append(v[0].name)
    pos.append(v[1])
    size.append(v[2])
    req.append(v[3])
    
df_values = pd.DataFrame({'Type' : type, 'Byte position' : pos, 'Byte size' : size, 'Required' : req}, index=list(d.keys()))
df_descr = pd.DataFrame({'Description' : list(dd.values())}, index=list(dd.keys()))

In [19]:
df = pd.concat([df_values, df_descr], axis=1)

In [20]:
df

Unnamed: 0,Type,Byte position,Byte size,Required,Description
Alias filter freq,USHORT,140,2,False,"Alias filter frequency (Hz), if used"
Alias filter slope,USHORT,142,2,False,Alias filter slope (dB/octave)
CDP,INT,20,4,True,"CDP, CMP, CRP, etc"
CDP X,INT,180,4,True,X coordinate of ensemble (CDP) position of thi...
CDP Y,INT,184,4,True,Y coordinate of ensemble (CDP) position of thi...
...,...,...,...,...,...
Trc seq no,INT,4,4,False,Trace sequence number within SEG-Y file - Each...
Trc w factor,USHORT,168,2,False,Trace weighting factor
Vert summed trcs,SHORT,30,2,False,Number of vertically summed traces yielding th...
Weather vel,SHORT,90,2,False,Weathering velocity (ft/s or m/s as specified ...


Так как поля маппинга делятся на обязательные и необязательные, было бы неплохо изначально показывать интерпретатору только обязательные поля, а все поля показывать опционально, чтобы не забивать его голову лишней информацией. Для этого разделим получивщийся DataFrame на два: с обязательными полями и общий.

In [21]:
df_req = df[df['Required'] == True].drop('Required', 1).sort_values(by='Byte position')
df_all = df.drop('Required', 1).sort_values(by='Byte position')

In [22]:
df_req

Unnamed: 0,Type,Byte position,Byte size,Description
CDP,INT,20,4,"CDP, CMP, CRP, etc"
Scalar coords,SHORT,70,2,Scalar to be applied to all coordinates specif...
Src X,INT,72,4,Source coordinate - X
Src Y,INT,76,4,Source coordinate - Y
Samples count,SHORT,114,2,Number of samples in this trace
Sample interval,SHORT,116,2,Sample interval for this trace
CDP X,INT,180,4,X coordinate of ensemble (CDP) position of thi...
CDP Y,INT,184,4,Y coordinate of ensemble (CDP) position of thi...
Inline,INT,188,4,"For 3-D poststack data, this field should be u..."
Crossline,INT,192,4,"For 3-D poststack data, this field should be u..."


In [23]:
df_all

Unnamed: 0,Type,Byte position,Byte size,Description
Trc seq line,INT,0,4,Trace sequence number within line - Numbers co...
Trc seq no,INT,4,4,Trace sequence number within SEG-Y file - Each...
Orig field no,INT,8,4,Original field record number
Tcr no,INT,12,4,Trace number within the original field record
Energy src point,INT,16,4,Energy source point number - Used when more th...
...,...,...,...,...
Trans const pow,SHORT,208,2,Transduction Constant power
Trans units,SHORT,210,2,Transduction Units: -1 = Other; 0 = Unknown; 1...
Time scal,SHORT,214,2,Scalar to be applied to times specified in Tra...
Scr type orien,SHORT,216,2,Source Type/Orientation - Defines the type and...


Таким образом получаем два варианта отображения информации о маппинге - обязательный и полный. Теперь на форме просмотра маппинга можно ввести check box, по которому будет отображаться полный маппинг.

Так же для просмотра отдельных полей класс __segy_header_map__ содержит метод __get__, который позволяет получить информацию о поле по имени и все поле по индексу:

In [24]:
# По имени
hm.get('Inline')

(seismic_data_type.INT, 188, 4, True)

In [25]:
# По индексу
hm.get(0)

('Inline', (seismic_data_type.INT, 188, 4, True))

Колиечство всех полей можно получить, вызвав метод __segy_header_map.count()__:

In [26]:
hm.count()

85

А при попытках доступа к несуществующему полю будет выброшено исключение:

In [27]:
hm.get('X')

ValueError: segy_header_map.cpp:222: header map doesn't contains field with name X

In [28]:
hm.get(hm.count() + 1)

ValueError: segy_header_map.cpp:230: invalid index

### 4.3 Редактирование маппинга

Для редактирования маппинга класс __segy_header_map__ предоставляет метод __set__ с различными перегрузками.

In [29]:
help(sr.segy_header_map.set)

Help on instancemethod in module seismo_reader:

set(...)
    set(*args, **kwargs)
    Overloaded function.
    
    1. set(self: seismo_reader.header_map, field_name: str, byte_location: int, byte_size: int, data_type: seismic_data_type) -> None
    
    Add/set field in trace header map
    
    2. set(self: seismo_reader.header_map, field_name: str, byte_location: int, byte_size: int, data_type: seismic_data_type, description: str = '') -> None
    
    Add/set field in trace header map
    
    3. set(self: seismo_reader.header_map, field_name: str, tuple kind of { data_type, byte_loc, byte_size}: Tuple[seismic_data_type, int, int, bool]) -> None
    
    Add/set field in trace header map
    
    4. set(self: seismo_reader.header_map, field_name: str, tuple kind of { data_type, byte_loc, byte_size}: Tuple[seismic_data_type, int, int, bool], description: str = '') -> None
    
    Add/set field in trace header map



Создадим пустой маппинг.

In [37]:
hm = sr.segy_header_map(sr.header_map_type.CUSTOM)

Изменим позицию и тип данных для поля CDP, используя все доступные перегрузки.

In [38]:
hm.get('CDP')

(seismic_data_type.INT, 20, 4, True)

In [39]:
hm.set('CDP', 66, 2, sr.seismic_data_type.USHORT)
hm.get('CDP')

(seismic_data_type.USHORT, 66, 2, True)

In [40]:
hm.set('CDP', 62, 4, sr.seismic_data_type.INT, '')
hm.get('CDP')

(seismic_data_type.INT, 62, 4, True)

In [41]:
hm.set('CDP', (sr.seismic_data_type.USHORT, 66, 2, False))
hm.get('CDP')

(seismic_data_type.USHORT, 66, 2, True)

In [42]:
hm.set('CDP', (sr.seismic_data_type.USHORT, 66, 2, False), '')
hm.get('CDP')

(seismic_data_type.USHORT, 66, 2, True)

Заметим, что при использовании перегрузки __set(self, field_name, Tuple[seismic_data_type, int, int, bool])__ установка обязательного флага не имеет никакого влияния на результат. Поле __CDP__ как было обязательным, так и осталось. Поэтому не имеет значение, какой флаг выставлен, библиотека сама определяет обязательные и необязательные поля.

Так же стоит обратить внимание на перегрузки, принимающие параметр __description__. Если передана пустая строка, то описание не будет установлено. Если строка не пустая, то описание будет изменено. Это демонстрирует следующий пример.

In [47]:
# Пустое описание
hm.set('CDP', 62, 4, sr.seismic_data_type.INT, '')
hm.get('CDP')

hm.description()['CDP']

'AAABBBCCCDDDEEEFFFGGGHHH'

In [48]:
# Непустое описание
hm.set('CDP', 62, 4, sr.seismic_data_type.INT, 'AAABBBCCCDDDEEEFFFGGGHHH')
hm.get('CDP')

hm.description()['CDP']

'AAABBBCCCDDDEEEFFFGGGHHH'

При помощи метода __set__ можно добавить новое поле:

In [49]:
hm.set('PRIVET', 14, 2, sr.seismic_data_type.SHORT, '')

In [50]:
hm.to_dict()

{'CDP': (seismic_data_type.INT, 62, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'Inline': (seismic_data_type.INT, 188, 4, True),
 'PRIVET': (seismic_data_type.SHORT, 14, 2, False),
 'Sample interval': (seismic_data_type.SHORT, 116, 2, True),
 'Samples count': (seismic_data_type.SHORT, 114, 2, True),
 'Scalar coords': (seismic_data_type.SHORT, 70, 2, True),
 'Src X': (seismic_data_type.INT, 72, 4, True),
 'Src Y': (seismic_data_type.INT, 76, 4, True),
 'Trace units': (seismic_data_type.SHORT, 202, 2, True)}

Как видно, поле PRIVET появилось в маппинге. Оно является необязательным. Удалить поле можно при помощи метода __remove__:

In [51]:
hm.remove('PRIVET')

In [52]:
hm.to_dict()

{'CDP': (seismic_data_type.INT, 62, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'Inline': (seismic_data_type.INT, 188, 4, True),
 'Sample interval': (seismic_data_type.SHORT, 116, 2, True),
 'Samples count': (seismic_data_type.SHORT, 114, 2, True),
 'Scalar coords': (seismic_data_type.SHORT, 70, 2, True),
 'Src X': (seismic_data_type.INT, 72, 4, True),
 'Src Y': (seismic_data_type.INT, 76, 4, True),
 'Trace units': (seismic_data_type.SHORT, 202, 2, True)}

Добавим еще несколько полей и очистим маппинг.

In [53]:
hm.set('A', 14, 2, sr.seismic_data_type.SHORT, '')
hm.set('B', 16, 2, sr.seismic_data_type.SHORT, '')
hm.set('C', 18, 2, sr.seismic_data_type.SHORT, '')
hm.set('D', 20, 2, sr.seismic_data_type.SHORT, '')
hm.set('F', 22, 2, sr.seismic_data_type.SHORT, '')
hm.set('G', 24, 2, sr.seismic_data_type.SHORT, '')

In [54]:
hm.to_dict()

{'A': (seismic_data_type.SHORT, 14, 2, False),
 'B': (seismic_data_type.SHORT, 16, 2, False),
 'C': (seismic_data_type.SHORT, 18, 2, False),
 'CDP': (seismic_data_type.INT, 62, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'D': (seismic_data_type.SHORT, 20, 2, False),
 'F': (seismic_data_type.SHORT, 22, 2, False),
 'G': (seismic_data_type.SHORT, 24, 2, False),
 'Inline': (seismic_data_type.INT, 188, 4, True),
 'Sample interval': (seismic_data_type.SHORT, 116, 2, True),
 'Samples count': (seismic_data_type.SHORT, 114, 2, True),
 'Scalar coords': (seismic_data_type.SHORT, 70, 2, True),
 'Src X': (seismic_data_type.INT, 72, 4, True),
 'Src Y': (seismic_data_type.INT, 76, 4, True),
 'Trace units': (seismic_data_type.SHORT, 202, 2, True)}

In [55]:
hm.clear()

In [56]:
hm.to_dict()

{'CDP': (seismic_data_type.INT, 20, 4, True),
 'CDP X': (seismic_data_type.INT, 180, 4, True),
 'CDP Y': (seismic_data_type.INT, 184, 4, True),
 'Crossline': (seismic_data_type.INT, 192, 4, True),
 'Inline': (seismic_data_type.INT, 188, 4, True),
 'Sample interval': (seismic_data_type.SHORT, 116, 2, True),
 'Samples count': (seismic_data_type.SHORT, 114, 2, True),
 'Scalar coords': (seismic_data_type.SHORT, 70, 2, True),
 'Src X': (seismic_data_type.INT, 72, 4, True),
 'Src Y': (seismic_data_type.INT, 76, 4, True),
 'Trace units': (seismic_data_type.SHORT, 202, 2, True)}

Как видим, все добавленные поля были удалены методом __clear__, в маппинге остались лишь обязательные поля.

При попытки удаления обязательного поля будет выброшено исключение:

In [57]:
hm.remove('CDP')

ValueError: segy_header_map.cpp:194: can't remove required header map field

Создадим стандартный маппинг и редактируем его поле.

In [58]:
hm = sr.segy_header_map()

In [59]:
hm.type()

header_map_type.STANDARD

In [60]:
hm.set('CDP', 62, 4, sr.seismic_data_type.INT, 'AAABBBCCCDDDEEEFFFGGGHHH')

In [61]:
hm.type()

header_map_type.CUSTOM

Как видим, при изменении какого-либо поля тип маппинга меняется с шаблонного на CUSTOM.