# 03. Entendiendo los datos: obtener información de ellos y accederlos


-----

Michael Heredia Pérez -
mherediap@unal.edu.co -
Universidad Nacional de Colombia Sede Manizales

-----


En este cuaderno se hará la presentación del manejo de los objetos VTK para obtenner información de ellos y posteriormente accederlos, todo desde ```pvpython```.


Comenzamos leyendo un archivo y actualizando el pipeline

In [None]:
reader = OpenDataFile('C:\Program Files\ParaView 5.8.1-Windows-Python3.7-msvc2015-64bit\examples\can.ex2')

# Se debe actualizar el pipeline, de lo contrario tendremos la información 
# anterior a la apertura del archivo
UpdatePipeline()

## Obtener información de los datos

A partir del método ```GetDataInformation()``` podemos obtener información respecto cómo se constituyen los arreglos de datos de un archivo.

In [None]:
informacion = reader.GetDataInformation()

# Para obtener el número de celdas o de puntos de los datos
informacion.GetNumberOfPoints()
informacion.GetNumerOfCells()

Para obtener información sobre los arreglos de datos y puntos de celdas disponibles están los métodos ```source.PointData``` y ```source.CellData```

In [None]:
# Obtenemos diccionarios con la información point-centered y cell-centered
reader.PointData[:] 
reader.CellData[:]

```PointData()``` y ```CellData()``` son directorios donde las keys son los nombres de los arrays y los valores son objetos que proporcionan más información de cada 
array.

In [None]:
# Número de arreglos de tipo point-centered.
len(reader.PointData)

# Para datos point-centered
reader.PointData.keys()         # Los nombres de los arrays disponibles.
reader.PointData.values()       # Los valores de los arrays.

Si se fijan, la respuesta dada en pantalla por ```reader.PointData[:]``` y ```reader.PointData.values()``` son los mismos a priori; sin embargo, se puede mostrar que no son los mismos y tampoco tienen la misma dirección de memoria, mediante la siguiente verificación:

In [None]:
datos_pts   = reader.PointData[:]
datos_pts_2 = reader.PointData.values()

if datos_pts == datos_pts_2:                        
    print('Los metodos son equivalentes.')
else:
    print('Los metodos no son equivalentes.')

if datos_pts is datos_pts_2:
    print('Misma dirección de memoria.')
else:
    print('Diferente dirección de memoria.')

***

La razón sigo sin tenerla clara; además, el manual **ParaViewGuide-5.8.1** menciona que el contenido de ambas variables son diccionarios, pero al probar con elcomando ```type()``` se obtiene como resultado que son listas.

***

Se puede estudiar un componente en especifico de uno de los arreglos de la información.


In [None]:
# Podemos obtener información de un arreglo específico de datos.
informacion_del_arreglo = reader.PointData['ACCL']

# y almacenar el nombre en una variable
nombre = informacion_del_arreglo.GetName()

# Conocer cupantas tuplas tiene
informacion_del_arreglo.GetNumberOfTuples()

# y cuantas entradas cada una de ellas
informacion_del_arreglo.GetNumberOfComponents()

# También el rango de una entrada en especial
reader.PointData[nombre].GetRange(0)

# Para obtener el rango de la magnitud en casos de matrices de varios 
# componentes utilice -1 como número de componente.
reader.PointData[nombre].GetRange(-1)

Finalmente, **recordemos que el motor interno de ParaView es el paquete VTK**, por lo tanto podemos conocer el tipo de dato con el cual estamos trabajando en términos de memoria.

Para más información sobre los arreglos VTK este [link](https://vtk.org/doc/nightly/html/classvtkDataArray.html). 

In [None]:
from paraview import vtk

if reader.PointData[nombre].GetDataType() == vtk.VTK_DOUBLE:
    print('{} es un VTK DOUBLE ARRAY REFERENCE.'.format(nombre))

# paravire.vtk provee acceso a constantes como VTK_DOUBLE, VTK_FLOAT, VTK_INT, 
# etc.

# Asímismo, para evaluar el tipo de conjutno de datos por sí mismo.
if reader.GetDataInformation().GetDataSetType() == vtk.VTK_MULTIBLOCK_DATA_SET:
    print('Composite dataset that organizes datasets into blocks')