# Componentes básicos de un proyecto Dagster

Dagster define una serie de asbtracciones fundamentales para diseñar y desarrollar aplicaciones de datos. 

## Activos de datos (data assets)

Un activo de datos es un objeto en almacenamiento persistente que es relevante para la aplicación (archivos, reportes, bases de datos, modelos predictivos) y se define de manera tal que se vincula el activo con la función (*Op*) y los activos requeridos para producir su contenido. La definición de los activos y sus relaciones es información sobre cómo generar dichos activos. 

**Materializar** un activo es el acto de ejecutar su *Op* y guardar los resultados en almacenamiento persistente. Por defecto, los activos se materializan en archivos pickle en el sistema de archivos local, pero el comportamiento de la materialización se puede personalizar completamente usando gestores de entrada/salida.


[Ejemplos](https://docs.dagster.io/concepts/assets/software-defined-assets#assets-with-dependencies) en la documentación de Dagster.



<img src="05_data-asset-materialization.png" width="800px"/>


## Dagit - la consola de admistración de Dagster

- Ver las relaciones entre activos (lineage)
- Materializar algunos o todos los activos de un grafo
- Ver información sobre las ejecuciones empleadas para materializar activos

## Por defecto, los activos de materializan en formato pickle

In [2]:
import pickle

with open(r"C:\dev\workspace-python\dagster-data-app\tmpe8eotrqp\storage\cereals", "rb") as data_asset_pickle_file:
    data_asset = pickle.load(data_asset_pickle_file)

data_asset

[{'name': '100% Bran',
  'mfr': 'N',
  'type': 'C',
  'calories': '70',
  'protein': '4',
  'fat': '1',
  'sodium': '130',
  'fiber': '10',
  'carbo': '5',
  'sugars': '6',
  'potass': '280',
  'vitamins': '25',
  'shelf': '3',
  'weight': '1',
  'cups': '0.33'},
 {'name': '100% Natural Bran',
  'mfr': 'Q',
  'type': 'C',
  'calories': '120',
  'protein': '3',
  'fat': '5',
  'sodium': '15',
  'fiber': '2',
  'carbo': '8',
  'sugars': '8',
  'potass': '135',
  'vitamins': '0',
  'shelf': '3',
  'weight': '1',
  'cups': '1'},
 {'name': 'All-Bran',
  'mfr': 'K',
  'type': 'C',
  'calories': '70',
  'protein': '4',
  'fat': '1',
  'sodium': '260',
  'fiber': '9',
  'carbo': '7',
  'sugars': '5',
  'potass': '320',
  'vitamins': '25',
  'shelf': '3',
  'weight': '1',
  'cups': '0.33'},
 {'name': 'All-Bran with Extra Fiber',
  'mfr': 'K',
  'type': 'C',
  'calories': '50',
  'protein': '4',
  'fat': '0',
  'sodium': '140',
  'fiber': '14',
  'carbo': '8',
  'sugars': '0',
  'potass': '330',

## Dependencias entre activos de datos

In [5]:
#cereals -> nabisco_cereals
with open(r"C:\dev\workspace-python\dagster-data-app\tmpe8eotrqp\storage\highest_protein_nabisco_cereal", "rb") as data_asset_pickle_file:
    data_asset = pickle.load(data_asset_pickle_file)

data_asset

'100% Bran'

## Ejercicio

Crear un grafo de activos que para obtener los siguientes resultados a partir de la lista de diccionarios ```restaurantes```.

- lista de restaurantes con más de 5 especialidades
- lista de restaurantes que están en una Avenida
- lista de restaurantes que NO tienen un número en los datos de la dirección

In [None]:
restaurantes =[
	{
		"nombre": "Casa de Campo",
		"especialidades": [
			"Pique Macho",
			"Pique Lobo",
			"Picantes"
		],
		"telefono": "4243937",
		"direccion": {
			"calle": "Pasaje Boulevard de la Recoleta",
			"numero": "618"
		}
	},
	{
		"nombre": "Doña Fely",
		"especialidades": [
			"Chorizo Chuquisaqueño",
			"Puchero",
			"Ranga",
			"Fricase",
			"Menudito",
			"Picantes"
		],
		"telefono": "4582972",
		"direccion": {
			"calle": "Tumusla entre Calama y Ladislao Cabrera",
			"numero": "544"
		}
	},
	{
		"nombre": "Doña Pola",
		"especialidades": [
			"Escabeche",
			"Enrollado",
			"Chicharrón",
			"Humintas"
		],
		"telefono": "4281015",
		"direccion": {
			"calle": "Av. América esq. Av. Gualberto Villarroel",
			"numero": "275"
		}
	},
	{
		"nombre": "Jacarandá",
		"especialidades": [
			"Pique Macho",
			"Charque",
			"Picante de Lengua"
		],
		"telefono": "4286424",
		"direccion": {
			"calle": "Av. Tadeo Haenke",
			"numero": "2150"
		}
	},
	{
		"nombre": "La Gaviota",
		"especialidades": [
			"Buffet Criollo",
			"Intendente",
			"Matambre",
			"Picante de Lengua",
			"Habas Pejtu",
			"Plato del Bicentenario"
		],
		"telefono": "4424497",
		"direccion": {
			"calle": "C. Azanaqueo. Av. América Oeste final",
			"numero": "1000"
		}
	},
	{
		"nombre": "Felicidad",
		"especialidades": [
			"Fideos Uchu",
			"Picante de Pollo",
			"Variedad de Chichas"
		],
		"telefono": "4446591",
		"direccion": {
			"calle": "Av. Beneméritos del Chaco, lado puente Killman"
		}
	},
	{
		"nombre": "Tunari",
		"especialidades": [
			"Chorizo Criollo",
			"Ranga",
			"Sopa de maní",
			"Riñón",
			"Lomo"
		],
		"telefono": "4528588",
		"direccion": {
			"calle": "Av. Ballivian",
			"numero": "676"
		}
	},
	{
		"nombre": "Miraflores",
		"especialidades": [
			"Pique Macho",
			"Lechón"
		],
		"telefono": "4248780",
		"direccion": {
			"calle": "c. Tarija casi Av. Aniceto Padilla"
		}
	},
	{
		"nombre": "Todo al Horno",
		"especialidades": [
			"Lechon",
			"Pato",
			"Pollo",
			"Pavo al horno"
		],
		"telefono": "4409347",
		"direccion": {
			"calle": "Av. Melchor Pérez de Olguín esq. Nueva Castilla",
			"numero": "2114"
		}
	},
	{
		"nombre": "El Palmar",
		"especialidades": [
			"Lapping",
			"Pampaku"
		],
		"telefono": "4246224",
		"direccion": {
			"calle": "c. Man Césped entre Tarcos y Algarrobos",
			"numero": "549"
		}
	}
]

# Referencias

- [The Python pickle Module: How to Persist Objects in Python](https://realpython.com/python-pickle-module/)
- [Software Defined Assets Explainer](https://www.youtube.com/watch?v=In4CUoFKOfY)
