*Ciencia: Scientia: Conocimiento*


## Los paradigmas de la ciencia:

<img src="https://www.researchgate.net/profile/Marcio_Costa13/publication/331216708/figure/fig4/AS:728393284870152@1550673900958/The-four-science-paradigms-empirical-theoretical-computational-and-data-driven-Each.png" width="600">

- El primer paradigma es basado en observación y experimentación
- El segundo paradigma agregó es el teórico, se basa en probar modelos y refutar hipótesis
- El tercer paradigma es basado en simulaciones: Probamos modelos y análisamos fenómenos utilizando simulaciones computacionales
- El [cuarto paradigma](https://en.wikipedia.org/wiki/The_Fourth_Paradigm) es basado en los datos: Entender fenómenos en base a datos masivos generados por sensores o simulaciones

## Tercer paradigma: Computación Científica

Hoy en día muchos trabajos científicos e ingenieriles incluyen al menos uno de los siguientes aspectos
- cálculos numéricos
- simulaciones
- modelamiento computacional
- análisis de datos

En resumen

> El computador se ha vuelto esencial para hacer ciencia

y por ende

> El software se ha vuelto esencial para hacer ciencia

En este escenario surge

> La **computación científica** es la disciplina que se encarga de desarrollar la teoría y las técnicas necesarias para resolver problemas matemáticos complejos de ciencias e ingeniería de forma eficiente

**Ejemplo:** Simulación de la unión de dos agujeros negros utilizando datos de LIGO

<img src="https://2.bp.blogspot.com/-h3SA26JUbB4/Vt86wugg1rI/AAAAAAAAzWE/DYuiVN4B8QA/s400/Two-Black-Holes-Merge-into-One.gif" width="500">


## Cuarto paradigma: Ciencia de los Datos

Los avances tecnológicos han permitido la generación y captura de una enorme cantidad de datos

Considere por ejemplo las Redes sociales, el internet de las cosas o los proyectos smart-city

Esto también ocurre en las ciencias
- Simulaciones con cada vez mayor nivel de resolución
- Telescopios que cubren mayores áreas del cielo y con mayor profunidad
- Digitalización de exámenes médicos

El término [*Big Data*](https://www.ibmbigdatahub.com/infographic/four-vs-big-data) se ocupa para describir el escenario tecnológico actual respecto a la abundancia, altas tazas de generación y variedad de datos 

En este escenario surge:

> La **ciencia de datos** es la disciplina que busca extraer conocimiento (información) a partir de datos (masivos)

**Ejemplo:** [Super-resolución en imágenes astronómicas usando modelo adversario generativo entrenado en datos de SDSS](https://academic.oup.com/mnrasl/article/467/1/L110/2931732)


<img src="https://scx1.b-cdn.net/csz/news/800/2017/1-neuralnetwor.png" width="500">

#### Competencias

La computación científica y la ciencia de los datos combinan competencias de 
- Ciencias de la computación: Diseñar algoritmos eficientes y escalables para procesar grandes bases de datos 
- Matemáticas aplicadas y estadística: Diseñar modelos que caractericen y resuman los datos

#### Interdiscipina

La computación científica y la ciencia de los datos son paradigmas naturalmente **interdisciplinares**

> Se debe colaborar con expertos del dominio para formular preguntas científicas e intepretar los resultados de nuestros rutinas computacionales

#### Reproducibilidad

> Un buen software científico debe permitir la replicación y reproducibilidad de los resultados de los experimentos


## ¿Qué podemos esperar de este curso?

En este curso aprenderemos a manejar librerías de computación científica basadas en el lenguaje de programación **Python** 

## ¿Qué es Python?

Python es un lenguaje de programación interpretado y multi-paradigma liberado en 1991 y ampliamente usado en ciencia de los datos 

¿Por qué?
- Enfoque en la simpleza, lo cual resulta en código más fácil de mantener y desarrollo más rápido
- Menor curva de aprendizaje
- Rico ecosistema de librerías abiertas para computo científico: [*Numpy*](http://www.numpy.org/), [*Scipy*](https://www.scipy.org/), [*Pandas*](https://pandas.pydata.org/), entre otras que serán estudiadas en este curso

¿Y que hay del desempeño de mis algoritmos versus lenguajes de programación de más bajo nivel? 
1. Trade-off entre tiempo de cómputo y horas hombre de programación
1. Librerías de cómputo científico de Python: Están compiladas con librerías optimizadas de bajo nivel (*e.g.* BLAS, LAPACK)
1. Si la función que necesito no está en las librerias: Integrar Python con lenguajes de bajo nivel (*e.g.* C++, Fortran)

## ¿Python2 o Python3?

- Python 2.7 sigue existiendo (y "compitiendo" con Python 3)
- [Un 95% de las librerias han sido portadas Python 3](https://wiki.python.org/moin/Python2orPython3)
- Python 2 ya no se sigue desarrollando
- En este curso usaremos **Python 3** como lenguaje oficial


## ¿Qué es PEP 8?

[Python Enhancement Proposal (PEP)](https://www.python.org/dev/peps/pep-0008/) es una especificación técnica que busca mejorar el lenguaje Python

PEP 0 es el índice de todos los PEP existentes. 

> El PEP 8 es una guia de buenas prácticas para dar formato a nuestros códigos en Python

El objetivo de PEP 8 es mantener un estándar que facilite la lectura de código escrito en Python


## ¿Qué es IPython?

Interactive Python (IPython) es un interprete de Python que ofrece varias mejoras tales como
- autocompletación de path y modulos
- acceso desde terminal a documentación y código fuente
- búsqueda histórica de comandos
- y las *magics* que serán vistas más adelante. 

IPython puede usarse desde un terminal como remplazo del intérprete convencioanl de Python

También puede usarse a través de un **jupyter notebook**

## ¿Qué es Jupyter?

[*Jupyter*](https://jupyter.org/) es un ambiente interactivo de cómputo basado en web 

El motor de jupyter (kernel) corre en un servidor (local o remoto) al cual el usuario accede a través de un navegador (browser)

En nuestro caso el motor (kernel) está basado en **IPython** pero también existe jupyter para otros lenguajes

El servidor de jupyter nos permite crear documentos en formato JSON llamados *notebooks*

El *jupyter notebook* puede contener 
- código
- gráficas interactivas
- texto con formato markdown
- ecuaciones 
- GUIs
- elementos HTML (tablas, imágenes, audio, video)

es decir que podemos mantener un experimento científico completo en un notebook

Para desarrollar módulos o librerías de Python se puede complementar con otras IDEs tales como [*pycharm*](https://www.jetbrains.com/pycharm/) o [*Spyder*](https://www.spyder-ide.org/) o editores de texto como [*vim*](https://www.vim.org/) o [*emacs*](https://www.gnu.org/software/emacs/), todas estas disponibles en los repositorios de su distribución de Linux preferida

## Modelo de capas de nuestro ambiente de trabajo:

<img src="img/intro.svg">