<a href="https://colab.research.google.com/github/coder160/cuadernos/blob/main/Vision_Artificial/VISION_AI_intro.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Visión Artificial**: principios y fundamentos.


La **Visión Artificial** o **Computer Vision**, es un **concepto del siglo XXI** que trasciende las fronteras de la **tecnología**, la **innovación** y el **desarrollo** de una manera **sorprendente**.

Llega para cambiar los paradigmas de la civilización en cuanto a **tecnología y humanidad**:

- *Desde el punto de vista **tecnológico**,* su aplicación implica el uso de muchas herramientas de **inteligencia artificial**.

- *Desde el punto de vista **humano**,* su aplicación implica muchos cambios estructurales en distintas industrias, el principal y mas grande de ellos es la **confianza** hacia los resultados obtenidos por la **tecnología**.


De acuerdo con la <a href="https://www.stanford.edu/">universidad de Stanford</a>, en un documento compilado por <a href="https://scholar.google.com/citations?user=IcqahyAAAAAJ&hl=es">Ranjay Krishna</a>.

># ¿Qué es Vision por Artificial?
>
>"Dos definiciones de visión artificial:
>
>La *visión artificial* puede ser definida como un campo científico que extrae información de las imágenes digitales. El tipo de información obtenida de una imagen puede variar: identificar, medir el espacio para navegación o aplicaciones de realidad aumentada.
>
>Otra forma de definir la *visión artificial* es através de sus aplicaciones.
>La visión artificial fabrica algoritmos que entienden el concepto de imagen y lo usan para otras aplicaciones."


Fuente: <a href="http://vision.stanford.edu/teaching/cs131_fall1718/files/cs131-class-notes.pdf"> Computer Vision, Foundations and Applications.</a>

http://vision.stanford.edu/teaching/cs131_fall1718/files/cs131-class-notes.pdf


<figure>
<center><img alt="Que es visión por computadora"
src="https://miro.medium.com/v2/resize:fit:640/format:webp/1*3_o6n-T-GSUTFjudYZd-CQ.png"   
width="auto"/>
<figcaption>img1: ¿What is computer vision? <br> <a href="http://vision.stanford.edu/teaching/cs131_fall1718/files/cs131-class-notes.pdf"> http://vision.stanford.edu/teaching/cs131_fall1718/files/cs131-class-notes.pdf</a></center> </figcaption>
</figure>

O en palabras de **<a href="">IBM</a>**:


> # ¿Qué es la Visión Artificial?
>
>"La visión artificial es un campo de la IA que permite que las computadoras y los sistemas obtengan información significativa de imágenes digitales, videos y otras entradas visuales, y tomen acciones o hagan recomendaciones basadas en esa información.
>
>Si la IA permite que las computadoras piensen, la visión artificial les permite ver, observar y comprender."


Fuente: <a href="https://www.ibm.com/mx-es/topics/computer-vision"> ¿Qué es la Visión Artificial? | IBM.</a>

https://www.ibm.com/mx-es/topics/computer-vision




## En resumen

Podemos decir que la **Visión Artificial** es un campo de **aplicación** de la **Inteligencia Artificial** dedicado a **obtener información** detallada de cualquier **medio visual** y tomar **acciones o recomendaciones** basadas en la información.

# **Visión Artificial**: tecnologías en la práctica

Dentro del campo de la **visión artificial**, la **tecnología** nos permite aplicar distintas **técnicas y herramientas** para lograr diferentes **resultados**.

Algunas de estas **herramientas** son las proporcionadas por **<a href="https://huggingface.co/">HuggingFace</a>**, empresa líder en machine learning OpenSource y **<a href="https://opencv.org/"> OpenCV </a>** empresa líder en Visión Artificial OpenSoruce:



- **Transformers - https://huggingface.co/docs/transformers/v4.32.1/en/index**

*Transformers* provee *APIs y herramientas* para descargar y entrenar fácilmente *modelos de última generación* a partir de *pre-entrenados*. Usando *modelos pre-entrenados* puede **reducir** el **costo computacional**, la **huella de carbono** y reducir el **tiempo y los recursos** requeridos para **entrenar** un modelo **desde cero**.

*Documentación Oficial:* https://pypi.org/project/transformers/2.1.0/

- **OpenCV - https://opencv.org/**

*OpenCV* es una **biblioteca libre** de *visión artificial* originalmente desarrollada por **Intel**. **OpenCV** significa **Open Computer Vision**.

*Documentación oficial*: https://pypi.org/project/opencv-python/

---
Cada una de estas **tecnologías** nos ofrecen distintas **herramientas** para **trabajar** con la **información**, como por ejemplo:

* Clasificación de imágenes

* Clasificación de Videos

* Detección de Objetos

* Segmentación semantica

* Segmentación de Imágenes

* Extracción de características

* Preguntas a Documentos

* Preguntas a elementos visuales

* Calculo de profundidad

* Clasifcación Avanzada de Imágenes (Zero-Shot)

* Clasificaciń Avanzada de Objetos (Zero-Shot)



A continuación **exploraremos estas librerías** para tratar de **comprender** un poco su **potencial de aplicación** en áreas de **robótica y automatización**.

## Instalación de la librería Transformers

De acuerdo a la **guía** proporcionada en la *documentación oficial* de **HuggingFace**:

https://huggingface.co/docs/transformers/v4.32.1/en/installation#installation

Instalamos la librería **Transformers** con el Instalador de Paquetes de **Python** (Package Installer for Python), **<a href="https://pypi.org/project/pip/">PIP</a>**:

<br>

1. **Instalar el módulo de entornos virtuales venv de python**

```python
#Instalar el módulo de entornos virtuales venv de python
!apt install python3.10-venv
```

2. **Crear nuestro entorno virtual**

```python

#Crear nuestro entorno virtual
!python -m venv .env
```

3. **Activamos nuestro entorno virtual**

```python
#Activamos nuestro entorno virtual
!source .env/bin/activate
```

4. **Instalamos todas las dependencias de Transformers necesarias**

```python
#Instalamos todas las dependencias de Transformers necesarias
!pip install transformers
!pip install 'transformers[torch]'
!pip install 'transformers[tf-cpu]'
!pip install 'transformers[flax]'
clear_output()
```

5. **Realizamos una prueba para verificar que el código funciona**

```python
#Realizamos una prueba para verificar que el código funciona
!python -c "from transformers import pipeline; print(pipeline('sentiment-analysis')('You are an amazing human!'))"
```


**Resultado**:
Deberíamos tener un resultado *similar* al siguiente:
```
2023-09-01 08:23:01.815840: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
No model was supplied, defaulted to distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
Downloading (…)lve/main/config.json: 100% 629/629 [00:00<00:00, 2.22MB/s]
Downloading model.safetensors: 100% 268M/268M [00:04<00:00, 64.6MB/s]
Downloading (…)okenizer_config.json: 100% 48.0/48.0 [00:00<00:00, 162kB/s]
Downloading (…)solve/main/vocab.txt: 100% 232k/232k [00:00<00:00, 22.8MB/s]
[{'label': 'POSITIVE', 'score': 0.9998890161514282}]
```

In [None]:
#@title **Instalador Principal**

#@markdown # **Importante**
#@markdown **Recuerda instalar primero la librería principal junto con todos sus componentes.**

from IPython.display import clear_output


#@markdown * Instalar el módulo de entornos virtuales venv de python
!apt install python3.10-venv

#@markdown * Crear nuestro entorno virtual
!python -m venv .env

#@markdown * Activar nuestro entorno virtual
!source .env/bin/activate

#@markdown * Instalar todas las dependencias de Transformers necesarias
!pip install transformers
!pip install 'transformers[torch]'
!pip install 'transformers[tf-cpu]'
!pip install 'transformers[flax]'
clear_output()
print("Instalación correcta")

#@markdown **Realizamos una prueba para verificar que el código funciona**
#@markdown *Introduce cualquier frase:*

frase = "You are an amazing human!" #@param {type:"string"}

#@markdown *Le aplicaremos técnicas de sentimiento de análisis utilizando el pipeline de transformers-huggingface*
from transformers import pipeline;
print(pipeline('sentiment-analysis')(frase))

Instalación correcta


No model was supplied, defaulted to distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


Downloading (…)lve/main/config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

Downloading (…)solve/main/vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

[{'label': 'POSITIVE', 'score': 0.9998890161514282}]


Realiza la práctica interactiva en Colab: <a href="https://colab.research.google.com/github/coder160/cuadernos/blob/main/Vision_Artificial/VISION_AI_intro.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>