<div style="font-size: 3em; font-weight: bold; text-align: center;">Clases en Hugging Face</div>
<div style="text-align: right; font-size: 24px; margin-right: 10px;">Guillermo D√≠az Aguado</div>

In [1]:
import transformers

## `Pipelines`
En ü§ó Hugging Face, los pipelines son una forma muy sencilla y directa de usar modelos preentrenados para tareas comunes de procesamiento de lenguaje natural, visi√≥n, audio y m√°s, sin preocuparte por los detalles internos de tokenizaci√≥n, preprocesamiento o inferencia

Combina:
* Preprocesador
    * Tokenizador
* Modelo preentrenado
* Postprocesamiento del resultado

La abstracci√≥n `pipeline` es un *wrapper* donde est√°n todos los posibles **Task-specific pipelines**

### Pipelines Funcionamiento
Lo primero es inicializar el objeto que queramos usar incluyendo elementos claves como pueden ser:
* `task`, `model` o ambos. As√≠ indicaremos que tipo de proceso se llevar√° a cabo

### Pipelines Parameters

#### `task` (`str`)
Define qu√© tipo de *pipeline* se devolver√°. Las tareas aceptadas actualmente son:

- `"audio-classification"` ‚Üí `AudioClassificationPipeline`
- `"automatic-speech-recognition"` ‚Üí `AutomaticSpeechRecognitionPipeline`
- `"depth-estimation"` ‚Üí `DepthEstimationPipeline`
- `"document-question-answering"` ‚Üí `DocumentQuestionAnsweringPipeline`
- `"feature-extraction"` ‚Üí `FeatureExtractionPipeline`
- `"fill-mask"` ‚Üí `FillMaskPipeline`
- `"image-classification"` ‚Üí `ImageClassificationPipeline`
- `"image-feature-extraction"` ‚Üí `ImageFeatureExtractionPipeline`
- `"image-segmentation"` ‚Üí `ImageSegmentationPipeline`
- `"image-text-to-text"` ‚Üí `ImageTextToTextPipeline`
- `"image-to-image"` ‚Üí `ImageToImagePipeline`
- `"image-to-text"` ‚Üí `ImageToTextPipeline`
- `"mask-generation"` ‚Üí `MaskGenerationPipeline`
- `"object-detection"` ‚Üí `ObjectDetectionPipeline`
- `"question-answering"` ‚Üí `QuestionAnsweringPipeline`
- `"summarization"` ‚Üí `SummarizationPipeline`
- `"table-question-answering"` ‚Üí `TableQuestionAnsweringPipeline`
- `"text2text-generation"` ‚Üí `Text2TextGenerationPipeline`
- `"text-classification"` (alias `"sentiment-analysis"`) ‚Üí `TextClassificationPipeline`
- `"text-generation"` ‚Üí `TextGenerationPipeline`
- `"text-to-audio"` (alias `"text-to-speech"`) ‚Üí `TextToAudioPipeline`
- `"token-classification"` (alias `"ner"`) ‚Üí `TokenClassificationPipeline`
- `"translation"` ‚Üí `TranslationPipeline`
- `"translation_xx_to_yy"` ‚Üí `TranslationPipeline`
- `"video-classification"` ‚Üí `VideoClassificationPipeline`
- `"visual-question-answering"` ‚Üí `VisualQuestionAnsweringPipeline`
- `"zero-shot-classification"` ‚Üí `ZeroShotClassificationPipeline`
- `"zero-shot-image-classification"` ‚Üí `ZeroShotImageClassificationPipeline`
- `"zero-shot-audio-classification"` ‚Üí `ZeroShotAudioClassificationPipeline`
- `"zero-shot-object-detection"` ‚Üí `ZeroShotObjectDetectionPipeline`

---

#### `model` (`str` | `PreTrainedModel` | `TFPreTrainedModel`, *optional*)
El modelo que usar√° el pipeline. Puede ser un identificador de modelo o una instancia de un modelo preentrenado.  
Si no se proporciona, se usar√° el modelo por defecto para la tarea.

---

#### `config` (`str` | `PretrainedConfig`, *optional*)
Configuraci√≥n usada para instanciar el modelo.  
Si no se proporciona, se usar√° la configuraci√≥n por defecto del modelo dado o de la tarea.

---

#### `tokenizer` (`str` | `PreTrainedTokenizer`, *optional*)
Tokenizador que codificar√° los datos para el modelo.  
Si no se proporciona, se cargar√° el tokenizador por defecto para el modelo, la configuraci√≥n o la tarea.

---

#### `feature_extractor` (`str` | `PreTrainedFeatureExtractor`, *optional*)
Extractor de caracter√≠sticas usado para modelos no NLP (visi√≥n, audio o multi-modal).  
Si no se proporciona, se carga el extractor por defecto seg√∫n el modelo o la tarea.

---

#### `image_processor` (`str` | `BaseImageProcessor`, *optional*)
Procesador de im√°genes para modelos de visi√≥n o multimodales.  
Si no se proporciona, se cargar√° el procesador por defecto.

---

#### `processor` (`str` | `ProcessorMixin`, *optional*)
Procesador para entradas multimodales (texto + imagen, por ejemplo).  
Se carga el por defecto si no se proporciona.

---

#### `framework` (`str`, *optional*)
Framework a usar: `"pt"` (PyTorch) o `"tf"` (TensorFlow).  
Si no se especifica, se elige autom√°ticamente seg√∫n lo instalado o el modelo.

---

#### `revision` (`str`, *optional*, por defecto `"main"`)
Revisi√≥n espec√≠fica del modelo (rama, tag o commit) en Hugging Face Hub.

---

#### `use_fast` (`bool`, *optional*, por defecto `True`)
Usar un tokenizer r√°pido (`PreTrainedTokenizerFast`) si est√° disponible.

---

#### `use_auth_token` (`str` | `bool`, *optional*)
Token de autenticaci√≥n para acceder a archivos privados del Hub.  
Si es `True`, usar√° el token generado con `huggingface-cli login`.

---

#### `device` (`int` | `str` | `torch.device`)
Dispositivo donde se ejecutar√° el pipeline (`"cpu"`, `"cuda"`, `"mps"`, etc.).

---

#### `device_map` (`str` | `dict`, *optional*)
Distribuci√≥n autom√°tica de modelos entre dispositivos (usando `accelerate`).  
**‚ö†Ô∏è No usar junto con `device`, ya que entran en conflicto.**

---

#### `torch_dtype` (`str` | `torch.dtype`, *optional*)
Precisi√≥n usada en PyTorch (`float16`, `bfloat16`, `"auto"`, etc.).

---

#### `trust_remote_code` (`bool`, *optional*, por defecto `False`)
Permite ejecutar c√≥digo personalizado de los repositorios.  
**‚ö†Ô∏è Solo usar si conf√≠as en el c√≥digo.**

---

#### `model_kwargs` (`dict`, *optional*)
Argumentos adicionales enviados al cargar el modelo con `from_pretrained()`.

---

#### `kwargs` (`dict`, *optional*)
Argumentos adicionales pasados al inicializar el pipeline espec√≠fico.

---

### Pipelines Returns

#### `Pipeline`
Devuelve un objeto pipeline adecuado para la tarea especificada.


### Pipeline Batching

Todas las *pipelines* pueden usar *batching* peor tienes que darles algun objeto divisible -> List, Dataset, generator

#### Pipeline Chunk Batching

Existen casos como `zero-shot.classification` y `question-answering` que no es posible hacer la divisi√≥n de batches como quisieramos hacer de forma normal puesto que los datos de uno se utilizan para otro. Para ello hacemos:


## Autoclasses
Muchas veces, la arquitectura que queremos usar seguramente est√© en un *modelo preentrenado* al que podemos acceder usando el m√©todo `from_pretrained()`

Es importante recordar que debemos usar el m√©todo `from_pretrained()` para indicarle que modelo estamos usando para todas las siguientes clases. 

### `AutoTokenizer`
Sirve para cargar el **tokenizador** adecuado seg√∫n el modelo que est√©s usando. No hace falta que tu sepas cual hay que usar. 

Es importante recordar que debemos usar el m√©todo `from_pretrained()` para indicarle que modelo estamos usando

### `Automodel`
Es una clase que carga el **modelo base** de cualquier arquitectura soportada. 

El **modelo base** es:
* El modelo **sin cabeza(head)** especifica para tareas
* Solo incluye las capas fundamentales que generan las representaciones internas:
    * **embeddings**
    * **transformaciones internas**
    * **hidden states**

#### Funci√≥n exacta de `Automodel`
1. <u>Detecta el modelo correcto a partir del identificador </u> que le pases (por ejemplo "bert-base-uncased") y carga autom√°ticamente la clase que corresponde (`BertModel`)
2. <u>Carga los pesos preentrenados </u> del modelo base correspondiente.
3. Ejecuta el modelo

#### Salida de `Automodel`
* `last_hidden_state`: tensor con la representaci√≥n final de la √∫ltima capa con la forma -> [batch_size, seq_len, hidden_dim]
* Si activas `output_hidden_states=True` obtienes tambi√©n:
    * `hidden_states`: tupla con la salida de cada capa del modelo
* Si activas `output_attentions=True`
    * Obtienes matrices de las *attention* internas

### `AutoFeatureExtractor`
Sirve para cargar autom√°ticamente el **extractor de caracter√≠sticas** adecuado para modelos *no basados en texto*.

#### Adjunto 
En modelos recientes, esta clase est√° siendo reemplazada por `AutoImageProcessor` y `AutoProcessor`. 