
# Ejemplos de expresiones regulares en Python

## 2. Extraer números de un texto:


- Se importa el módulo `re` para trabajar con expresiones regulares.
- Se define un patrón `r"\d+\.\d+"`:
    - `\d+`: Esto coincide con uno o más dígitos. El \d representa cualquier dígito del 0 al 9, y el + indica que debe haber uno o más dígitos consecutivos. Por lo tanto, \d+ coincide con números enteros de uno o más dígitos.
    - `\.`: Esto coincide con el carácter punto literal `"."`, que se utiliza como separador decimal en números decimales. El `\` se usa para escapar el punto, ya que en expresiones regulares el punto tiene un significado especial y se debe escapar para que se interprete literalmente.
    - `\d+`: Similar al primer `\d+`, esto coincide con uno o más dígitos. En este caso, se utiliza para representar la parte decimal del número.
- La función `re.findall()` busca todas las coincidencias del patrón en el texto y las devuelve como una lista.

In [None]:
import re

texto = "El precio es de $19.99 y hay un 10% de descuento."

# Extraer números enteros y decimales

# patron = r'\d+\.\d+' # Solo extrae los montos float
patron = r'\d+(?:\.\d+)?'  # ?: Traer desde el primer caracter

concidencias = re.findall(patron,texto)
print('Numeros encontrados: ', concidencias)

"""
Expresión completa: \d+(?:\.\d+)?
1. \d+
    \d representa cualquier dígito del 0 al 9.
    + indica que debe haber al menos un dígito y puede haber más (uno o más).

Ejemplos que coinciden con esta parte:
    3
    42
    987

2. (?:\.\d+)?

Esta parte representa un número decimal opcional. Veamos cada parte:

    (?: ... ) es un grupo no capturante. Se usa para agrupar sin guardar la coincidencia en un grupo numerado.
    \. representa un punto decimal . (hay que escaparlo con \ porque . en regex significa "cualquier carácter").
    \d+ representa uno o más dígitos después del punto.
    ? indica que toda esta parte (el grupo) es opcional. Es decir, puede aparecer una vez o no aparecer.

Ejemplos que coinciden con toda la expresión:

    5 (sin parte decimal)
    3.14 (con parte decimal)
    100.5
    42.0

Ejemplos que no coinciden:

    .5 (debe haber al menos un dígito antes del punto)
    3. (debe haber al menos un dígito después del punto si el punto está presente)
"""

Numeros encontrados:  ['19.99', '10']


### Ejemplo 2.2
Supongamos que tienes un texto que contiene información sobre el precio de varios productos en diferentes monedas. Queremos extraer todos los precios, tanto enteros como decimales, independientemente de la moneda en la que estén expresados.

In [None]:
texto = "El precio del primer producto es de $19.99 USD, el segundo producto cuesta €25.50, y el tercero vale ¢75000.00"



In [None]:
# Patrón regex para extraer precios en diferentes monedas

import re
texto = "El precio del primer producto es de $19.99 USD, el segundo producto cuesta €25.50, y el tercero vale ¢75000.00"
patron = r'.\d+\.\d+'
#patron = r"[$€¢]\d+\.\d+"

concidencias = re.findall(patron,texto)

print('Precios encontrados: ', concidencias)

"""
Expresión completa: '.\d+\.\d+'
1. . (punto)
    En regex, el . representa cualquier carácter excepto un salto de línea.
    Esto significa que la expresión empieza con cualquier carácter (una letra, número, símbolo, espacio, etc.).

2. \d+

    \d representa cualquier dígito del 0 al 9.
    + indica que debe haber al menos un dígito (uno o más).

3. \.

    Esto representa literalmente un punto decimal . (como en un número decimal).
    Se debe escapar con \ porque . en regex, por defecto, significa "cualquier carácter".

4. \d+ (segunda vez)

    De nuevo, representa uno o más dígitos después del punto decimal.

Resumen

Esta expresión regular busca una secuencia que cumpla con los siguientes requisitos:

    Empieza con cualquier carácter (cualquier cosa excepto un salto de línea).
    Sigue con uno o más dígitos numéricos.
    Luego aparece un punto decimal (.).
    Después del punto, hay uno o más dígitos numéricos.

Ejemplos que coinciden

✅ a12.34 → Empieza con a, sigue con 12.34
✅ 9.99 → Empieza con un espacio, sigue con 9.99
✅ X100.5 → Empieza con X, sigue con 100.5
Ejemplos que NO coinciden

❌ 12.34 → No coincide porque no hay ningún carácter antes del primer dígito.
❌ a.99 → No coincide porque después del primer . debe haber al menos un dígito antes del segundo punto.
"""

El precio del primer producto es de $19.99 USD, el segundo producto cuesta €25.50, y el tercero vale ¢75000.00
Precios encontrados:  ['$19.99', '€25.50', '¢75000.00']


### `patron = r"[$€¢]\d+\.\d+":`

- `[$€¢]`: Esta parte del patrón coincide con uno de los símbolos de moneda especificados: `"$"`, `"€"` o `"¢"`. Los corchetes `[]` indican un conjunto de caracteres, lo que significa que el patrón buscará cualquier coincidencia con alguno de los caracteres especificados dentro de ellos.
- `\d+`: Este elemento del patrón coincide con uno o más dígitos. El `\d` representa cualquier dígito del `0 al 9`, y el `+` indica que debe haber uno o más dígitos consecutivos. Por lo tanto, `\d+` coincide con números enteros de uno o más dígitos.
- `\.`: Este segmento del patrón coincide con el carácter punto literal `"."`. El punto se debe escapar con `\` para que sea interpretado literalmente, ya que en expresiones regulares el punto tiene un significado especial.
- `\d+`: Similar al primer `\d+`, esto coincide con uno o más dígitos. En este caso, se utiliza para representar la parte decimal del número.

##  Reto 

Supongamos que tienes un texto que contiene información sobre el precio de varios productos en diferentes monedas, pero además de los símbolos de moneda estándar como "$", "€" o "¥", también puede haber abreviaturas de monedas como "USD", "EUR", "JPY", etc. Queremos extraer todos los precios, tanto enteros como decimales, independientemente de la forma en que se especifique la moneda.

`Pista : (?:[$€¢]|(?:USD|EUR|JPY))`

In [7]:
import re

texto = "El precio del primer producto es de $19.99 USD, el segundo producto cuesta EUR25.50, y el tercero vale JPY1500.40"

# Patrón regex para extraer precios en diferentes monedas
#patron = r'(?:[$€¢]|(?:USD|EUR|JPY))\d+\.\d+'

patron = r'(?:[$€¢]|(?:USD|EUR|JPY))\d+(?:\.\d+)?' #la corregí porque si alguna cifra no tenía decimales no la iba a detectar

precios = re.findall(patron,texto)
print('Precios encontrados: ', precios)



#texto = "El precio del primer producto es de $19.99 USD, el segundo producto cuesta EUR25.50, y el tercero vale JPY1500.40"

# Complete patrón regex para extraer precios en diferentes monedas

#Salida esperada -> Precios encontrados: ['$19.99', 'EUR25.50', 'JPY1500.40']

Precios encontrados:  ['$19.99', 'EUR25.50', 'JPY1500.40']
