# Expressão regular para capturar um float

In [8]:
import re

sinal = r'(?P<sign>[+-])?'
parte_inteira = r'(?P<int>\d+)'
parte_fracionaria = r'\.(?P<frac>\d*)'
exp = '(?:[eE](?P<exp_sign>[+-])?(?P<exp>\d+))?'
extra = r'(?:' + parte_fracionaria + exp + ')?'

# Juntamos todas as partes
regex = re.compile(sinal + parte_inteira + extra)

## Conversão de string para float

Utilizamos os dados obtidos a partir da expressão regular (com os grupos de captura) para reconstruir o número de ponto flutuante.

In [9]:
sign_dic = {'+': 1, '-': -1, None: 1}


def parse_float(x):
    # Processa utilizando expressões regulares
    m = regex.fullmatch(x)
    if m is None:
        raise float('nan')
    
    # Obtem os grupos de captura
    dic = m.groupdict()

    # Parte inteira
    int_p = int(dic['int'] or 0)
    sign = sign_dic[dic['sign']]
    
    # Parte fracionária
    if dic['frac'] is None:
        frac = 0
    else:
        frac = int(dic['frac']) / 10 ** len(dic['frac'])

    # Expoente em notação científica
    if dic['exp'] is None:
        exp = 0
    else:
        exp_sign = sign_dic[dic['exp_sign']]
        exp = int(dic['exp']) * exp_sign

    return sign * (int_p + frac) * 10 ** exp

## Exemplo

In [10]:
x = '+1.2e-23'

float(x), parse_float(x)

(1.2e-23, 1.1999999999999998e-23)

## Teste de velocidade

In [11]:
x = '1.5'
%timeit -n 10000 float(x)
%timeit -n 10000 parse_float(x)

260 ns ± 86.7 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
3.25 µs ± 545 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
