# DESAFIO DA DISCIPLINA

#### Contexto - Problema: Você foi designado para fazer o tratamento dos dados de um formulário na empresa em que trabalha. O campo salário do formulário, que deveria ser númerico, não está padronizado corretamente, tem numeros escritos por extenso. Seu trabalho é criar uma lib que receba um numero escrito por extenso e converta em valor numérico. 

#### Exemplos: 

##### Entrada: Mil duzentos e cinquenta ---- Saída: 1250

##### Entrada: 1k ---- Saída: 1000

##### Entrada: 1.3k ---- Saída: 1300

In [17]:
import re
dict_numeros = {
    'zero': 0,
    'um': 1,
    'hum': 1,
    'dois': 2,
    'tres': 3,
    'quatro': 4,
    'cinco': 5,
    'seis': 6,
    'sete': 7,
    'oito': 8,
    'nove': 9,
    'dez': 10,
    'onze': 11,
    'doze': 12,
    'treze': 13,
    'catorze': 14,
    'quatorze': 14,
    'quinze': 15,
    'dezesseis': 16,
    'dezessete': 17,
    'dezoito': 18,
    'dezenove': 19,
    'vinte': 20,
    'trinta': 30,
    'quarenta': 40,
    'cinquenta': 50,
    'sessenta': 60,
    'setenta': 70,
    'oitenta': 80,
    'noventa': 90,
    'cem': 100,
    'cento': 100,
    'duzentos': 200,
    'trezentos': 300,
    'quatrocentos': 400,
    'quinhentos': 500,
    'seiscentos': 600,
    'setecentos': 700,
    'oitocentos': 800,
    'novecentos': 900,
    'mil': 1000,
    'milhao': 1000000,
    'milhoes': 1000000,
    'bilhao': 1000000000,
    'bilhoes': 1000000000,
    'k': 1000,
    'm': 1000000,
    'g': 1000000000,
    }


In [18]:
#Função para tratar o texto da entrada, que é o número escrito por extenso
def trata_string(string):
    string = re.sub('[ãâáàä]', 'a', string)
    string = re.sub('[éêẽë]', 'e', string)
    string = re.sub('[íìîï]', 'i', string)
    string = re.sub('[óòôõ]', 'o', string)
    string = re.sub('[úùü]', 'u', string)
    string = re.sub('[^A-Za-z0-9\.\,\ ]+', '', string)
    string = string.replace('reais', '')
    string = string.replace('bilhao', 'bilhoes')
    string = string.replace('milhao', 'milhoes')
    return string

#Função para converter os textos da entrada em números
def converte_numero(parte):
    numero = []
    for i in parte:
        if i == 'e':
            numero.append(0)
        else:
            item = dict_numeros[i]
            numero.append(item)

    return numero

#Função para somar os números de cada unidade numérica
def soma_unidade(numero):
    soma = sum(numero[0:len(numero)-1])
    return soma, numero[len(numero)-1]

#Função para multiplicar a soma pela unidade numérica
def multiplica_unidade(tupla_soma):
    multiplicacao = tupla_soma[0]*tupla_soma[1]
    return multiplicacao

#Função principal para fazer a junção das partes tratadas
def converte_string(string):
    string = trata_string(string)
    lista = string.replace(',', '').split()

    multi_bilhoes = 0
    multi_milhoes = 0
    multi_mil = 0

    if 'bilhoes' in lista:
        if lista[0] == 'bilhoes':
            lista.insert(0,'um')
        parte1 = lista[:lista.index('bilhoes')+1]
        [lista.remove(i) for i in lista and parte1]
        conversao = converte_numero(parte1)
        soma_bilhoes = soma_unidade(conversao)
        multi_bilhoes = multiplica_unidade(soma_bilhoes)
    
    if 'milhoes' in lista:
        if lista[0] == 'milhoes':
            lista.insert(0,'um')
        parte2 = lista[:lista.index('milhoes')+1]
        [lista.remove(i) for i in lista and parte2]
        conversao = converte_numero(parte2)
        soma_milhoes = soma_unidade(conversao)
        multi_milhoes = multiplica_unidade(soma_milhoes)

    if 'mil' in lista:
        if lista[0] == 'mil':
            lista.insert(0,'um')
        parte3 = lista[:lista.index('mil')+1]
        [lista.remove(i) for i in lista and parte3]
        conversao = converte_numero(parte3)
        soma_mil = soma_unidade(conversao)
        multi_mil = multiplica_unidade(soma_mil)
        
    parte4 = lista
    conversao = converte_numero(parte4)
    soma = sum(conversao) + multi_bilhoes + multi_milhoes + multi_mil
    return int(soma)

In [25]:
#Função para tratar e converter a entrada formada por dígitos e as letras k, m ou g
def converte_abreviado(string):
    string = trata_string(string)
    string = string.replace(',', '.').lower()
    string = string.replace(' ', '')

    letra = re.search('[a-z]', string)
    letra.group(0)

    if '.' in string:
        num = re.search('\d*.\d*', string)
        lista = [num.group(0), letra.group(0)]

    else:
        num = string[:-1]
        if num == '':
            num = 1
        lista = [num, letra.group(0)]
    
    letra = dict_numeros[lista[1]]

    calculo = float(lista[0])*letra
    return int(calculo)

In [26]:
#Função para identificar o padrão da entrada e aplicar as funções adequadas
def trata_dados(string):
    string = string.replace('-', '').lower()
    teste = string.replace(" ", '')
    teste = teste.replace(",", '')
    teste = teste.replace("\n", '')

    if teste.isalpha():
        resultado = converte_string(string)

    elif teste.isnumeric():
        resultado = int(string)

    elif re.match('\d', string):
        resultado = converte_abreviado(string)
    
    return resultado

In [27]:
#Código para ler o arquivo de entrada e emitir uma saída com os números convertidos
from encodings import utf_8

arquivo = open('Inputs.txt', 'r', encoding = 'utf_8')
array_numero = []
for linha in arquivo:
    array_numero.append(trata_dados(linha))
arquivo.close()

arquivo = open ('Saída - arquivo inputs.txt', 'w') 
for linha in array_numero: 
    arquivo.writelines(str(linha)+'\n') 
arquivo.close()