In [1]:
#Habilitar intellisense"
%config IPCompleter.greedy = True

**Convertir el siguiente dataframe a otro dataframe llamado ```reservas``` con las siguientes columnas:**

- ```estado_reserva```, valores posibles: ```confirmada```, ```no-confirmada```
- ```importe_bs```, el importe en bolivianos cuando la reserva ha sido confirmada. Si la reserva no ha sido confirmada el importe es cero.
- ```mes```, el nombre del mes en el que se hizo la reserva. En el dataframe origen la fecha tiene el siguiente __[formato](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-format-codes)__: ```%Y%m%d```

**Referencias**

- [pd.to_datetime()](https://dataindependent.com/pandas/pandas-to-datetime-string-to-date-pd-to_datetime/)
- [Series.dt.month_name()](https://es.acervolima.com/python-pandas-series-dt-month_name/)

In [75]:
import numpy as np
import pandas as pd
import spacy
from spacy import displacy
nlp = spacy.load("es_core_news_md")
from spacy.matcher import Matcher

In [46]:
mensajes = pd.read_csv("log_mensajes.csv")
mensajes

Unnamed: 0,mensaje,respuesta,fecha
0,Necesito reservar una habitación para el sigui...,"Reserva aceptada, son 500 bolivianos",20220927
1,"Por favor, reservar la mesa cerca del escenari...","Hemos confirmado su reserva, son 150 bolivianos",20221002
2,Debido a razones de fuerza mayor tengo que can...,"No hay problema, lo esperamos en otra oportunidad",20220930
3,Reservaré los asientos en el palco izquierdo,"Deberá cancelar 200 bolivianos, reserva lista",20221005
4,Voy a reservar,¿El asiento 9F o el 10A? ambos cuestan 310 bol...,20220930


In [47]:
mensajes.dtypes

mensaje      object
respuesta    object
fecha         int64
dtype: object

In [59]:
mensajes['respuesta']

0                 Reserva aceptada, son 500 bolivianos
1      Hemos confirmado su reserva, son 150 bolivianos
2    No hay problema, lo esperamos en otra oportunidad
3        Deberá cancelar 200 bolivianos, reserva lista
4    ¿El asiento 9F o el 10A? ambos cuestan 310 bol...
Name: respuesta, dtype: object

In [60]:
mensajes['respuesta'][4]

'¿El asiento 9F o el 10A? ambos cuestan 310 boliviannos'

In [64]:
mensaje = mensajes['respuesta'][4]

In [65]:
mensaje

'¿El asiento 9F o el 10A? ambos cuestan 310 boliviannos'

In [66]:
doc = nlp(mensaje)
for token in doc:
    print(f"{token.text} (POS: {token.pos_} / {spacy.explain(token.pos_)} : {token.morph}")

¿ (POS: PUNCT / punctuation : PunctSide=Ini|PunctType=Qest
El (POS: DET / determiner : Definite=Def|Gender=Masc|Number=Sing|PronType=Art
asiento (POS: NOUN / noun : Gender=Masc|Number=Sing
9F (POS: NUM / numeral : NumForm=Digit|NumType=Card
o (POS: CCONJ / coordinating conjunction : 
el (POS: DET / determiner : Definite=Def|Gender=Masc|Number=Sing|PronType=Art
10A (POS: NUM / numeral : NumForm=Digit|NumType=Card
? (POS: PUNCT / punctuation : PunctSide=Fin|PunctType=Qest
ambos (POS: NUM / numeral : Gender=Masc|NumType=Card|Number=Plur
cuestan (POS: VERB / verb : Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin
310 (POS: NUM / numeral : NumForm=Digit|NumType=Card
boliviannos (POS: NOUN / noun : Gender=Masc|Number=Plur


In [53]:
def getMoney(sent):
    doc = nlp(sent.text)
    for token in doc:
        if (token.pos_ == 'NUM'):
            return token.text

In [82]:
def verificarLemmas(sent):
    lemas = ["confirmado","aceptado","confirmar","cancelar"]
    doc = nlp(sent.text)
    for token in doc:
        if token.lemma_ in lemas:
            return True
    return False

In [55]:
for sentence in doc.sents:
    if (verificarLemmas(sentence) == True):
        print(getMoney(sentence))
        print("confirmado")
    

500


In [44]:
print(getMoney(doc))

PROPN
ADJ
PUNCT
AUX
NUM
500


In [74]:
def getMoney(text):
    doc = nlp(text)
    print(text)
    matcher = Matcher(nlp.vocab)
    pattern = [{"IS_DIGIT":True},{"LEMMA":"boliviano"}]
    matcher.add("aux_verb_pattern", [pattern])
    matches = matcher(doc)
    for match_id, start, end in matches:
        return doc[start]

In [58]:
mensajes["respuesta"].apply(getMoney)

0     500
1     150
2    None
3     200
4      9F
Name: respuesta, dtype: object

In [67]:
def getText(text):
    doc = nlp(text)
    return doc

In [68]:
mensajes["respuesta"].apply(getText)

0         (Reserva, aceptada, ,, son, 500, bolivianos)
1    (Hemos, confirmado, su, reserva, ,, son, 150, ...
2    (No, hay, problema, ,, lo, esperamos, en, otra...
3    (Deberá, cancelar, 200, bolivianos, ,, reserva...
4    (¿, El, asiento, 9F, o, el, 10A, ?, ambos, cue...
Name: respuesta, dtype: object

In [77]:
sentences = mensajes["respuesta"].tolist()

ValueError: [E1041] Expected a string, Doc, or bytes as input, but got: <class 'list'>

In [83]:
for sentence in sentences:
    doc = nlp(sentence)
    if (verificarLemmas(doc) == True):
        print(getMoney(doc))
        print("confirmado")

Reserva aceptada, son 500 bolivianos
500
confirmado
Hemos confirmado su reserva, son 150 bolivianos
150
confirmado
Deberá cancelar 200 bolivianos, reserva lista
200
confirmado


In [85]:
dinero = mensajes["respuesta"].apply(getMoney)

Reserva aceptada, son 500 bolivianos
Hemos confirmado su reserva, son 150 bolivianos
No hay problema, lo esperamos en otra oportunidad
Deberá cancelar 200 bolivianos, reserva lista
¿El asiento 9F o el 10A? ambos cuestan 310 boliviannos


In [None]:
def getMoney(text):
    doc = nlp(text)
    matcher = Matcher(nlp.vocab)
    pattern = [{"IS_DIGIT":True},{"LEMMA":"boliviano"}]
    matcher.add("aux_verb_pattern", [pattern])
    matches = matcher(doc)
    for match_id, start, end in matches:
        return doc[start]
    return 0

In [86]:
dinero

0     500
1     150
2    None
3     200
4    None
Name: respuesta, dtype: object