## Review response generation (demo)

This is a demo script for automatic response generation models trained with Fairseq.

In [1]:
import sys
import os
import random
# set device
# os.environ["CUDA_VISIBLE_DEVICES"]="6"  # specify which GPU(s) to be used

from typing import List, Optional

import torch
from fairseq import bleu, checkpoint_utils, data, options, tasks, utils
from fairseq.data import encoders
from fairseq.logging.meters import StopwatchMeter


# from fairseq.models.rrgen_seq2seq_lstm import rrgen_lstm_arch

## Define arguments and load model for generation

In [4]:
# Parse command-line arguments for generation
parser = options.get_generation_parser(default_task='rrgen_translation')

# test (small) model
# input_args = [
#     '/srv/scratch2/kew/fairseq_materials/translation_format/raw',
#     '--path=/srv/scratch2/kew/fairseq_materials/translation_format/rrgen_lstm_emb_senti_cate_rate_100k/checkpoints/checkpoint_best.pt',
#     '-s=src',
#     '-t=tgt',
#     '--task=rrgen_translation',
#     '--dataset-impl=raw',
#     '--nbest=1',
#     '--beam=10',
# #     '--sampling',
# #     '--sampling-topp=0.9',
#     '--use-sentiment=senti',
#     '--use-category=cate',
#     '--use-rating=rate',
# ]

input_args = [
    '/srv/scratch2/kew/fairseq_materials/rrgen/de/data_bin_rg',
#     '--path=/srv/scratch2/kew/fairseq_materials/rrgen/de/ft100src_rg/checkpoints/checkpoint_best.pt',
    '--path=/srv/scratch2/kew/fairseq_materials/rrgen/de/ft100_rg/checkpoints/checkpoint_best.pt',
    '-s=review',
    '-t=response_rg',
    '--task=rrgen_translation',
    '--dataset-impl=mmap',
    '--nbest=1',
    '--beam=5',
    '--sampling',
    '--sampling-topk=10',
#     '--sampling-topp=0.98',
    '--use-sentiment=sentiment',
    '--use-category=domain',
    '--use-rating=rating',
]

args = options.parse_args_and_arch(parser, input_args=input_args)

# Set device
# use_cuda = torch.cuda.is_available() and not args.cpu
use_cuda = False

# Setup task
task = tasks.setup_task(args)

# Load model
print('loading model from {}'.format(args.path))
models, _model_args = checkpoint_utils.load_model_ensemble(
    [args.path], task=task)
model = models[0]

print('finished loading model from {}'.format(args.path))

if use_cuda:
    model.cuda()
    
# Load alignment dictionary for unknown word replacement
# (None if no unknown word replacement, empty if no path to align dictionary)
align_dict = utils.load_align_dict(args.replace_unk)

# initialise generator model
generator = task.build_generator(models, args)

# Handle tokenization and BPE
tokenizer = encoders.build_tokenizer(args)
bpe = encoders.build_bpe(args)

def decode_fn(x):
    if bpe is not None:
        x = bpe.decode(x)
    if tokenizer is not None:
        x = tokenizer.decode(x)
    return x


loading model from /srv/scratch2/kew/fairseq_materials/rrgen/de/ft100_rg/checkpoints/checkpoint_best.pt
finished loading model from /srv/scratch2/kew/fairseq_materials/rrgen/de/ft100_rg/checkpoints/checkpoint_best.pt


In [9]:
def get_response(sentence: str,
                 ext_senti: Optional[int] = None,
                 ext_cate: Optional[str] = None,
                 ext_rate: Optional[int] = None,
                 target: Optional[str] = None,
                ):

    # vectorize input sentence 
    tokens = task.source_dictionary.encode_line(
    sentence, add_if_not_exist=False,)

    print(args)
    
    if args.use_sentiment:
        try:
            ext_senti = task.ext_senti_dict[ext_senti]
        except:
            try:
                ext_senti = task.ext_senti_dict[int(ext_senti)]
            except:
                r = random.choice(list(task.ext_senti_dict))
                print(f'[!] WARNING: Could not find value for sentiment input {ext_senti}. Using sentiment value {r}')               
                ext_senti = task.ext_senti_dict[r]
    if args.use_category:
        try:
            ext_cate = task.ext_cate_dict[ext_cate]
        except:
            try:
                ext_cate = task.ext_cate_dict[int(ext_cate)]
            except:
                r = random.choice(list(task.ext_cate_dict))
                print(f'[!] WARNING: Could not find value for category input {ext_cate}. Using category value {r}')               
                ext_cate = task.ext_cate_dict[r]
    if args.use_rating:
        try:
            ext_rate = task.ext_rate_dict[ext_rate]
        except:
            try:
                ext_rate = task.ext_rate_dict[int(ext_rate)]
            except:
                r = random.choice(list(task.ext_rate_dict))
                print(f'[!] WARNING: Could not find value for category input {ext_rate}. Using rating value {r}')               
                ext_rate = task.ext_rate_dict[r]
                
    # collate input as batch of size 1
    batch = data.rrgen_dataset.collate(
    samples=[{
        'id': -1,
        'source': tokens,
        'ext_senti': ext_senti,
        'ext_rate': ext_rate,
        'ext_cate': ext_cate
    }],
    pad_idx=task.source_dictionary.pad(),
    eos_idx=task.source_dictionary.eos(),
    left_pad_source=False,
    input_feeding=False)

    # [!] ensure correct dtype (int64)
    batch['net_input']['src_tokens'] = batch['net_input']['src_tokens'].type(
        torch.LongTensor)

    batch = utils.move_to_cuda(batch) if use_cuda else batch
    
    # assume no prefix tokens to initialise decoded output
    prefix_tokens = None
    
    gen_timer = StopwatchMeter()
    gen_timer.start()
    # target_tokens = None
    hypos = task.inference_step(generator, model, batch, prefix_tokens)
    num_generated_tokens = sum(len(h[0]['tokens']) for h in hypos)
    gen_timer.stop(num_generated_tokens)
    
    device = 'GPU' if use_cuda else 'CPU'
    
    
    # Process top predictions
    for j, hypo in enumerate(hypos[0][:args.nbest]):
        hypo_tokens, hypo_str, alignment = utils.post_process_prediction(
            hypo_tokens=hypo['tokens'].int().cpu(),
            src_str=tokens,
            alignment=hypo['alignment'],
            align_dict=align_dict,
            tgt_dict=task.target_dictionary,
            remove_bpe=args.remove_bpe,
            # extra_symbols_to_ignore=get_symbols_to_strip_from_output(generator),
        )
        detok_hypo_str = decode_fn(hypo_str)
        
        print(detok_hypo_str)
        print()
        
        if target:
            # Generate and compute BLEU score
            if args.sacrebleu:
                scorer = bleu.SacrebleuScorer()
            else:
                scorer = bleu.Scorer(
                    task.target_dictionary.pad(),
                    task.target_dictionary.eos(),
                    task.target_dictionary.unk())
            
#             if align_dict is not None or args.remove_bpe is not None:
                # Convert back to tokens for evaluation with unk replacement and/or without BPE
            target_tokens = task.target_dictionary.encode_line(target, add_if_not_exist=True)
            hypo_tokens = task.target_dictionary.encode_line(detok_hypo_str, add_if_not_exist=True)
            
            if hasattr(scorer, 'add_string'): # i.e. if using SacreBLEU
                scorer.add_string(target, detok_hypo_str)
            else:
                scorer.add(target_tokens, hypo_tokens) # calculate n-gram overlap on vectorized texts 
            
            print(scorer.result_string())
            
    
    print('Generated {} response(s) ({} tokens) in {:.1f}s on {}\n'.format(
        len(hypos[0][:args.nbest]), gen_timer.n, gen_timer.sum, device))
    
    print('-'*80)
    print()
    

---

## Generate review responses with loaded model

In [10]:
# Restaurant (positive)
review = """
grosszügiges mittagsmenu ---SEP--- sehr freundliches Personal , 
tolles Ambiente und ein grosszügiges Mittagsmenu zu einem angemessenem Preis .
"""

target="""
<GREETING> besten Dank für ihre tolle Bewertung zu ihrem Aufenthalt
von gestern Mittag bei uns im Sapori . Zeilen wie ihre sind die beste
Motivation für unsere Mitarbeiter - Merci ! wir freuen uns , durch die
Passion unserer Mitarbeiter unsere Gäste täglich aufs Neue zu überrschen
und zu begeistern ! wir wünschen ihnen alles Gute uns freuen uns , 
sie bei einer baldigen Gelegenheit erneut bei uns begrüssen und 
kulinairsch verwöhnen zu dürfen .
"""

sentiment = 8

rating = 5

domain = 2

get_response(
    sentence=review, 
    ext_senti=sentiment, 
    ext_cate=domain, 
    ext_rate=rating, 
#     target=target
    )

Namespace(all_gather_list_size=16384, beam=5, bf16=False, bpe=None, broadcast_buffers=False, bucket_cap_mb=25, checkpoint_suffix='', cpu=False, criterion='cross_entropy', data='/srv/scratch2/kew/fairseq_materials/rrgen/de/data_bin_rg', data_buffer_size=10, dataset_impl='mmap', ddp_backend='c10d', decoding_format=None, device_id=0, distributed_backend='nccl', distributed_init_method=None, distributed_no_spawn=False, distributed_port=-1, distributed_rank=0, distributed_world_size=1, distributed_wrapper='DDP', diverse_beam_groups=-1, diverse_beam_strength=0.5, diversity_rate=-1.0, empty_cache_freq=0, eval_bleu=False, eval_bleu_args=None, eval_bleu_detok='space', eval_bleu_detok_args=None, eval_bleu_print_samples=False, eval_bleu_remove_bpe=None, eval_tokenized_bleu=False, fast_stat_sync=False, find_unused_parameters=False, fix_batches_to_gpus=False, force_anneal=None, fp16=False, fp16_init_scale=128, fp16_no_flatten_grads=False, fp16_scale_tolerance=0.0, fp16_scale_window=None, gen_subset

---

In [24]:
# Restaurant (negative)
review = """
selten so schlechten Burger gegessen ---SEP--- 
überteuert , schlechte Qualität , Essen teilweise kalt , 
Bedienung unfreundlich und überfordert , es hat gezogen ohne Ende
"""

target="""
<GREETING> , wir sind immer offen für Kritik und nehmen diese in der Regel sehr ernst . ihre Kritik hingegen empfinden wir teilweise als ungerecht . wir haben unser Restaurant vor ca. <DIGIT> Wochen eröffnet und wissen , das es im Servicebereich leider noch nicht so läuft wie wir uns das wünschen und wie es normalerweise unser Anspruch ist . daran arbeiten wir und entschuldigen uns . auch kennen wir die Problematik , das es gezogen hat , dies wurde nun endlich behoben . nicht nachvollziehen können wir ihre Kritik zu den Preisen und zur Qualität und dagegen verwehren wir uns deutlich . wir verwenden <DIGIT> - <DIGIT> g Rindfleisch bester Qualität bei unseren Burgern . unsere Brötchen werden jeden Tag nach unseren Vorgaben frisch für uns gebacken . alle unsere Soßen werden jeden Tag aus besten Zutaten frisch zubereitet . wir verwenden nur frische Produkte und legen größten Wert auf die Qualität . Geschmäcker sind unterschiedlich und leider können wir trotz größter Bemühungen nicht den Geschmack von jedem treffen , das merken wir immer wieder bei unseren hausgemachten , frischen Soßen . nichts desto trotz ist unsere Preisgestaltung im Vergleich zur Menge und Qualität sehr günstig . wir freuen uns auf ihren nächsten Besuch in einem unserer Restaurants mit einer objektiveren Betrachtungsweise . <SALUTATION>
"""

sentiment = 2

rating = 2

domain = 1

get_response(
    sentence=review, 
    ext_senti=sentiment, 
    ext_cate=domain, 
    ext_rate=rating, 
#     target=target
    )

<GREETING> , wir bedanken uns für ihren Besuch im Clouds und ihre Zeit die sie sich für eine Rückmeldung genommen haben . wir bedauern sehr , dass wir sie nicht von unserem Restaurant überzeugen konnten . <SALUTATION>

Generated 1 response(s) (38 tokens) in 2.8s on CPU

--------------------------------------------------------------------------------



---

In [None]:
# Hotel (positive)
review = """
Ibis Styles Wien City ---SEP--- Top Hotel , Super freundlich ; 
sauber und gepflegt . Ecksuite Super Hell , Fön auf dem Zimmer 
Wasserkocher wäre nicht schlecht . kostenloser Kaffeeautomat und 
Wasserspender in der Lobby Frühstück reichhaltig und vielfältig
"""

target="""
<GREETING> , was für eine Bewertung ! vielen Dank dafür ! es macht 
mich und das gesamte Ibis Team sehr glücklich , dass sie und ihre 
Familie ihren Aufenthalt bei uns genossen haben . vielen Dank auch 
für die Anregung betreffend dem Wasserkocher - diesen bieten wir 
bereits gerne nach Verfügbarkeit an der Rezeption zum Verleih an . <SALUTATION>
"""

sentiment = 9

rating = 5

domain = 1

get_response(
    sentence=review, 
    ext_senti=sentiment, 
    ext_cate=domain, 
    ext_rate=rating, 
    target=target
    )

---

In [None]:
# Hotel (negative)
review = """
schlechtes Hotel ---SEP--- das Hotel hatte keine funktionierende 
Klimaanlage , trotzdem wurde der volle Preis berechnet , Personal 
größtenteils unfreundlich und nicht hilfsbereit . dreckiges Zimmer
und alt , Fenster teilweise nicht zu öffnen
"""

target="""
<GREETING> , vielen Dank für ihre Zeit und ihre Bewertung . 
wir schätzen sie als unseren Gast , und ihr Feedback ist uns sehr wichtig . 
indem sie uns mitteilen , was ihnen an ihrem Aufenthalt gefallen hat und 
was wir noch verbessern können , unterstützen sie uns dabei , den Aufenthalt 
bei uns für sie und andere Gäste zukünftig noch angenehmer zu gestalten . 
derzeit finden Renovierungsarbeiten statt . wir danken für das Verständnis , 
dass wir dies bei laufendem Betrieb nur nach und nach vollrichten können . 
eine Klimaanlage ist in unserem Hotel bisher nicht vorhanden gewesen . 
im Zuge der Renovierung wird diese erst eingebaut . 
wir freuen uns schon heute , sie bald wieder bei uns begrüßen 
zu können . <SALUTATION>
"""

sentiment = 2

rating = 2

domain = 1

get_response(
    sentence=review, 
    ext_senti=sentiment, 
    ext_cate=domain, 
    ext_rate=rating, 
    target=target
    )

---






















In [None]:
review = """
das Allerletzte ---SEP--- wir haben bereits vor Monaten 
zwei Doppelzimmer mit getrennten Betten gebucht , 
die Kreditkarte wurde lange vor der Ankunft belastet , 
obwohl die Zimmer bezahlt sind wird die Kreditkarte bei 
der Ankunft noch einmal mit <DIGIT> Euro Garantie belastet 
( mehr als der Preis der bereits bezahlten Übernachtungen ) , 
bei der Ankunft im Hotel ist die Reception völlig überlaufen , 
Wartezeit eine halbe Stunde , die reservierten und bezahlten 
Zimmer stehen nicht zur Verfügung , das Hotel sei ausgebucht , 
wir bekommen lediglich zwei Zimmer mit kleinen Doppelbetten , 
ein Zimmer nicht sehr sauber , es liegt im Eingangsbereich 
Müll auf dem Boden , das ganze ist eine Zumutung , 
Personal an der Rezeption genervt und unfreundlich , 
dieses Hotel besser meiden , 
P.S. : in der Hotelhalle ist auch noch Erbrochenes auf dem Fußboden
"""
target = """
<GREETING> W , vielen Dank für ihren Aufenthalt und für die Zeit ,
die sie sich genommen haben um uns dieses Feedback zu schreiben .
wir möchten uns natürlich für den negativen Eindruck ,
den sie hier offensichtlich bekommen haben entschuldigen .
da uns die Zufriedenheit unserer Gäste sehr am Herzen liegt ,
möchten wir der Sache gerne auf den Grund gehen und bitten sie daher ,
uns persönlich per E-Mail zu kontaktieren ,
damit wir in diesem Fall recherchieren können .
dies dient zum einen zur internen Verbesserung ,
zum anderen möchten wir ihnen natürlich gerne zeigen ,
dass wir es besser können und eine Lösung für diese Herausforderung finden .
wir freuen uns auf ihre Rückmeldung .
"""
senti = 1
cate = 1
rate = 1

get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate, target=target)

In [None]:
review = """
das war das letzte Mal ---SEP--- unprofessionelle , 
aggressive und gewalttätige Tür ohne jede Klasse und 
ohne die Fähigkeit gewaltfrei zu deeskalieren"""
target = """
<GREETING> , wir bedauern sehr , dass sie so unangenehme
eine Erfahrung bei uns machen Mussten . schreiben sie uns
sehr gerne eine E-Mail an <EMAIL> , damit wir mehr Details
über diesen Abend erfahren und gemeinsam eine Lösung finden können . <SALUTATION>"""
senti = 1
cate = 2
rate = 1
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate, target=target)

In [None]:
review = """leider sehr enttäuschend ---SEP--- wir waren 
an einem sonnigen Donnerstagabend auf der Terrasse von The Butcher .
auf unsere Speisekarte mussten wir erst einmal <DIGIT> Minuten warten ,
die Bedienung erklärte uns , dass Zurzeit keine Karten verfügbar seien .
die Bedienung war zwar freundliche , wirkte jedoch gestresst , 
weil alle Tische besetzt waren . 
wir bestellten zwei vegane Burger , da drei der vegetarischen Burger
laut Karte Vegan zubereitet werden könne . die Bedienung erklärte uns dann aber ,
dass dies nur bei einem Burger möglich sei . 
als die Burger nach einer halben Stunde serviert wurden , enthielten sie Käse .
also schickten wir sie zurück in die Küche . 
nach einer Viertelstunde kamen die Burger zurück - diesmal mit einem " V " gekennzeichnet .
sie enthielten noch immer Käse . erst nach insgesamt <DIGIT> Stunden Wartezeit
erhielten wir schliesslich die bestellten veganen Burger , 
dabei handelte es sich aber eher um ein Brötchen mir Gemüse ohne Sauce . ich habe Verständnis dafür , dass nicht in jedem Restaurant Vegan gegessen werden kann . wer dies aber auf die Karte schreibt , sollte doch wenigstens wissen , was Vegan bedeutet . auch irritierend fand ich , dass ein Burger-Restaurant , das auf der Karte damit wirbt , besonders nachhaltig zu sein , alle Getränke im Plastik-Becher serviert . nachhaltig geht anders ."""
senti = 2 # 7
cate = 2
rate = 1

get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)

In [None]:
review = """falsche Zusagen ( schriftlich ) ---SEP--- unsere Anreise erfolgte gegen <DIGIT> Uhr mit <DIGIT> müden Kindern nach einer <DIGIT> stündigen Autofahrt . ich wurde noch begrüßt , mein Mann der <DIGIT> Min später nach kam nicht ( kein Problem ) . vor der Buchung wurde uns schriftlich ein Doppelzimmer mit Verbindungstür bestätigt . vor Ort , wusste keiner etwas davon . Kinderzimmer auf einer Etage , Elternschlafzimmer auf einer anderen ! ? ? ? nach eindringlichem Bitten eine Lösung zu finden , wurde mir gesagt sie seien ausgebucht und das ist eben so ! ? ich habe wehement darum gebeten eine Lösung zu finden - beide angestellte <DIGIT> Min weg ! ? dann wurde mir gesagt , sie versuchen es- kann dauern ..... auf meine Frage , wie lange ( mittlerweile <DIGIT> Uhr ) war die Antwort - keine Ahnung 🤔 . unfassbar wie Unprofessionell . nach eindringlichem Bitten mir eine ungefähre Zeit zu nennen , <DIGIT> Min , <DIGIT> Min oder eine Stunde wurde mir gesagt eher 1stunde . ich habe dankend abgelehnt und darum gebeten den Vorgang zu stornieren . ich hätte dieses Hotel niemals ohne Zusage der Verbindungstür gewählt . vor Ort waren die Mitarbeiter echt frech und ignorant - ich bin schwer enttäuscht . das einzig positive , das sie den Vorgang ohne Kosten storniert haben"""
senti = 1
cate = 1
rate = 1

get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)

In [None]:
review = """Miserabel ---SEP--- im Hotel Seiler ist das Wort Kulanz nicht existent . wir hätten wenigstens ein Entgegenkommen in Form.Z . b.eines Gutscheines erwartet . das Hotel Seiler haben wir aus unserer Liste gestrichen . wir werden auch entsprechend Werbung für das Haus machen ."""
senti = 4
cate = 1
rate = 1
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)

In [None]:
review = """stinkend statt dufte ---SEP--- das gesamte Hotel eoch nach Toilette , da es ein paar Wochen zuvor ein Abwasser-Rohrbruch gab . das Badwar ungenügend geputzt und die Klimaanlage ließ sich nicht regeln . das Zimmer war sehr warm . das Personal am Check-In lehnte eine Reklamation ab und wies mehrere Gäste in arroganter und unfreundlicher Weise ab ."""
senti = 3 #7
cate = 1
rate = 1
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)

In [None]:
review = """enttäuschend ---SEP--- der Wein ( Pinot Grigio und Frascati ) war absolut nicht zu empfehlen , billige No-Name Ware , das Essen geschmacklos ( Pizza Frutti Di Mare mit Meeresfrüchte-Imitat aus Surimi ) . die Damen im Service freundlich jedoch der Patrone beim Bezahlen der Rechnung unfreundlich und arrogant . nie wieder !"""
senti = 3
cate = 2
rate = 1
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)


In [None]:
review = """es war besser als befriedigend aber nicht sehr gut ---SEP--- Gesamteindruck super , Preise für Garage und Frühstück sind generell in allen Hotels zu hoch . Preis / Nacht wäre besser zu akzeptieren wenn es Fitness/Wellness O.Ä. geben würde . dazu könnten Z.B. Info ´ s zu Partnern ausliegen ."""
senti = 6
cate = 1
rate = 3
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)

In [None]:
review = """Weihnachten im Parkhotel lindner Oberstaufen ---SEP--- unvergessliche Weihnachtsatmosphäre im Parkhotel Lindner , zusammen feiern in einer grossen Familie , sehr gediegen mit Harfenmusik , Weihnachtsgeschichten hören und zusammen Weihnachtslieder singen unter einem wunderbar geschmückten Baum , das war Weihnachten <DIGIT> . das freundliche aufgestellte Personal verwöhnte uns Gäste mit auserlesenen Speisen aus der Küche von Herrn Wagenblast . es war einmal mehr ein unvergesslicher Aufenthalt ."""
senti = 8
cate = 1
rate = 5
get_response(sentence=review, ext_senti=senti, ext_cate=cate, ext_rate=rate)