<a href="https://colab.research.google.com/github/mgua/fraser/blob/main/generatore_frasi_in_romagnolo_SCHURR.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1) generazione di frasi da usarsi nella produzione delle storie romagnole

Marco Guardigli, mgua@tomware.it
giugno 2024, luglio 2025, agosto 2025

Questo jupyter notebook, compatibile ed eseguibile tramite Google Colabs o simili ambienti (tra cui anaconda navigator), consente di generare frasi sintatticamente corrette in lingua romagnola (rgn) e in lingua italiana (ita)

Lo scopo è quello di generare materiale pre il training di modelli LLM capaci di interpretare e sintetizzare testo in lingua romagnola.

Questo codice fa parte del progetto VociNelVento.
Vedere [www.vocinelvento.it]

Per eseguire il codice prepare il pulsante "Run all" o scegliere la voce di menu Runtime/Run all (CTRL-F9).

Le frasi generate sono visibili cliccando sull'ultima intestazione a fondo pagina.


There is a common approach in definition of parts of speech, valid for different languages.
the website universaldependencies.org

https://universaldependencies.org/u/pos/

L'approccio linguistico per la definizione delle POS (parts of speech)

(ci provo: mgua)

    ADJ: adjective, non possessive: bel, zal, antig, ignurant, cioss, tond, rubost, rud, vuijt, megar, invurni, negar, gagg, tranquell, gnarr, crud,

    ADP: adposition, prepositions, and postpositions: only simple (ad, da, ) (articulated are split with corresponding article in the next token: https://universaldependencies.org/it/pos/ADP.html)
    
    ADV: adverb: sobit, aligrament, atentament, sicurament, datorna, d'ingnascost,
    
    AUX: auxiliary

    CCONJ: coordinating conjunction

    DET: determiner, articles (determinated and indeterminates), possessive adjectives. articulated propositions are to be split in the article component (DET) e in the proposition (ADP)

    INTJ: interjection: Alora!, Ciò, Donca, Daj So!, Pusta, Daj!, Boja, Vigliaca Tera!, Porca paleta!, Putana vigliaca!, Oh Sburona!,

    NOUN: noun: gat, mnestra, elbar, fnestra, scarana, tevla, let, piat, furzena, cuciera, fug, bichir, legn, testa, scherp, bragon, machina, tigiam, spoja,

    NUM: numeral: vincqvatar, dodg, utantasi', on, du, tri, cvatar, zencv, si, sett, ott, nov, dis, domelavincvatar

    PART: particle: denotes noun and adjective case:

    PRON: pronoun: me, te, li, la, lo, no, nujetar , vo, vujetar,

    PROPN: proper noun: Gilberto ad barudela, la Maria ad Zibulon, Jusef, Gisto, Sauro, Mario,

    PUNCT: punctuation: .,;:,?!&
    
    SCONJ: subordinating conjunction: cvindi, parche', prema, intant che,  coma, se, ma, mo, intigna mod, che (https://universaldependencies.org/it/pos/SCONJ.html )

    SYM: symbol: @#$%^*+-=<>,

    VERB: verb: conjugates and concordates with nouns and objects, describes action in time, conveys action flavour, and allows hypothetical consideratons. a magn, te t'megn, e/la magna, a magne', a magni, i magna;
    a verb can be intransitive, when he doesnt use the

    X: other: need examples



# 2) caratteri accentati e diacritici, nelle rappresentazioni UNICODE

Un font adeguato ad una ragionevole rappresentazioni di questi segni, standard e aperto è il font DOULOS-SIL

Nella cella seguente è definito un dizionario com i vari simboli, e con i corrispondenti riferimenti ai codici unicode.

Se la cella viene modificata, per favore lasciate commento con data autore e descrizione modifica apportata.

In [15]:
# to compare two words that may be written in different ways, and could have a
# different length, we need to convert to a common symbolism
# mgua@tomware.it
# 2024, jun 03, aug 2025
# see  https://www.compart.com/en/unicode/U+00F2
# we can use a conversion dictionary, that for every symbol is giving a standard representation
#
# “Cedilla” is ALT-807 after letter
# “Plus sign below” is ALT-799 after letter
# “Dot below” is ALT-803
#
# the following symbols are consistent with the Libero Ercolani dictionary
# and with recommendations from Schürr
#
# dopo conversazione con Carla Fabbri del 5 agosto 2025:
#   aggiunte vocali con la tilde
#   aggiunte s e z con accento acuto
#   aggiunte c e g con puntino sopra (dolci) (dopo conversazione con Gilberto Casadio)
#

cdict = {
        "à": {"ascii-equivalent": "a", "diacritics": ["grave-accent"], "case":"lowercase", "unicode":"U+00E0","composition":["U+0061","U+0300"]},
        "á": {"ascii-equivalent": "a", "diacritics": ["acute-accent"], "case":"lowercase", "unicode":"U+00E1","composition":["U+0061","U+0301"]},
        "â": {"ascii-equivalent": "a", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+00E2","composition":["U+0061","U+0302"]},
        "ä": {"ascii-equivalent": "a", "diacritics": ["diaeresis"], "case":"lowercase", "unicode":"U+00E4", "composition":["U+0061","U+0308"]},
        "ā": {"ascii-equivalent": "a", "diacritics": ["macron"], "case":"lowercase", "unicode":"U+0101", "composition":["U+0061","U+0304"]},
        "å": {"ascii-equivalent": "a", "diacritics": ["Ring Above"], "case":"lowercase", "unicode":"U+00E5", "composition":["U+0061","U+030A"]}, # added 4 lug (ludla)
        "ã": {"ascii-equivalent": "a", "diacritics": ["tilde"], "case": "lowercase", "unicode": "U+00E3", "composition": ["U+0061", "U+0303"]},

        "À": {"ascii-equivalent": "A", "diacritics": ["grave-accent"], "case":"uppercase", "unicode":"U+00C0","composition":["U+0041","U+0300"]},
        "Á": {"ascii-equivalent": "A", "diacritics": ["acute-accent"], "case":"uppercase", "unicode":"U+00C1","composition":["U+0041","U+0301"]},
        "Â": {"ascii-equivalent": "A", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+00C2","composition":["U+0041","U+0302"]},
        "Ä": {"ascii-equivalent": "A", "diacritics": ["diaeresis"], "case":"uppercase", "unicode":"U+00C4", "composition":["U+0041","U+0308"]},
        "Ā": {"ascii-equivalent": "A", "diacritics": ["macron"], "case":"uppercase", "unicode":"U+0100", "composition":["U+0041","U+0304"]},
        "Å": {"ascii-equivalent": "A", "diacritics": ["Ring Above"], "case":"uppercase", "unicode":"U+00C5", "composition":["U+0041","U+030A"]},
        "Ã": {"ascii-equivalent": "A", "diacritics": ["tilde"], "case": "uppercase", "unicode": "U+00C3", "composition": ["U+0041", "U+0303"]},


        "è": {"ascii-equivalent": "e", "diacritics": ["grave-accent"], "case":"lowercase", "unicode":"U+00E8","composition":["U+0065","U+0300"]},
        "é": {"ascii-equivalent": "e", "diacritics": ["acute-accent"], "case":"lowercase", "unicode":"U+00E9","composition":["U+0065","U+0301"]},
        "ê": {"ascii-equivalent": "e", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+00EA","composition":["U+0065","U+0302"]},
        "ë": {"ascii-equivalent": "e", "diacritics": ["diaeresis"], "case":"lowercase", "unicode":"U+00EB", "composition":["U+0065","U+0308"]},
        "ē": {"ascii-equivalent": "e", "diacritics": ["macron"], "case":"lowercase", "unicode":"U+0113", "composition":["U+0065","U+0304"]},
        "ẽ": {"ascii-equivalent": "e", "diacritics": ["tilde"], "case": "lowercase", "unicode": "U+1EBD", "composition": ["U+0065", "U+0303"]},
        "æ": {"ascii-equivalent": "e", "diacritics": ["letter"], "case":"lowercase", "unicode":"U+00E6", "composition":["U+00E6"]},

        "È": {"ascii-equivalent": "E", "diacritics": ["grave-accent"], "case":"uppercase", "unicode":"U+00C8","composition":["U+0045","U+0300"]},
        "É": {"ascii-equivalent": "E", "diacritics": ["acute-accent"], "case":"uppercase", "unicode":"U+00C9","composition":["U+0045","U+0301"]},
        "Ê": {"ascii-equivalent": "E", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+00CA","composition":["U+0045","U+0302"]},
        "Ë": {"ascii-equivalent": "E", "diacritics": ["diaeresis"], "case":"uppercase", "unicode":"U+00CB", "composition":["U+0045","U+0308"]},
        "Ē": {"ascii-equivalent": "E", "diacritics": ["macron"], "case":"uppercase", "unicode":"U+0112", "composition":["U+0045","U+0304"]},
        "Ẽ": {"ascii-equivalent": "E", "diacritics": ["tilde"], "case": "uppercase", "unicode": "U+1EBC", "composition": ["U+0045", "U+0303"]},
        "Æ": {"ascii-equivalent": "e", "diacritics": ["letter"], "case":"uppercase", "unicode":"U+00C6", "composition":["U+00C6"]},


        "ì": {"ascii-equivalent": "i", "diacritics": ["grave-accent"], "case":"lowercase", "unicode":"U+00EC","composition":["U+0069","U+0300"]},
        "í": {"ascii-equivalent": "i", "diacritics": ["acute-accent"], "case":"lowercase", "unicode":"U+00ED","composition":["U+0069","U+0301"]},
        "î": {"ascii-equivalent": "i", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+00EE","composition":["U+0069","U+0302"]},
        "ï": {"ascii-equivalent": "i", "diacritics": ["diaeresis"], "case":"lowercase", "unicode":"U+00EF", "composition":["U+0069","U+0308"]},
        "ī": {"ascii-equivalent": "i", "diacritics": ["macron"], "case":"lowercase", "unicode":"U+012B", "composition":["U+0069","U+0304"]},
        "ĩ": {"ascii-equivalent": "i", "diacritics": ["tilde"], "case": "lowercase", "unicode": "U+0129", "composition": ["U+0069", "U+0303"]},

        "Ì": {"ascii-equivalent": "I", "diacritics": ["grave-accent"], "case":"uppercase", "unicode":"U+00CC","composition":["U+0049","U+0300"]},
        "Í": {"ascii-equivalent": "I", "diacritics": ["acute-accent"], "case":"uppercase", "unicode":"U+00CD","composition":["U+0049","U+0301"]},
        "Î": {"ascii-equivalent": "I", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+00CE","composition":["U+0049","U+0302"]},
        "Ï": {"ascii-equivalent": "I", "diacritics": ["diaeresis"], "case":"uppercase", "unicode":"U+00CF", "composition":["U+0049","U+0308"]},
        "Ī": {"ascii-equivalent": "I", "diacritics": ["macron"], "case":"uppercase", "unicode":"U+012A", "composition":["U+0049","U+0304"]},
        "Ĩ": {"ascii-equivalent": "I", "diacritics": ["tilde"], "case": "uppercase", "unicode": "U+0128", "composition": ["U+0049", "U+0303"]},


        "ò": {"ascii-equivalent": "o", "diacritics": ["grave-accent"], "case":"lowercase", "unicode":"U+00F2","composition":["U+006F","U+0300"]},
        "ó": {"ascii-equivalent": "o", "diacritics": ["acute-accent"], "case":"lowercase", "unicode":"U+00F3","composition":["U+006F","U+0301"]},
        "ô": {"ascii-equivalent": "o", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+00F4","composition":["U+006F","U+0302"]},
        "ö": {"ascii-equivalent": "o", "diacritics": ["diaeresis"], "case":"lowercase", "unicode":"U+00F6", "composition":["U+006F","U+0308"]},
        "ō": {"ascii-equivalent": "o", "diacritics": ["macron"], "case":"lowercase", "unicode":"U+014D", "composition":["U+006F","U+0304"]},
        "õ": {"ascii-equivalent": "o", "diacritics": ["tilde"], "case": "lowercase", "unicode": "U+00F5", "composition": ["U+006F", "U+0303"]},
        "ŏ": {"ascii-equivalent": "o", "diacritics": ["breve"], "case":"lowercase", "unicode":"U+014F","composition":["U+006F","U+0306"]},

        "Ò": {"ascii-equivalent": "O", "diacritics": ["grave-accent"], "case":"uppercase", "unicode":"U+00D2","composition":["U+004F","U+0300"]},
        "Ó": {"ascii-equivalent": "O", "diacritics": ["acute-accent"], "case":"uppercase", "unicode":"U+00D3","composition":["U+004F","U+0301"]},
        "Ô": {"ascii-equivalent": "O", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+00D4","composition":["U+004F","U+0302"]},
        "Ö": {"ascii-equivalent": "O", "diacritics": ["diaeresis"], "case":"uppercase", "unicode":"U+00D6", "composition":["U+004F","U+0308"]},
        "Ō": {"ascii-equivalent": "O", "diacritics": ["macron"], "case":"uppercase", "unicode":"U+014C", "composition":["U+004F","U+0304"]},
        "Õ": {"ascii-equivalent": "O", "diacritics": ["tilde"], "case": "uppercase", "unicode": "U+00D5", "composition": ["U+004F", "U+0303"]},
        "Ŏ": {"ascii-equivalent": "O", "diacritics": ["breve"], "case":"capital", "unicode":"U+014E","composition":["U+004F","U+0306"]},


        "ù": {"ascii-equivalent": "u", "diacritics": ["grave-accent"], "case":"lowercase", "unicode":"U+00F9","composition":["U+0075","U+0300"]},
        "ú": {"ascii-equivalent": "u", "diacritics": ["acute-accent"], "case":"lowercase", "unicode":"U+00FA","composition":["U+0075","U+0301"]},
        "û": {"ascii-equivalent": "u", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+00FB","composition":["U+0075","U+0302"]},
        "ü": {"ascii-equivalent": "u", "diacritics": ["diaeresis"], "case":"lowercase", "unicode":"U+00FC", "composition":["U+0075","U+0308"]},
        "ū": {"ascii-equivalent": "u", "diacritics": ["macron"], "case":"lowercase", "unicode":"U+016B", "composition":["U+0075","U+0304"]},
        "ũ": {"ascii-equivalent": "u", "diacritics": ["tilde"], "case": "lowercase", "unicode": "U+0169", "composition": ["U+0075", "U+0303"]},

        "Ù": {"ascii-equivalent": "U", "diacritics": ["grave-accent"], "case":"uppercase", "unicode":"U+00D9","composition":["U+0055","U+0300"]},
        "Ú": {"ascii-equivalent": "U", "diacritics": ["acute-accent"], "case":"uppercase", "unicode":"U+00DA","composition":["U+0055","U+0301"]},
        "Û": {"ascii-equivalent": "U", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+00DB","composition":["U+0055","U+0302"]},
        "Ü": {"ascii-equivalent": "U", "diacritics": ["diaeresis"], "case":"uppercase", "unicode":"U+00DC", "composition":["U+0055","U+0308"]},
        "Ū": {"ascii-equivalent": "U", "diacritics": ["macron"], "case":"uppercase", "unicode":"U+016A", "composition":["U+0055","U+0304"]},
        "Ũ": {"ascii-equivalent": "U", "diacritics": ["tilde"], "case": "uppercase", "unicode": "U+0168", "composition": ["U+0055", "U+0303"]},


        "ŝ": {"ascii-equivalent": "s", "diacritics": ["circumflex-accent"], "case":"lowercase", "unicode":"U+015D","composition":["U+0073","U+0302"]},
        "š": {"ascii-equivalent": "s", "diacritics": ["caron"], "case":"lowercase", "unicode":"U+0161","composition":["U+0073","U+030C"]},
        "ş": {"ascii-equivalent": "s", "diacritics": ["cedilla"], "case":"lowercase", "unicode":"U+015F","composition":["U+0073","U+0327"]},
        "s̟": {"ascii-equivalent": "s", "diacritics": ["plus-sign-below"], "case":"lowercase", "unicode":"U+0073","composition":["U+0073","U+031F"]},    # missing direct unicode
        "ṣ": {"ascii-equivalent": "s", "diacritics": ["dot-below"], "case":"lowercase", "unicode":"U+01E63","composition":["U+0073","U+0323"]},
        "ś": {"ascii-equivalent": "s", "diacritics": ["acute-accent"], "case": "lowercase", "unicode": "U+015B", "composition": ["U+0073", "U+0301"]},

        "Ŝ": {"ascii-equivalent": "S", "diacritics": ["circumflex-accent"], "case":"uppercase", "unicode":"U+015C","composition":["U+0053","U+0302"]},
        "Š": {"ascii-equivalent": "S", "diacritics": ["caron"], "case":"uppercase", "unicode":"U+0160","composition":["U+0053","U+030C"]},
        "Ş": {"ascii-equivalent": "S", "diacritics": ["cedilla"], "case":"uppercase", "unicode":"U+015E","composition":["U+0053","U+0327"]},
        "S̟": {"ascii-equivalent": "S", "diacritics": ["plus-sign-below"], "case":"uppercase", "unicode":"U+0053","composition":["U+0053","U+031F"]},    # missing direct unicode
        "Ṣ": {"ascii-equivalent": "S", "diacritics": ["dot-below"], "case":"uppercase", "unicode":"U+1E62","composition":["U+0053","U+0323"]},
        "Ś": {"ascii-equivalent": "S", "diacritics": ["acute-accent"], "case": "uppercase", "unicode": "U+015A", "composition": ["U+0053", "U+0301"]},


        "z̟": {"ascii-equivalent": "z", "diacritics": ["plus-sign-below"], "case":"lowercase", "unicode":"U+007A","composition":["U+007A","U+031F"]},    # missing direct unicode
        "ẓ": {"ascii-equivalent": "z", "diacritics": ["dot-below"], "case":"lowercase", "unicode":"U+1E93","composition":["U+007A","U+0323"]},
        "z̧": {"ascii-equivalent": "z", "diacritics": ["cedilla"], "case":"lowercase", "unicode":"U+007A","composition":["U+007A","U+0327"]},            # missing direct unicode
        "ź": {"ascii-equivalent": "z", "diacritics": ["acute-accent"], "case": "lowercase", "unicode": "U+017A", "composition": ["U+007A", "U+0301"]},
        "ž": {"ascii-equivalent": "z", "diacritics": ["caron"], "case":"lowercase", "unicode":"U+017E","composition":["U+007A","U+030C"]},

        "Z̟": {"ascii-equivalent": "Z", "diacritics": ["plus-sign-below"], "case":"uppercase", "unicode":"U+005A","composition":["U+005A","U+031F"]},    # missing direct unicode
        "Ẓ": {"ascii-equivalent": "Z", "diacritics": ["dot-below"], "case":"uppercase", "unicode":"U+1E92","composition":["U+005A","U+0323"]},
        "Z̧": {"ascii-equivalent": "Z", "diacritics": ["cedilla"], "case":"uppercase", "unicode":"U+005A","composition":["U+005A","U+0327"]},            # missing direct unicode
        "Ź": {"ascii-equivalent": "Z", "diacritics": ["acute-accent"], "case": "uppercase", "unicode": "U+0179", "composition": ["U+005A", "U+0301"]},
        "Ž": {"ascii-equivalent": "Z", "diacritics": ["caron"], "case":"capital", "unicode":"U+017D","composition":["U+005A","U+030C"]},


        "ċ": {"ascii-equivalent": "c", "diacritics": ["dot-above"], "case": "lowercase", "unicode": "U+010B", "composition": ["U+0063", "U+0307"]},
        "Ċ": {"ascii-equivalent": "C", "diacritics": ["dot-above"], "case": "uppercase", "unicode": "U+010A", "composition": ["U+0043", "U+0307"]},
        "ç": {"ascii-equivalent": "c", "diacritics": ["Cedilla"], "case":"lowercase", "unicode":"U+00E7","composition":["U+0063","U+0327"]},
        "Ç": {"ascii-equivalent": "C", "diacritics": ["Cedilla"], "case":"uppercase", "unicode":"U+00C7","composition":["U+0043","U+0327"]},


        "ġ": {"ascii-equivalent": "g", "diacritics": ["dot-above"], "case": "lowercase", "unicode": "U+0121", "composition": ["U+0067", "U+0307"]},
        "Ġ": {"ascii-equivalent": "G", "diacritics": ["dot-above"], "case": "uppercase", "unicode": "U+0120", "composition": ["U+0047", "U+0307"]},

        "ñ": {"ascii-equivalent": "n", "diacritics": ["tilde"], "case":"lowercase", "unicode":"U+00F1","composition":["U+006E","U+0303"]},
        "Ñ": {"ascii-equivalent": "N", "diacritics": ["tilde"], "case":"uppercase", "unicode":"U+00D1","composition":["U+004E","U+0303"]},

        }
#  ệ
# s e z con croce sotto, z con puntino sotto, z con cedilla

# In computing and typesetting, a soft hyphen (Unicode U+00AD SOFT HYPHEN ( &shy;)) or syllable hyphen,
# is a code point reserved in some coded character sets for the purpose of breaking words across lines
# by inserting visible hyphens if they fall on the line end but remain invisible within the line.
#
# single char replacement
# in several Ludla pages, the "thorn" þ character is found https://en.wikipedia.org/wiki/Thorn_(letter)
# lowercase/uppercase U+00DE/U+00FE https://www.compart.com/en/unicode/U+00FE
# this represent the sound th and can be replaced with z with underdot ẓ lowercase/uppercase U+1E93/U+1E92
# https://www.compart.com/en/unicode/U+1E92
# (we based this replacement relying on Libero Ercolani dictionary)

# similarly the character ETH ð in ludla is (wrongly) used to represent the sound like in Şbadaj, Şbagliê, Smalt
# in ercolani, this is represented by S with cedilla. In Berti, this is represented with s with underdot.
# We stick to cedilla like Ercolani.
# so, replace ð/Ð  U+00F0/U+00D0 with ş/Ş  U+015F/U+015E

# similarly the character š (s with caron) in ludla is (wrongly) used to represent the sound like in Şbadaj, Şbagliê
# so, replace š/Š  U+0161/U+0160 with ş/Ş  U+015F/U+015E (s with cedilla)

# similarly the character ž in ludla is not ok
# so, replace ž/Ž  U+017E/U+017D with ẓ (underdot) lowercase/uppercase U+1E93/U+1E92
# replace ñ/Ñ U+00F1/U+00D1 with ordinary n/N
# replace æ/Æ U+00E6/U+00C6 with  ë/Ë U+00EB/U+00CB
# see the other colabs file: string-word-and-character-compare.ipynb

puct_dict = {
    "’" : {"ascii-equivalent": "'","name":"right single quotation mark", "unicode":"U+2019"},
    "“" : {"ascii-equivalent": '"',"name":"left double quotation mark", "unicode":"U+201C"},
    "”" : {"ascii-equivalent": '"',"name":"left double quotation mark", "unicode":"U+201D"},
    "«" : {"ascii-equivalent": '"',"name":"left-pointing double angle quotation mark", "unicode":"U+00AB"},
    "»" : {"ascii-equivalent": '"',"name":"right-pointing double angle quotation mark", "unicode":"U+00BB"},
}


# 3) varianti delle varie lettere

Il codice della seguente cella genera una tabellina con le varie lettere e le corrispondenti varianti necessarie alla grafia dialettale.

In [16]:
from re import A
romagnolo_chars = []
variants = {}   # for each ascii-equivalent char there is a list of the accented variants
for k,v in cdict.items():
    romagnolo_chars.append(k)
    ascii_eq = v["ascii-equivalent"]
    #print(f'{k}:{ascii_eq}, {v}')
    if variants.get(ascii_eq) == None:
        variants[ascii_eq] = [k]
    else:
        variants[ascii_eq].append(k)

print('Elenco dei simboli necessari per la grafia del dialetto Romagnolo, associati ai caratteri base relativi')
print('Si conviene inoltre di non usare consonanti doppie')
print('Buoni risultati sin sono ottenuti con i font Doulos SIL e Charis SIL')
print('\n')
for k,v in variants.items():
    s = ''
    for c in v:
        s = f'{s} {c}'
    print(f'{k}: {s}')



Elenco dei simboli necessari per la grafia del dialetto Romagnolo, associati ai caratteri base relativi
Si conviene inoltre di non usare consonanti doppie
Buoni risultati sin sono ottenuti con i font Doulos SIL e Charis SIL


a:  à á â ä ā å ã
A:  À Á Â Ä Ā Å Ã
e:  è é ê ë ē ẽ æ Æ
E:  È É Ê Ë Ē Ẽ
i:  ì í î ï ī ĩ
I:  Ì Í Î Ï Ī Ĩ
o:  ò ó ô ö ō õ ŏ
O:  Ò Ó Ô Ö Ō Õ Ŏ
u:  ù ú û ü ū ũ
U:  Ù Ú Û Ü Ū Ũ
s:  ŝ š ş s̟ ṣ ś
S:  Ŝ Š Ş S̟ Ṣ Ś
z:  z̟ ẓ z̧ ź ž
Z:  Z̟ Ẓ Z̧ Ź Ž
c:  ċ ç
C:  Ċ Ç
g:  ġ
G:  Ġ
n:  ñ
N:  Ñ


# 4) Termini del generatore

Nella procedura seguente sono definite le liste con i vari sostantivi e componenti con cui le frasi potranno essere generate, dalle funzioni generative definite nelle celle successive.

```

Per ogni lista iniziante con "l_" esiste una corrispondente lista
iniziante con "t_" che deve avere identica restante parte del nome,
e identico numero di elementi, nello stesso ordine.

La lista "t_" contiene le traduzioni in italiano di ciascun termine
della corrispondente lista "l_"

```

In termini di lettere accentate e segni diacritici, limitarsi a quelli
definiti nelle celle precedenti.
Se ne occorrono dei nuovi, evidenziarli in modo che li possa includere nelle liste simboli da interpretare correttamente.




In [None]:
# Introdurre qui termini correttamente accentati secondo le norme del romagnolo Ravennate

l_male_names =    "Arigo, Minghì, Mingaz, Mingô, Gino, Rino, Amleto, Jusēf, Pino".split(", ")
l_male_names +=   "Gilberto, Adelmo, Italo, Medoro, Bruno, Tonino, Tony, Tugnaz".split(", ")
l_male_names +=   "Gigetto, Venanzio, Gigino, Piron, Pirì, Pirett, Stevan, Berto".split(", ")
t_male_names = l_male_names # traduzioni

l_female_names =  "Zaira, Mariuccia, Armanda, Beba, Linda, Livia, Anna, Rita".split(", ")
l_female_names += "Norma, Mafalda, Fedora, Tina, Wilma, Lina, Wanda, Rina, Gina".split(", ")
l_female_names += "Nina, Maria, Alberta, Deanna, Cutilda".split(", ")
t_female_names = l_female_names

l_female_animal_s = "galena, vaca, ciöza, lusérta, pígura, cuneja, cavala".split(", ")
l_female_animal_s += "besa, gata, purzëla, chêvra, burëla, lumêga, mula".split(", ")
l_female_animal_s += "lózla, mosca, furmiga, vëspa".split(", ")
t_female_animal_s = "gallina, vacca, chioccia, lucertola, pecora, coniglia, cavalla".split(", ")
t_female_animal_s += "biscia, gatta, porcella, capra, borella, lumaca, mula".split(", ")
t_female_animal_s += "lucciola, mosca, formica, vespa".split(", ")


l_male_animal_s = "sumar, gat, purzël, vidël, cân, pêss".split(", ")
l_male_animal_s += "cunêj, sôrgh, pôl, serpênt, môl".split(", ")
l_male_animal_s += "buratël, tachën, caval".split(", ")
t_male_animal_s = "somaro, gatto, porcello, vitello, cane, pesce".split(", ")
t_male_animal_s += "coniglio, topo, pollo, serpente, mulo".split(", ")
t_male_animal_s += "capitone, tacchino, cavallo".split(", ")

l_female_object_s = "zôla, tëra, pre, bôcia, têvla, scarâna".split(", ")
l_female_object_s += "cuciëra, padëla, furzëna, sêga".split(", ")
l_female_object_s += "māchina, fnëstra, pôrta, biciclêta, candêla".split(", ")
t_female_object_s = "cipolla, terra, pietra, bottiglia, tavola, sedia".split(", ")
t_female_object_s += "cucchiaia, padella, forchetta, sega".split(", ")
t_female_object_s += "automobile, finestra, porta, bicicletta, candela".split(", ")

l_male_object_s = "zòcar, bichìr, piät, curtël, mutôr".split(", ")
l_male_object_s += "purtòn, ëlbar, fiôm, bucion, lôm, martël".split(", ")
t_male_object_s = "zucchero, bicchiere, piatto, coltello, motore".split(", ")
t_male_object_s += "portone, albero, fiume, bottiglione, lume, martello".split(", ")


l_patronimic  =   "'d Badarëla, ad Pirètta, dal Pègn, de Sambêdgh, dal Calêr, di Calzinèl".split(", ")
l_patronimic +=   "dla Chêvga, dla Fêva, ad Macarò, ad Suprani, ad Papôn, ad Faldò".split(", ")
l_patronimic +=   "ad Parulèt, ad Giazùl, dla Calêra, di Brôsch, ad Manēra, di Pulêtt".split(", ")
l_patronimic +=   "dla Raspòna, dla Spagnëra, dla Ciòssa, ad Palóta, ad Frampùl".split(", ")
l_patronimic +=   "d'j Umôn".split(", ")
t_patronimic = l_patronimic

l_destination =   "Ravêna, Furlè, Ghibul, Gamblêra, San Pîr a Vincul, San Pîr in Trēnt".split(", ")
l_destination +=  "Gamblêra, Faênza, Lugh, Mzan, gl'Infunsên, Ponta-Marêna, Pört-Fûra".split(", ")
l_destination +=  "Lungastrên, Pianzpan, Vilanöva ad Bagnacavàl, Bagnacavàl, Cuclì".split(", ")
l_destination +=  "Arzênta, Cudgnola, Santêran, Jêmla, Cmàcch".split(", ")
t_destination =  "Ravenna, Forlì, Ghibullo, Gambellara, San Pietro in Vincoli, San Pietro in Trento".split(", ")
t_destination +=  "Gambellara, Faenza, Lugo, Mezzano, Alfonsine, Punta Marina, Porto Fuori".split(", ")
t_destination +=  "Longastrino, Piangipane, Villanova di Bagnacavallo, Bagnacavallo, Coccolia".split(", ")
t_destination +=  "Argenta, Cotignola, Santerno, Imola, Comacchio".split(", ")


l_food  =    "ad tajadêl, d'amnêstra, ad mafrigul, ad parsôt, ad fasul".split(", ")
l_food +=    "ad pancôt, ad zola, ad zuzêza, ad' cutghên, ad bel-e-cŏt".split(", ")
l_food +=    "ad furmintôn, ad macarô d'patêta, ad caplêt, ad furmäj, ad pän".split(", ")
l_food +=    "ad tardura, ad zamblôn, ad pasadêl, ad saraghêna".split(", ")
t_food  =    "di tagliatelle, di minestra, di mafrigoli, di prosciutto, di fagioli".split(", ")
t_food +=    "di pancotto, di cipolla, di salsiccia, di cotechino, di bell-e-cotto".split(", ")
t_food +=    "di granturco, di gnocchi di patata, di cappelletti, di formaggio, di pane".split(", ")
t_food +=    "di tardura, di ciambellone, di passatelli, di sarde".split(", ")

l_drink  =   "ad sanzvês, ad rabôs, d'Uva-döra, ad mez-vên, ad Bursôn, ad tarbiàn".split(", ")
l_drink +=   "d'ajbàna, d'ajbàna dôlza, d'ācva, ad canêna, ad famôs, ad pignulêt".split(", ")
l_drink +=   "d'acva ciôssa, ad cocacòla, ad grāpa, ad sāba, ad vêrmuth, d'alchêrmes".split(", ")
l_drink +=   "ad spìrit ad patêta, ad benzìna, ad nāfta".split(", ")
t_drink  =   "di sangiovese, di Raboso, di Uva D'Oro, di mezzo vino, di Burson, di Trebbiano".split(", ")
t_drink +=   "di Albana, di Albana dolce, d'acqua, di Cagnina, di Famos, di Pignoletto".split(", ")
t_drink +=   "di acqua sporca, di cocacola, di grappa, di saba, di vermouth, di alchêrmes".split(", ")
t_drink +=   "di spirito di patata, di benzina, di nafta".split(", ")

l_side_dish =  "e bröd, i fìg, al mugnëg, la piè frêta, al cödgh, la zôcca".split(", ")
l_side_dish += "dal mêl côti, dal per côti, i biscòtt, dal pêsgh, d'ërba".split(", ")
l_side_dish += "e lāt, al môri, i grasūl, la panzêta, l'insalè, la spagnêra".split(", ")
l_side_dish += "e ragú, la fòrma, e pêvar, l'áj, la pie', al patët, al carôt".split(", ")
l_side_dish += "e' furmāj d'pîgura, al pandöri, la zôla rôssa, al mlanzân, i pivirôn".split(", ")
l_side_dish += "una còssa ad pôl".split(", ")
t_side_dish =  "il brodo, i fichi, le albicocche, la pizza fritta, le cotiche, la zucca".split(", ")
t_side_dish += "delle mele cotte, delle pere cotte, i biscotti, delle pesche, di erba".split(", ")
t_side_dish += "il latte, le more, i ciccioli, la pancetta, l'insalata, la erba medica".split(", ")
t_side_dish += "il ragú, il parmigiano, il pepe, l'aglio, la piadina, le patate, le carote".split(", ")
t_side_dish += "il pecorino, i pomodori, la cipolla rossa, le melanzane, i peperoni".split(", ")
t_side_dish += "una coscia di pollo".split(", ")


l_food_container  = "un piät, una padëla, una cofa, un piatlon, un tigiam".split(", ")
l_food_container += "un gran piät, una teggia".split(", ")
t_food_container  = "un piatto, una padella, un secchio, un piattone, un tegame".split(", ")
t_food_container += "un gran piatto, una teglia".split(", ")

l_drink_container  = "una bôcia, un bichìr, un bichirôn, un biberôn, una mzêta".split(", ")
l_drink_container += "un buciôn, un calzêdar, una scudëla, una sêcia".split(", ")
t_drink_container  = "una bottiglia, un bichiere, un bicchierone, un biberôn, una caraffa".split(", ")
t_drink_container += "un bottiglione, un bidone, una scodella, un secchio".split(", ")

l_transport_mode  = "in mutôr, cun e carêt, a caväl de caväl, in biciclêta".split(", ")
l_transport_mode += "in mächina, cun la curìra, caminênd par la strè".split(", ")
t_transport_mode  = "in moto, cun il carretto, a cavallo, in bicicletta".split(", ")
t_transport_mode += "in macchina, con la corriera, camminando per la strada".split(", ")



# 5) Definizioni elementi sintattici

Può essere esteso aggiungendo nuovi elementi sintattici in termini di funzioni richiamabili poi dal codice di generazione, per aumentare la variabilità di generazione


In [None]:
# function definition follow

import random
RANDOM_SEED = float(0.726253)   # global seed for random selection

## important global variables
F = 'feminine'
M = 'masculine'
N = 'neuter'
L_FROM = 'location_from'
L_TO = 'location_to'

parts_of_speech = ['article','noun','adjective','con']

def noun(gender):
    # give a name with patronimic of the specific gender
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_male_name = random.choice(range(len(l_male_names)))
    i_female_name = random.choice(range(len(l_female_names)))
    i_patronimic = random.choice(range(len(l_patronimic)))

    if (gender == 'masculine') or (gender == 'neuter'):
        out_rgn = f'{l_male_names[i_male_name]} {l_patronimic[i_patronimic]}'
        out_ita = out_rgn
    else:
        out_rgn = f'{l_female_names[i_female_name]} {l_patronimic[i_patronimic]}'
        out_ita = out_rgn
    return [out_rgn, out_ita]


def animal(gender):
    # give an animal of the specific gender
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_male_animal = random.choice(range(len(l_male_animal_s)))
    i_female_animal = random.choice(range(len(l_female_animal_s)))
    if gender == 'masculine':
        out_rgn = f'{l_male_animal_s[i_male_animal]}'
        out_ita = f'{t_male_animal_s[i_male_animal]}'
    else:
        out_rgn = f'{l_female_animal_s[i_female_animal]}'
        out_ita = f'{t_female_animal_s[i_female_animal]}'
    return [out_rgn, out_ita]


def object(gender):
    # give a object name of the specific gender
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_male_object = random.choice(range(len(l_male_object_s)))
    i_female_object = random.choice(range(len(l_female_object_s)))
    if gender == 'masculine':
        out_rgn = f'{l_male_object_s[i_male_object]}'
        out_ita = f'{t_male_object_s[i_male_object]}'
    else:
        out_rgn = f'{l_female_object_s[i_female_object]}'
        out_ita = f'{t_female_object_s[i_female_object]}'
    return [out_rgn, out_ita]

## mgua: corrected up to here with multi language: to be completed

def place(direction):
    # give a place
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_destination = random.choice(range(len(l_destination)))

    if direction == 'location_from':
        out_rgn = f'da {l_destination[i_destination]}'
        out_ita = f'da {t_destination[i_destination]}'
    elif direction == 'location_to':
        out_rgn = f'a {l_destination[i_destination]}'
        out_ita = f'a {t_destination[i_destination]}'
    else:
        out_rgn = f'{l_destination[i_destination]}'
        out_ita = f'{t_destination[i_destination]}'
    return [out_rgn, out_ita]

def transport_mode():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_transport = random.choice(range(len(l_transport_mode)))
    out_rgn = f'{l_transport_mode[i_transport]}'
    out_ita = f'{t_transport_mode[i_transport]}'
    return [out_rgn, out_ita]

def food_container():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_food_container = random.choice(range(len(l_food_container)))
    out_rgn = f'{l_food_container[i_food_container]}'
    out_ita = f'{t_food_container[i_food_container]}'
    return [out_rgn, out_ita]

def food():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_food = random.choice(range(len(l_food)))
    out_rgn = f'{l_food[i_food]}'
    out_ita = f'{t_food[i_food]}'
    return [out_rgn, out_ita]

def side_dish():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_side_dish = random.choice(range(len(l_side_dish)))
    out_rgn = f'{l_side_dish[i_side_dish]}'
    out_ita = f'{t_side_dish[i_side_dish]}'
    return [out_rgn, out_ita]

def drink_container():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_drink_container = random.choice(range(len(l_drink_container)))
    out_rgn = f'{l_drink_container[i_drink_container]}'
    out_ita = f'{t_drink_container[i_drink_container]}'
    return [out_rgn, out_ita]

def drink():
    out_rgn, out_ita = ('ERROR_rgn', 'ERROR_ita')
    i_drink = random.choice(range(len(l_drink)))
    out_rgn = f'{l_drink[i_drink]}'
    out_ita = f'{t_drink[i_drink]}'
    return [out_rgn, out_ita]


def article(atype, gender, number):
    # type can be D or I: Determinate or Indeterminate
    # gender can be M,F,N (masculine, feminine or neutral)
    # number can be S or P: Singular or Plural
    article_rgn =   {
                'DMS': 'e',
                'DMP': 'i',
                'DFS': 'la',
                'DFP': 'al',
                'DNS': 'e',
                'DNP': 'i',
                'IMS': 'un',
                'IMP': 'di',
                'IFS': "'na",
                'IFP': "dal",
                'INS': 'un',
                'INP': 'di'
                }
    article_ita =   {
                'DMS': 'il',
                'DMP': 'i',
                'DFS': 'la',
                'DFP': 'le',
                'DNS': 'il',
                'DNP': 'i',
                'IMS': 'un',
                'IMP': 'dei',
                'IFS': "una",
                'IFP': "delle",
                'INS': 'un',
                'INP': 'dei'
                }
    selector = f'{atype}{gender}{number}'.upper()
    # print(f'{selector=}')
    if selector in article_rgn.keys():
        return [article_rgn[selector], article_ita[selector]]
    else:
        return '##ERROR in article request specs##'



In [None]:
# test per la generazione articoli
# print(article('I','n','P')) # inndeterminativo, neutro, plurale
# print(article('D','m','s')) # determinativo, maschile, singolare

# 6) Codice di generazione

Questo codice costruisce frasi impiegando le funzioni precedentemente definite e aggiunge quanto generato a due liste con le frasi corrispondentemente in romagnolo e italiano.

E' importante che le due liste abbiano elementi corrispondenti, per mettere in corrispondenza le frasi nelle due lingue.

E' possibile aggiungere celle per la generazione di ulteriori frasi. Importante a inizio di ogni nuova cella aggiungere qualche commento con autore e intento.


In [None]:
# generazione frasi in dialetto romagnolo e italiano
# Marco Guardigli, mgua@tomware.it
# giugno 2024 - luglio 2025
#

sentences_rgn = []
sentences_ita = []

noun_m_rgn, noun_m_ita = noun(M)
noun_f_rgn, noun_f_ita = noun(F)
transport_mode_rgn, transport_mode_ita = transport_mode()
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f'{noun_m_rgn} e la {noun_f_rgn} i fasè un viàz {transport_mode_rgn} infen {place_rgn}.')
sentences_ita.append(f'{noun_m_ita} e la {noun_f_ita} fecero un viaggio {transport_mode_ita} fino a {place_ita}.')

noun_m0_rgn, noun_m0_ita = noun(M)
noun_m1_rgn, noun_m1_ita = noun(M)
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f'{noun_m0_rgn} e {noun_m1_rgn} i andè {place_rgn}')
sentences_ita.append(f'{noun_m0_ita} e {noun_m1_ita} andarono {place_ita}')

noun_f0_rgn, noun_f0_ita = noun(F)
noun_f1_rgn, noun_f1_ita = noun(F)
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f'{noun_f0_rgn} e {noun_f1_rgn} agli è andêdi insên {place_rgn}')
sentences_ita.append(f'{noun_f0_ita} e {noun_f1_ita} sono andate assieme {place_ita}')

noun_m0_rgn, noun_m0_ita = noun(M)
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f'{noun_m0_rgn} e andè {place_rgn}')
sentences_ita.append(f'{noun_m0_ita} andò {place_ita}')

noun_f_rgn, noun_f_ita = noun(F)
art_rgn, art_ita = article('D','F','S')
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f"{art_rgn} {noun_f_rgn} l' andè {place_rgn}.")
sentences_ita.append(f'{art_ita} {noun_f_ita} andò {place_ita}.')


noun_m_rgn, noun_m_ita = noun(M)
art_rgn, art_ita = article('I','F','S')
animal_f_rgn, animal_f_ita = animal(F)
sentences_rgn.append(f'{noun_m_rgn} l\' ha truvè {art_rgn} {animal_f_rgn}')
sentences_ita.append(f'{noun_m_ita} ha trovato {art_ita} {animal_f_ita}')

noun_m_rgn, noun_m_ita = noun(M)
art_rgn, art_ita = article('I','F','S')
animal_f_rgn, animal_f_ita = animal(F)
sentences_rgn.append(f'{noun_m_rgn} l\' ha amazè {art_rgn} {animal_f_rgn}')
sentences_ita.append(f'{noun_m_ita} ha ammazzato {art_ita} {animal_f_ita}')

noun_m_rgn, noun_m_ita = noun(M)
art_rgn, art_ita = article('I','M','S')
animal_m_rgn, animal_m_ita = animal(M)
sentences_rgn.append(f'{noun_m_rgn} l\' ha truvè {art_rgn} {animal_m_rgn}')
sentences_ita.append(f'{noun_m_ita} ha trovato {art_ita} {animal_m_ita}')

noun_m_rgn, noun_m_ita = noun(M)
art_rgn, art_ita = article('I','M','S')
animal_m_rgn, animal_m_ita = animal(M)
sentences_rgn.append(f'{noun_m_rgn} l\' ha amazè {art_rgn} {animal_m_rgn}')
sentences_ita.append(f'{noun_m_ita} ha ammazzato {art_ita} {animal_m_ita}')


#---
noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
art_02_rgn, art_02_ita = article('I','F','S')
animal_f_rgn, animal_f_ita = animal(F)
sentences_rgn.append(f'{art_01_rgn} {noun_f_rgn} l\' ha truvè {art_02_rgn} {animal_f_rgn}')
sentences_ita.append(f'{art_01_ita} {noun_f_ita} ha trovato {art_02_ita} {animal_f_ita}')

noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
art_02_rgn, art_02_ita = article('I','F','S')
animal_f_rgn, animal_f_ita = animal(F)
sentences_rgn.append(f'{art_01_rgn} {noun_f_rgn} l\' ha amazè {art_02_rgn} {animal_f_rgn}')
sentences_ita.append(f'{art_01_ita} {noun_f_ita} ha ammazzato {art_02_ita} {animal_f_ita}')

noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
art_02_rgn, art_02_ita = article('I','M','S')
animal_m_rgn, animal_m_ita = animal(M)
sentences_rgn.append(f'{noun_f_rgn} l\' ha truvè {art_rgn} {animal_m_rgn}')
sentences_ita.append(f'{noun_f_ita} ha trovato {art_ita} {animal_m_ita}')

noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
art_02_rgn, art_02_ita = article('I','M','S')
animal_m_rgn, animal_m_ita = animal(M)
sentences_rgn.append(f'{noun_m_rgn} l\' ha amazè {art_rgn} {animal_m_rgn}')
sentences_ita.append(f'{noun_m_ita} ha ammazzato {art_ita} {animal_m_ita}')


# sentences.append(f'{noun(M)} us magnè {food_container()} {food()} cun {side_dish()} e cun {drink_container()} {drink()}.')
noun_m_rgn, noun_m_ita = noun(M)
food_container_rgn, food_container_ita = food_container()
food_rgn, food_ita = food()
side_dish_rgn, side_dish_ita = side_dish()
drink_container_rgn, drink_container_ita = drink_container()
drink_rgn, drink_ita = drink()
sentences_rgn.append(f'{noun_m_rgn} us magnè {food_container_rgn} {food_rgn} cun {side_dish_rgn} e cun {drink_container_rgn} {drink_rgn}.')
sentences_ita.append(f'{noun_m_ita} si mangiò {food_container_ita} {food_ita} con {side_dish_ita} e con {drink_container_ita} {drink_ita}.')

# sentences.append(f'La {noun(F)} la magnêva {food_container()} {food()} cun {side_dish()} e cun {drink_container()} {drink()}.')
art_01_rgn, art_01_ita = article('D','F','S')
noun_f_rgn, noun_f_ita = noun(F)
food_container_rgn, food_container_ita = food_container()
food_rgn, food_ita = food()
side_dish_rgn, side_dish_ita = side_dish()
drink_container_rgn, drink_container_ita = drink_container()
drink_rgn, drink_ita = drink()
sentences_rgn.append(f'{art_01_rgn} {noun_f_rgn} la magnêva {food_container_rgn} {food_rgn} cun {side_dish_rgn} e cun {drink_container_rgn} {drink_rgn}.')
sentences_ita.append(f'{art_01_ita} {noun_f_ita} mangiava {food_container_ita} {food_ita} con {side_dish_ita} e con {drink_container_ita} {drink_ita}.')


# sentences.append(f'A jo vêst la {noun(F)} cla bravêva cun la {noun(F)}.')
noun_f01_rgn, noun_f01_ita = noun(F)
noun_f02_rgn, noun_f02_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
art_02_rgn, art_02_ita = article('D','F','S')
animal_m_rgn, animal_m_ita = animal(M)
sentences_rgn.append(f'A jo vêst {art_01_rgn} {noun_f01_rgn} cla bravêva cun {art_02_rgn} {noun_f02_rgn}')
sentences_ita.append(f'Ho visto {art_01_rgn} {noun_f01_rgn} litigare con {art_02_rgn} {noun_f02_rgn}')


# sentences.append(f"Cl'êtar dè a so andè {place(L_TO)}.")
place_rgn, place_ita = place(L_TO)
sentences_rgn.append(f"Cl'êtar dè a so andè {place_rgn}.")
sentences_ita.append(f"L'altro giorno sono andato {place_ita}.")


# sentences.append(f'{noun(M)} us è maridè cun la {noun(F)}.')
noun_m_rgn, noun_m_ita = noun(M)
noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'{noun_m_rgn} us è maridè cun {art_01_rgn} {noun_f_rgn}.')
sentences_ita.append(f'{noun_m_ita} si è sposato con {art_01_ita} {noun_f_ita}.')

# sentences.append(f'la {noun(F)} la s'è maridèda cun {noun(M)}.')
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'{art_01_rgn} {noun_f_rgn} la s\'è maridèda cun {noun_m_rgn}.')
sentences_ita.append(f'{art_01_ita} {noun_f_ita} si è sposata con {noun_m_ita}.')


In [None]:
# mgua@tomware.it
# altre strutture di frasi
#

# sentences.append(f"Aj ho savù che la fiöla ad la {noun(F)} la s'è avjêda ad cà.")
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'Aj ho savù che la fiöla ad {art_01_rgn} {noun_f_rgn} la s\'è avjêda ad cà.')
sentences_ita.append(f'Ho saputo che la figlia della {noun_f_ita} è andata via di casa.')

# sentences.append(f"Aj ho savù che la fiöla ad la {noun(F)} la s'è avjêda ad cà.")
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'Aj ho savù che la fiöla ad {noun_m_rgn} e dla {noun_f_rgn} la s\'è avjêda ad cà.')
sentences_ita.append(f'Ho saputo che la figlia di {noun_m_ita} e della {noun_f_ita} è andata via di casa.')


# sentences.append(f"Cvalcadôn um ha dêt che la {noun(F)} la fila drì a {noun(M)}.")
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'Cvalcadôn um ha dêt che {art_01_rgn} {noun_f_rgn} la fila drì a {noun_m_rgn}.')
sentences_ita.append(f'Qualcuno mi ha detto che {art_01_ita} {noun_f_ita} è innamorata di {noun_m_ita}.')

# sentences.append(f"Me a so {noun(M)} e um piês la {noun(F)}.")
noun_m_rgn, noun_m_ita = noun(M)
noun_f_rgn, noun_f_ita = noun(F)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'Me a so {noun_m_rgn} e um piês {art_01_rgn} {noun_f_rgn}.')
sentences_ita.append(f'Io sono {noun_m_rgn} e mi piace {art_01_ita} {noun_f_ita}.')

# sentences.append(f"Me a so la {noun(F)} e um piês {noun(M)}.")
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
sentences_rgn.append(f'Me a so {art_01_rgn} {noun_f_rgn} e um piês {noun_m_rgn}.')
sentences_ita.append(f'Io sono {art_01_ita} {noun_f_ita} e mi piace {noun_m_ita}.')

# sentences.append(f"La {noun(F)} l'ha m'ha dè da magnè {food_container()} {food()} cun {side_dish()} mo an sò stè bôn ad magnè parchè un um piës.")
noun_f_rgn, noun_f_ita = noun(F)
noun_m_rgn, noun_m_ita = noun(M)
art_01_rgn, art_01_ita = article('D','F','S')
food_container_rgn, food_container_ita = food_container()
food_rgn, food_ita = food()
side_dish_rgn, side_dish_ita = side_dish()
sentences_rgn.append(f'{art_01_rgn} {noun_f_rgn} l\'ha m\'ha dè da magnè {food_container_rgn} {food_rgn} cun {side_dish_rgn} mo an sò stè bôn ad magnè parchè un um piës.')
sentences_ita.append(f'{art_01_ita} {noun_f_ita} mi ha dato da mangiare {food_container_ita} {food_ita} conn {side_dish_ita} ma non sono stato capace di mangiare perchè non mi piace.')

# sentences.append(f"Aj ho fam. Purtìm {food_container()} {food()} cun {side_dish()} par piasè.")
food_container_rgn, food_container_ita = food_container()
food_rgn, food_ita = food()
side_dish_rgn, side_dish_ita = side_dish()
sentences_rgn.append(f'Aj ho fam. Purtìm {food_container_rgn} {food_rgn} cun {side_dish_rgn} par piasè.')
sentences_ita.append(f'Ho fame. Portatemi {food_container_ita} {food_ita} con {side_dish_ita} per favore.')

# sentences.append(f"Aj ho sêt. Dám {drink_container()} {drink()}!")
drink_container_rgn, drink_container_ita = drink_container()
drink_rgn, drink_ita = drink()
sentences_rgn.append(f'Aj ho sêt. Dám {drink_container_rgn} {drink_rgn}!')
sentences_ita.append(f'Ho sete. Dammi {drink_container_ita} {drink_ita}!')

# sentences.append(f"Dám sòbit {drink_container()} {drink()} che aj ho la lêngva ad cartôn!")
drink_container_rgn, drink_container_ita = drink_container()
drink_rgn, drink_ita = drink()
sentences_rgn.append(f'Dám sòbit {drink_container_rgn} {drink_rgn} che aj ho la lêngva ad cartôn!')
sentences_ita.append(f'Dammi subito {drink_container_ita} {drink_ita} che ho la lingua di cartone!')

# sentences.append(f"Aj ho vòja {food()} cun {side_dish()}.")
food_rgn, food_ita = food()
side_dish_rgn, side_dish_ita = side_dish()
sentences_rgn.append(f'Aj ho vòja {food_rgn} cun {side_dish_rgn}.')
sentences_ita.append(f'Ho voglia di {food_ita} con {side_dish_ita}.')





# 7) Visualizzazione delle frasi generate

Nella seguente cella il codice scrive frasi casuali in romagnolo con la corrispondente traduzione in italiano (ogni riga contiene frase e traduzione, separate della stringa "<-->").

Le frasi, generate in liste popolate nelle precedenti celle, sono presentate in ordine casuale.

Per produrre nuove frasi premere CTRL-INVIO in corrispondenza della cella di codice.


In [None]:
# Presentazione casuale delle frasi generate (mgua@tomware.it)
for ix in random.sample(range(len(sentences_rgn)), len(sentences_rgn)):
    print(f'{sentences_rgn[ix]} <--> {sentences_ita[ix]}')

la Norma ad Manēra l'ha m'ha dè da magnè un piatlon ad tardura cun la fòrma mo an sò stè bôn ad magnè parchè un um piës. <--> la Norma ad Manēra mi ha dato da mangiare un piattone di tardura conn il parmigiano ma non sono stato capace di mangiare perchè non mi piace.
A jo vêst la Beba ad Papôn cla bravêva cun la Lina 'd Badarëla <--> Ho visto la Beba ad Papôn litigare con la Lina 'd Badarëla
Pirì 'd Badarëla l' ha amazè un sumār <--> Pirì 'd Badarëla ha ammazzato un somaro
Cl'êtar dè a so andè a Bagnacavàl. <--> L'altro giorno sono andato a Bagnacavallo.
Cvalcadôn um ha dêt che la Maria ad Faldò la fila drì a Tugnaz di Calzinèl. <--> Qualcuno mi ha detto che la Maria ad Faldò è innamorata di Tugnaz di Calzinèl.
la Armanda ad Palóta la s'è maridèda cun Piron ad Palóta. <--> la Armanda ad Palóta si è sposata con Piron ad Palóta.
la Beba ad Manēra l' ha truvè 'na burëla <--> la Beba ad Manēra ha trovato una borella
Aj ho savù che la fiöla ad la Wanda dla Raspòna la s'è avjêda ad cà. <--> 