diff --git a/README.md b/README.md new file mode 100644 index 0000000..b91b60d --- /dev/null +++ b/README.md @@ -0,0 +1,120 @@ +# AIron - ChatBot with AI +#### Current version: Preview 1 + +## About +- AIron is a chatbot developed in Python, using libraries such as TensorFlow and Keras for the creation and training of language models. +- The chatbot is capable of answering questions and providing information based on pre-trained models and specific data. +It is designed to support natural language interactions in Portuguese, allowing users to ask questions and receive relevant responses. +- The chatbot utilizes natural language processing techniques and machine learning models to understand and generate appropriate answers. + +## Conversation +``` +Usuário: Explica o que foi a guerra fria. +ChatBot: Período de tensões políticas e militares entre os Estados Unidos e a União Soviética que durou aproximadamente de 1947 a 1991 sem confronto direto + +Usuário: Explicita-me em que consiste a física de particulas. +ChatBot: A física de partículas estuda as partículas elementares e as interações fundamentais buscando compreender a estrutura básica do universo +``` + +## Features - Preview 1 +- [x] Various areas of knowledge + - History + - Portuguese History + - Capitals + - Population of Countries +- [x] Interactions + + +## Updates and More + +### Preview 1 +- Language: Portuguese +- Basic Models and Data +### More Updates +- More Languages +- Grafical User Interface (GUI) Support +- Better models and data expansion +- Support a pre-trained models - Transformers or BERT +- Docker Support +- Files (.py) to support model training +- Update system + +## How To Install and Use +### System Requeriments +> In my tests i'm using: +``` +> Processador: Intel Core i3-5005U 2.00GHZ +> GPU: Integrated into the processor +> OS: Windows 10 Pro +> RAM: 8GB +> Disk Space: 2GB + +- During Initiation: + - 370mb RAM + - 0-15% CPU +- During Use: + - 370mb RAM + - 0-10% (generate answers) +``` + +``` +> Processador: Intel Core i3-5005U 2.00GHZ +> GPU: Integrated into the processor +> OS: Linux based on Debian +> RAM: 8GB +> Disk Space: 2GB + +- During Initiation: can reach 450mb RAM +- During Use: 350mb RAM +``` + +### Installacion + +#### Windows (Cmd/Click) +``` +>>> start install.bat +OR +Double click in install.bat +``` +#### Linux (Terminal) +``` +>>> chmod +x install.sh +>>> ./install.sh +``` +#### Mac OS +``` +I don't use Mac OS, nor have I tested it, but it probably runs. +``` + +#### Problems while installation +- An error occurred about the nltk library: +``` +ERROR: +During handling of the above exception, another exception occurred: +... +Resource ←[93mstopwords←[0m not found. + Please use the NLTK Downloader to obtain the resource: + + ←[31m>>> import nltk + >>> nltk.download('stopwords') + ←[0m + For more information see: https://www.nltk.org/data.html + + Attempted to load ←[93mcorpora/stopwords←[0m + + Searched in: + ... +``` +- Visit: https://www.nltk.org/nltk_data/ and search 74, "Stopwords Corpus" and download. +- Put "stopwords.zip" in the "corpus" folder in "nltk_data". +- Folder: Directory to put the files in "Searched in". + + +##### Other problems, contact me for a issue. + +## License +- MIT License +- Consult here: https://github.com/gfs0508/AIron/blob/main/LICENSE + +## Contributions +- Send a pull request or issue to talk diff --git a/data/about-1a.json b/data/about-1a.json new file mode 100644 index 0000000..a805cc0 --- /dev/null +++ b/data/about-1a.json @@ -0,0 +1,23 @@ +{ + "qual teu nome": "O meu nome é AIron.", + "quantos anos tens": "Eu, como um programa de computador, não tenho uma idade defenida.", + "qual tua idade": "Eu, como um programa de computador, não tenho uma idade defenida.", + "ola": "Olá, tudo bem?", + "tudo bem contigo":"Eu estou bem", + "bom dia":"Bom dia, tudo bem?", + "boa tarde": "Boa tarde", + "boa noite": "Boa noite", + "como vais":"Eu geralmente estou sempre bem.", + "que horas sao":"Neste momento são, ", + "diz horas": "Ok são,", + "animal estimacao": "Não, mas gostava de ter um.", + "gostas musica":"Eu ainda não tenho a capacidade de gostar ou não gostar", + "podes contar piada": "Claro! Por que o cachorro atravessou a rua? Para chegar ao outro lado!", + "sabes cozinhar": "Como um assistente virtual, eu não tenho habilidades culinárias, mas posso te ajudar a encontrar receitas!", + "qual previsao tempo amanha": "Isso pode depender da sua localização, mas eu posso verificar a previsão do tempo para você se você me fornecer sua cidade ou CEP.", + "podes ensinar lingua estrangeira": "Eu posso fornecer informações e recursos sobre diferentes idiomas, mas não posso ensinar diretamente.", + "pode ajudar dever casa": "Com certeza, qual é a sua dúvida ou tarefa específica?", + "es uma inteligencia artificial": "Sim, eu sou uma inteligência artificial baseada em linguagem natural, treinada para responder perguntas e ajudar com várias tarefas." +} + + diff --git a/data/capitals-1a.json b/data/capitals-1a.json new file mode 100644 index 0000000..27b0f2f --- /dev/null +++ b/data/capitals-1a.json @@ -0,0 +1,90 @@ +{ + "capital portugal": "Lisboa", + "capital brasil": "Brasilia", + "capital franca": "Paris", + "capital espanha": "Madrid", + "capital alemanha": "Berlim", + "capital italia": "Roma", + "capital inglaterra": "Londres", + "capital estados unidos": "Washington, D.C.", + "capital russia": "Moscou", + "capital japao": "Toquio", + "capital china": "Pequim", + "capital canada": "Ottawa", + "capital australia": "Canberra", + "capital mexico": "Cidade do Mexico", + "capital argentina": "Buenos Aires", + "capital africa do sul": "Cidade do Cabo", + "capital india": "Nova Deli", + "capital coreia do sul": "Seul", + "capital aravia saudita": "Riade", + "capital egito": "Cairo", + "capital tailandia": "Bangkok", + "capital suecia": "Estocolmo", + "capital noruega": "Oslo", + "capital dinamarca": "Copenhaga", + "capital finlandia": "Helsinquia", + "capital holanda": "Amsterdã", + "capital belgica": "Bruxelas", + "capital luxemburgo": "Luxemburgo", + "capital polonia": "Varsóvia", + "capital republica checa": "Praga", + "capital hungria": "Budapeste", + "capital eslovaquia": "Bratislava", + "capital eslovenia": "Liubliana", + "capital croacia": "Zagreb", + "capital bosnia e herzegovina": "Sarajevo", + "capital servia": "Belgrado", + "capital montenegro": "Podgorica", + "capital albania": "Tirana", + "capital macedonia do norte": "Skopje", + "capital grecia": "Atenas", + "capital bulgaria": "Sofia", + "capital romenia": "Bucareste", + "capital moldavia": "Quixinau", + "capital ucrania": "Quieve", + "capital bielorrussia": "Minsk", + "capital lituania": "Vilnius", + "capital letonia": "Riga", + "capital estonia": "Talim", + "capital rusia": "Moscou", + "capital turquia": "Ancara", + "capital georgia": "Tbilisi", + "capital armenia": "Erevã", + "capital azerbaijao": "Bacu", + "capital cazaquistao": "Nursultan", + "capital turquemenistao": "Asgabate", + "capital uzbequistao": "Tasquente", + "capital quirguistao": "Bisqueque", + "capital tadjiquistao": "Duchambé", + "capital afeganistao": "Cabul", + "capital paquistao": "Islamabade", + "capital nepal": "Catmandu", + "capital butao": "Timbu", + "capital bangladesh": "Daca", + "capital sri lanka": "Colombo", + "capital maldivas": "Malé", + "capital mongolia": "Ulã Bator", + "capital coreia do norte": "Pyongyang", + "capital filipinas": "Manila", + "capital indonesia": "Jacarta", + "capital malasia": "Kuala Lumpur", + "capital singapura": "Cingapura", + "capital brunei": "Bandar Seri Begawan", + "capital vietna": "Hanói", + "capital laos": "Viena", + "capital camboja": "Phnom Penh", + "capital myanmar": "Naypyidaw", + "capital nova zelandia": "Wellington", + "capital papua nova guine": "Port Moresby", + "capital fiji": "Suva", + "capital ilhas salomao": "Honiara", + "capital vanuatu": "Port Vila", + "capital micronesia": "Paliquir", + "capital ilhas marshall": "Majuro", + "capital kiribati": "Taraua", + "capital samoa": "Apia", + "capital tonga": "Nucualofa", + "capital tuvalu": "Funafuti", + "capital nauru": "Iarém" +} \ No newline at end of file diff --git a/data/history-1a.json b/data/history-1a.json new file mode 100644 index 0000000..6d750bc --- /dev/null +++ b/data/history-1a.json @@ -0,0 +1,8 @@ +{"antigo egito": "Civilização antiga localizada no vale do rio Nilo, conhecida por suas pirâmides, faraós e escrita hieroglífica.", +"imperio romano": "Um dos maiores impérios da antiguidade, conhecido por seu governo centralizado, sistema legal e conquistas territoriais.", +"idade media": "Período histórico entre a antiguidade clássica e a era moderna, caracterizado pela feudalismo, cavalaria e influência da Igreja Católica.", +"renascimento": "Movimento cultural e intelectual que floresceu na Europa entre os séculos XIV e XVI, marcado por um renascimento do interesse pelas artes, ciências e humanidades.", +"revolucao cientifica": "Um período de avanços significativos na ciência, ocorrido principalmente entre os séculos XVI e XVII, com nomes como Copérnico, Galileu e Newton.", +"revolucao industrial": "Um período de transformação socioeconômica na Europa e nos Estados Unidos, no século XVIII e XIX, com a transição para a produção industrial em larga escala.", +"revolucao francesa": "Movimento político e social que ocorreu na França entre 1789 e 1799, marcado pela queda da monarquia e ascensão do poder popular.", +"guerra independencia estados unidos": "Conflito armado que ocorreu entre 1775 e 1783, resultando na independência das treze colônias americanas em relação à Grã-Bretanha.", "revolucao russa": "Uma série de eventos revolucionários em 1917, que levaram à queda do governo czarista e à ascensão do regime comunista liderado por Lênin.", "primeira guerra mundial": "Conflito global ocorrido entre 1914 e 1918, envolvendo muitas das principais potências mundiais e resultando em grandes mudanças políticas e territoriais.", "segunda guerra mundial": "Conflito global ocorrido entre 1939 e 1945, envolvendo as principais potências mundiais, marcado por atrocidades em massa e pela utilização de armas nucleares.", "guerra fria": "Período de tensões políticas e militares entre os Estados Unidos e a União Soviética, que durou aproximadamente de 1947 a 1991, sem confronto direto.", "descolonizacao": "Processo em que muitas colônias ao redor do mundo obtiveram independência em relação às potências coloniais, principalmente nas décadas de 1950 e 1960.", "apartheid": "Sistema de segregação racial institucionalizado na África do Sul entre 1948 e 1994, que promovia a discriminação e a opressão dos não-brancos.", "guerra vietna": "Conflito ocorrido entre 1955 e 1975, envolvendo o Vietnã do Norte e o Vietnã do Sul, bem como os Estados Unidos e outros aliados.", "movimento pelos direitos civis": "Luta pelos direitos civis e igualdade racial nos Estados Unidos, liderada por figuras como Martin Luther King Jr. nas décadas de 1950 e 1960.", "crise dos misseis cuba": "Confronto entre os Estados Unidos e a União Soviética em 1962, devido à instalação de mísseis nucleares soviéticos em Cuba.", "movimento dos direitos civis no apartheid": "Luta contra o sistema de apartheid na África do Sul, liderada por Nelson Mandela e outros ativistas nas décadas de 1950 a 1990.", "queda muro berlim": "Evento simbólico que ocorreu em 1989, marcando o fim da divisão entre Alemanha Oriental e Alemanha Ocidental e o colapso do bloco soviético.", "revolucao cultural chinesa": "Movimento político e social ocorrido na China entre 1966 e 1976, liderado por Mao Tsé-Tung, que resultou em grandes tumultos e perseguições.", "movimento dos direitos civis nos estados unidos": "Campanha para acabar com a segregação racial e garantir direitos iguais para todos os cidadãos dos Estados Unidos, nas décadas de 1950 e 1960.", "golpe estado no chile": "Derrubada do governo democraticamente eleito de Salvador Allende em 1973, pelo general Augusto Pinochet, resultando em uma ditadura militar.", "revolucao industrial inglaterra": "Transformação econômica e social ocorrida na Inglaterra no século XVIII, marcada pela transição para a produção industrial em larga escala.", "declaracao universal dos direitos humanos": "Documento adotado pela Assembleia Geral das Nações Unidas em 1948, estabelecendo os direitos humanos básicos a serem protegidos em todo o mundo.", "cortina ferro": "Metáfora utilizada por Winston Churchill para descrever a divisão política e ideológica entre o bloco ocidental liderado pelos EUA e o bloco oriental liderado pela União Soviética durante a Guerra Fria.", "revolucao cultural no ira": "Movimento político e social ocorrido no Irã em 1979, que resultou na derrubada do xá e no estabelecimento de um regime islâmico liderado pelo aiatolá Khomeini.", "massacre nanquim": "Massacre e abusos cometidos pelo exército imperial japonês contra civis e prisioneiros de guerra na cidade chinesa de Nanquim, em 1937 e 1938.", "revolucao cubana": "Movimento liderado por Fidel Castro que resultou na derrubada do ditador Fulgencio Batista em 1959 e no estabelecimento de um governo socialista em Cuba.", "revolucao mexicana": "Conflito armado ocorrido no México entre 1910 e 1920, marcado pela luta por justiça social, reforma agrária e democracia.", "independencia india": "Processo liderado por Mahatma Gandhi que resultou na independência da Índia do domínio britânico em 1947.", "crise dos misseis 1962": "Confronto entre os Estados Unidos e a União Soviética devido à instalação de mísseis nucleares soviéticos em Cuba, levando o mundo à beira de uma guerra nuclear.", "marcha sobre washington por trabalho liberdade": "Proeminente manifestação realizada em 1963, onde Martin Luther King Jr. fez seu famoso discurso 'Eu Tenho um Sonho'.", "movimento pelos direitos civis no canada": "Luta por igualdade de direitos e combate à discriminação racial no Canadá, influenciado pelo movimento dos direitos civis nos Estados Unidos.", "revolucao industrial nos estados unidos": "Período de rápida industrialização nos Estados Unidos, no século XIX, impulsionado pela inovação tecnológica, urbanização e expansão econômica.", "guerra secessao": "Conflito ocorrido nos Estados Unidos entre 1861 e 1865, resultando na abolição da escravidão e na preservação da União.", "revolucao iraniana": "Movimento político e social ocorrido no Irã em 1979, que resultou na queda do xá e no estabelecimento de um governo islâmico liderado pelo aiatolá Khomeini.", "apartheid africa sul": "Sistema de segregação racial institucionalizado na África do Sul entre 1948 e 1994, promovendo a discriminação e a opressão dos não-brancos.", "chegada homem a lua": "A missão Apollo 11, em julho de 1969, quando Neil Armstrong se tornou o primeiro homem a caminhar na Lua.", "invencao lampada eletrica": "A invenção da lâmpada elétrica por Thomas Edison em 1879, que revolucionou a iluminação artificial.", "independencia dos estados unidos": "Declarada em 1776, quando as Treze Colônias americanas proclamaram sua separação da Grã-Bretanha, levando à formação dos Estados Unidos da América.", "nascimento expansao islamismo": "A religião islâmica foi fundada por Maomé no século VII e se espalhou rapidamente pela Península Arábica e outras partes do mundo.", "revolucao industrial alemanha": "Período de industrialização acelerada na Alemanha no século XIX, impulsionado pela inovação tecnológica e desenvolvimento de indústrias.", "revolucao meiji no japao": "Transformação política e social ocorrida no Japão no final do século XIX, resultando em uma modernização acelerada e ocidentalização do país.", "revolucao industrial franca": "Período de industrialização na França no século XIX, marcado pelo desenvolvimento de indústrias têxteis, siderúrgicas e de transportes.", "tratado versalhes": "Acordo de paz assinado em 1919, após a Primeira Guerra Mundial, estabelecendo as condições para a paz e impondo duras penalidades à Alemanha."} \ No newline at end of file diff --git a/data/history_pt-1a.json b/data/history_pt-1a.json new file mode 100644 index 0000000..c5609c0 --- /dev/null +++ b/data/history_pt-1a.json @@ -0,0 +1,57 @@ +{ + "rei d afonso henriques": "D. Afonso Henriques foi o primeiro rei de Portugal, governando de 1139 a 1185.", + "rainha d leonor teles": "D. Leonor Teles foi rainha de Portugal por casamento com o rei D. Fernando I. Ela exerceu influência política durante o seu reinado.", + "presidente ramalho eanes": "António Ramalho Eanes foi um militar e político português que serviu como presidente da República de 1976 a 1986.", + "explorador bartolomeu dias": "Bartolomeu Dias foi um explorador português que se destacou por ser o primeiro a contornar o Cabo da Boa Esperança, na África.", + "poeta camoes": "Luís de Camões foi um renomado poeta português, autor de Os Lusíadas, uma das maiores obras da literatura em língua portuguesa.", + "presidente jorge sampaio": "Jorge Sampaio foi um político português que exerceu o cargo de presidente da República de 1996 a 2006.", + "escritor eca de queiroz": "Eça de Queiroz foi um dos mais importantes escritores portugueses, autor de obras como Os Maias e O Crime do Padre Amaro.", + "explorador gaspar corte real": "Gaspar Corte-Real foi um navegador português que explorou a costa atlântica da América do Norte no século XVI.", + "escritor fernao lopes": "Fernão Lopes foi um cronista português do século XV, considerado o primeiro grande historiador de Portugal.", + "presidente marcelo rebelo de sousa": "Marcelo Rebelo de Sousa é um político português e atual presidente da República desde 2016.", + "poeta bocage": "Bocage, cujo nome completo era Manuel Maria Barbosa du Bocage, foi um poeta português conhecido por sua obra lírica e satírica.", + "navegador diogo cao": "Diogo Cão foi um navegador português que explorou a costa africana no século XV.", + "escritor camilo castelo branco": "Camilo Castelo Branco foi um importante escritor português do século XIX, autor de obras como Amor de Perdição.", + "navegador pedro nunes": "Pedro Nunes foi um matemático e cosmógrafo português que fez contribuições significativas para a navegação durante a Era dos Descobrimentos.", + "explorador vasco da gama": "Vasco da Gama foi um famoso navegador português que estabeleceu a rota marítima para a Índia em 1498.", + "escritor almeida garrett": "Almeida Garrett foi um escritor e político português, considerado um dos fundadores do romantismo em Portugal.", + "presidente antonio ramalho eanes": "António Ramalho Eanes foi um militar e político português que serviu como presidente da República de 1976 a 1986.", + "rainha d leonor aragao": "D. Leonor de Aragão foi rainha de Portugal por casamento com o rei D. Duarte I, e é conhecida por seu mecenato artístico e cultural.", + "navegador fernao magalhaes": "Fernão de Magalhães, também conhecido como Fernão de Magalhães, foi um explorador português que liderou a primeira viagem de circum-navegação ao redor do mundo.", + "presidente antonio oliveira salazar": "António de Oliveira Salazar foi um político português que ocupou o cargo de presidente do Conselho de Ministros de Portugal de 1932 a 1968. Ele liderou o Estado Novo, um regime autoritário.", + "escritor sophia mello breyner": "Sophia de Mello Breyner Andresen foi uma das mais importantes poetisas portuguesas do século XX, conhecida por sua poesia lírica e compromisso cívico.", + "explorador gil eanes": "Gil Eanes foi um navegador português que ultrapassou o Cabo Bojador, no oeste da África, abrindo caminho para as explorações marítimas portuguesas.", + "rei d joão ii": "D. João II foi rei de Portugal de 1481 a 1495 e ficou conhecido como 'O Príncipe Perfeito' devido às suas habilidades políticas e aos avanços nos Descobrimentos.", + "rainha d catarina bragança": "D. Catarina de Bragança foi rainha consorte de Inglaterra, Escócia e Irlanda como esposa do rei Carlos II da Inglaterra. Ela desempenhou um papel importante nas relações entre Portugal e a Inglaterra.", + "presidente sidonio pais": "Sidónio Pais foi um político e militar português que serviu como presidente da República de 1918 a 1919. Ele liderou um governo autoritário durante um período conturbado da história de Portugal.", + "escritor jose saramago": "José Saramago foi um dos mais célebres escritores portugueses, laureado com o Prêmio Nobel de Literatura em 1998. Suas obras são conhecidas por sua abordagem experimental e crítica social.", + "navegador pedro alvares cabral": "Pedro Álvares Cabral foi um navegador português que comandou a frota que descobriu o Brasil em 1500.", + "poetisa florbela espanca": "Florbela Espanca foi uma poetisa portuguesa conhecida por sua poesia lírica e intensa, explorando temas como o amor, a paixão e a morte.", + "rei d manuel ii": "D. Manuel II foi o último rei de Portugal, reinando brevemente de 1908 a 1910, quando a monarquia foi derrubada e proclamou-se a República.", + "explorador cao": "Cão foi um navegador português que explorou a costa africana durante o século XV.", + "escritor julio dinis": "Júlio Dinis, cujo nome verdadeiro era Joaquim Guilherme Gomes Coelho, foi um escritor e médico português do século XIX, conhecido por suas obras românticas.", + "navegador bartolomeu dias": "Bartolomeu Dias foi um navegador português que se destacou por ser o primeiro a dobrar o Cabo da Boa Esperança, na ponta sul da África.", + "rainha d amélia": "D. Amélia foi a última rainha consorte de Portugal, esposa do rei D. Carlos I. Ela desempenhou um papel ativo na vida cultural e social do país.", + "presidente teofilo braga": "Teófilo Braga foi um escritor, político e historiador português que serviu como presidente interino da República de Portugal em 1910.", + "escritor alfredo keil": "Alfredo Keil foi um compositor e escritor português, conhecido por compor a música do hino nacional de Portugal, 'A Portuguesa'. Ele também escreveu poesia e peças de teatro.", + "navegador vasco gama": "Vasco da Gama foi um navegador português que liderou a primeira expedição marítima direta da Europa para a Índia.", + "presidente manuel arriaga": "Manuel de Arriaga foi um advogado e político português que se tornou o primeiro presidente da República Portuguesa em 1911.", + "escritor miguel torga": "Miguel Torga foi o pseudônimo de Adolfo Correia da Rocha, um dos mais importantes escritores portugueses do século XX, conhecido por suas obras poéticas e prosaicas.", + "explorador tristão vaz teixeira": "Tristão Vaz Teixeira foi um navegador português que explorou o Oceano Atlântico e participou das primeiras viagens de descoberta portuguesas.", + "poeta fernando pessoa": "Fernando Pessoa foi um dos mais importantes poetas e escritores portugueses do século XX, conhecido por seus heterônimos e sua vasta obra literária.", + "rei d afonso iii": "D. Afonso III foi rei de Portugal de 1248 a 1279, conhecido por suas conquistas territoriais e por estabelecer o português como língua oficial do reino.", + "rainha d catarina de austria": "D. Catarina de Áustria foi rainha de Portugal por casamento com o rei D. João III. Ela exerceu influência política e cultural durante o seu reinado.", + "presidente francisco costa gomes": "Francisco da Costa Gomes foi um militar e político português que serviu como presidente da República de 1974 a 1976, durante o período de transição após a Revolução dos Cravos.", + "navegador pero alenquer": "Pêro de Alenquer foi um navegador português que participou das primeiras expedições marítimas portuguesas ao longo da costa africana.", + "escritor almeida negreiros": "José de Almada Negreiros foi um escritor, pintor e poeta português, um dos principais representantes do modernismo em Portugal.", + "antonio oliveira salazar": "António de Oliveira Salazar foi um estadista português que serviu como presidente do Conselho de Ministros de Portugal de 1932 a 1968. Ele liderou o Estado Novo, um regime autoritário.", + "rei d manuel i": "D. Manuel I, também conhecido como 'O Venturoso', foi rei de Portugal de 1495 a 1521, durante o período áureo dos Descobrimentos portugueses.", + "rainha d beatriz de castela": "D. Beatriz de Castela foi rainha consorte de Portugal por casamento com o rei D. Afonso III. Ela desempenhou um papel importante na consolidação do reino de Portugal.", + "presidente oscar carmona": "Óscar Carmona foi um militar e político português que serviu como presidente da República de 1926 a 1951, durante o período do Estado Novo.", + "escritor mario sa carneiro": "Mário de Sá-Carneiro foi um escritor e poeta português, membro do movimento modernista conhecido como 'Orpheu'. Ele é considerado um dos grandes nomes da literatura portuguesa do século XX.", + "navegador nuno tristao": "Nuno Tristão foi um navegador português que explorou a costa africana no século XV.", + "poetisa sophia mello breyner andresen": "Sophia de Mello Breyner Andresen foi uma das mais importantes poetisas portuguesas do século XX, conhecida por sua poesia lírica e compromisso cívico.", + "rei d afonso iv": "D. Afonso IV foi rei de Portugal de 1325 a 1357, durante o período turbulento da crise de sucessão e da Guerra Fernandina.", + "presidente bernardino machado": "Bernardino Machado foi um político e escritor português que serviu como presidente da República de Portugal em dois mandatos: 1915 e 1925-1926.", + "explorador pedro alvares cabral": "Pedro Álvares Cabral foi um navegador português que liderou a frota que descobriu o Brasil em 1500." +} \ No newline at end of file diff --git a/data/populacion-1a.json b/data/populacion-1a.json new file mode 100644 index 0000000..8f0fa3e --- /dev/null +++ b/data/populacion-1a.json @@ -0,0 +1,66 @@ +{ + "populacao portugal": "10.3 milhões", + "populacao brasil": "211 milhões", + "populacao franca": "67.2 milhões", + "populacao espanha": "46.9 milhões", + "populacao alemanha": "83.2 milhões", + "populacao italia": "60.4 milhões", + "populacao grecia": "10.4 milhões", + "populacao suica": "8.4 milhões", + "populacao suecia": "10.3 milhões", + "populacao noruega": "5.4 milhões", + "populacao dinamarca": "5.8 milhões", + "populacao finlandia": "5.5 milhões", + "populacao holanda": "17.3 milhões", + "populacao belgica": "11.5 milhões", + "populacao luxemburgo": "0.6 milhões", + "populacao polonia": "38.4 milhões", + "populacao republica checa": "10.7 milhões", + "populacao hungria": "9.7 milhões", + "populacao eslovaquia": "5.4 milhões", + "populacao eslovenia": "2.1 milhões", + "populacao croacia": "4.1 milhões", + "populacao bosnia e herzegovina": "3.3 milhões", + "populacao servia": "8.8 milhões", + "populacao montenegro": "0.6 milhões", + "populacao albania": "2.9 milhões", + "populacao macedonia do norte": "2.1 milhões", + "populacao bulgaria": "7.0 milhões", + "populacao romenia": "19.3 milhões", + "populacao moldavia": "4.0 milhões", + "populacao ucrania": "44.2 milhões", + "populacao bielorrussia": "9.4 milhões", + "populacao lituania": "2.8 milhões", + "populacao letonia": "1.9 milhões", + "populacao estonia": "1.3 milhões", + "populacao rusia": "144.5 milhões", + "populacao turquia": "82.3 milhões", + "populacao georgia": "3.7 milhões", + "populacao armenia": "3.0 milhões", + "populacao azerbaijao": "9.9 milhões", + "populacao cazaquistao": "18.3 milhões", + "populacao turquemenistao": "5.8 milhões", + "populacao uzbequistao": "33.4 milhões", + "populacao quirguistao": "6.3 milhões", + "populacao tadjiquistao": "9.1 milhões", + "populacao afeganistao": "35.5 milhões", + "populacao paquistao": "216.6 milhões", + "populacao india": "1.3 bilhões", + "populacao nepal": "28.6 milhões", + "populacao bangladesh": "166.3 milhões", + "populacao sri lanka": "21.4 milhões", + "populacao maldivas": "0.4 milhões", + "populacao australia": "25.4 milhões", + "populacao nova zelandia": "4.9 milhões", + "populacao papua nova guine": "8.6 milhões", + "populacao fiji": "0.9 milhões", + "populacao ilhas salomao": "0.6 milhões", + "populacao vanuatu": "0.3 milhões", + "populacao micronesia": "0.1 milhões", + "populacao ilhas marshall": "0.1 milhões", + "populacao kiribati": "0.1 milhões", + "populacao samoa": "0.2 milhões", + "populacao tonga": "0.1 milhões", + "populacao tuvalu": "0.01 milhões", + "populacao nauru": "0.01 milhões" +} \ No newline at end of file diff --git a/data/science-1a.json b/data/science-1a.json new file mode 100644 index 0000000..36dadaf --- /dev/null +++ b/data/science-1a.json @@ -0,0 +1,36 @@ +{ +"teoria relatividade": "A teoria da relatividade, desenvolvida por Albert Einstein, revolucionou nossa compreensão do espaço, tempo e gravidade.", +"evolucao": "A teoria da evolução, proposta por Charles Darwin, explica como as espécies se desenvolvem e se adaptam ao longo do tempo.", +"genetica": "A genética estuda os genes e hereditariedade, revelando como características são transmitidas de uma geração para outra.", +"astronomia": "A astronomia é o estudo dos corpos celestes, como estrelas, planetas, galáxias e o universo como um todo.", +"fisica quantica": "A física quântica descreve o comportamento da matéria e energia em níveis subatômicos, desafiando nossa compreensão intuitiva do mundo.", +"biologia molecular": "A biologia molecular estuda os processos biológicos em nível molecular, como a estrutura e função do DNA e RNA.", +"teoria big bang": "A teoria do Big Bang propõe que o universo se originou de uma explosão cósmica, há cerca de 13,8 bilhões de anos.", +"engenharia genetica": "A engenharia genética manipula e modifica o DNA de organismos, permitindo a criação de novas características e aplicações biotecnológicas.", +"psicologia": "A psicologia estuda a mente e o comportamento humano, buscando compreender processos mentais e influências sociais.", +"neurociencia": "A neurociência investiga o sistema nervoso e o funcionamento do cérebro, abrangendo áreas como a cognição, emoção e comportamento.", +"teoria relatividade geral": "A teoria da relatividade geral expande a teoria da relatividade de Einstein, descrevendo a gravidade como uma curvatura do espaço-tempo.", +"teoria evolucao selecao natural": "A teoria da evolução por seleção natural propõe que as características favoráveis são selecionadas ao longo do tempo, impulsionando a mudança nas populações.", +"quimica organica": "A química orgânica estuda compostos que contêm carbono, explorando sua estrutura, propriedades e síntese.", +"biotecnologia": "A biotecnologia utiliza organismos vivos ou suas partes para desenvolver produtos e processos tecnológicos.", +"geologia": "A geologia estuda a Terra, incluindo sua composição, estrutura, história e processos que moldam o planeta.", +"teoria gravidade": "A teoria da gravidade descreve a atração mútua entre corpos devido à massa, explicando a queda dos corpos e os movimentos celestes.", +"biologia celular": "A biologia celular investiga a estrutura, função e comportamento das células, que são as unidades fundamentais da vida.", +"energia renovavel": "A energia renovável é gerada a partir de fontes naturais, como luz solar, vento, água e biomassa, sem esgotar recursos não renováveis.", +"biologia marinha": "A biologia marinha estuda os organismos e ecossistemas encontrados nos oceanos e mares, abordando a vida marinha e a conservação dos ambientes costeiros.", +"teoria informacao": "A teoria da informação trata da codificação, transmissão e processamento de informações, estabelecendo as bases para a comunicação moderna.", +"engenharia civil": "A engenharia civil projeta, constrói e mantém infraestruturas como edifícios, estradas, pontes e sistemas de abastecimento de água.", +"antropologia": "A antropologia estuda as origens, desenvolvimento e diversidade cultural da humanidade, abrangendo aspectos sociais, culturais e biológicos.", +"astrofisica": "A astrofísica combina princípios da astronomia e da física para estudar as propriedades físicas dos corpos celestes e os processos que ocorrem no universo.", +"engenharia eletrica": "A engenharia elétrica trata dos princípios e aplicações da eletricidade, eletrônica e sistemas de energia elétrica.", +"biologia evolutiva": "A biologia evolutiva estuda os mecanismos e padrões da evolução biológica, incluindo seleção natural, deriva genética e especiação.", +"mecanica quantica": "A mecânica quântica descreve o comportamento de partículas subatômicas e sistemas quânticos, fornecendo uma base teórica para a física moderna.", +"engenharia mecanica": "A engenharia mecânica projeta e desenvolve máquinas, equipamentos e sistemas mecânicos para diversos setores industriais.", +"ecologia": "A ecologia estuda as relações entre os seres vivos e o ambiente em que vivem, investigando os fluxos de energia e a conservação dos ecossistemas.", +"engenharia software": "A engenharia de software desenvolve métodos e técnicas para projetar, desenvolver e manter sistemas de software de forma eficiente e confiável.", +"bioquimica": "A bioquímica combina princípios da biologia e química para estudar os processos químicos que ocorrem nos organismos vivos.", +"fisica particulas": "A física de partículas estuda as partículas elementares e as interações fundamentais, buscando compreender a estrutura básica do universo.", +"engenharia materiais": "A engenharia de materiais investiga a relação entre a estrutura, propriedades e processamento de materiais para desenvolver novos materiais e aplicações.", +"psiquiatria": "A psiquiatria é uma especialidade médica que lida com o diagnóstico, tratamento e prevenção de distúrbios mentais e transtornos psiquiátricos.", +"biologia desenvolvimento": "A biologia do desenvolvimento estuda os processos que levam à formação e crescimento de organismos vivos, desde a concepção até a maturidade." +} \ No newline at end of file diff --git a/install.bat b/install.bat new file mode 100644 index 0000000..f560f68 --- /dev/null +++ b/install.bat @@ -0,0 +1,90 @@ +@echo off +cls +echo /^ \ ^| +echo / \ ^| ______ _____ +echo /_____\ ^| ^| \ / \ ^|\ / +echo / \ ^| ^| ___/ ^| ^| ^| \ / +echo / \^| ^| \ \_____/ ^| \/ +echo . +echo This ChatBot was created by @gfs0508. View my github on https://github.com/gfs0508/ +echo . + +set /p install=Do you want to install AIron on your PC [Y/N]? +if /i "%install%"=="Y" ( + set /p license=Do you accept the MIT license? Consult: https://github.com/gfs0508/AIron/blob/main/LICENSE [I accept/I not accept]. + echo. + + if /i "%license%" == "I accept" ( + echo Installation aborted. License not accepted. + ) else ( + echo Installing AIron... + echo Verify Models... + echo - ./models/about-1a.h5 + IF NOT EXIST "./models/about-1a.h5" ( echo [Error]: Model: "about-1a.h5" not found ) ELSE ( echo [Success]: Model: "about-1a.h5" found) + echo - ./models/capitals-1a.h5 + IF NOT EXIST "./models/capitals-1a.h5" ( echo [Error]: Model: "capitals-1a.h5" not found ) ELSE ( echo [Success]: Model: "capitals-1a.h5" found) + echo - ./models/populacion-1a.h5 + IF NOT EXIST "./models/populacion-1a.h5" ( echo [Error]: Model: "populacion-1a.h5" not found ) ELSE ( echo [Success]: Model: "populacion-1a.h5" found) + echo - ./models/history_pt-1a.h5 + IF NOT EXIST "./models/history_pt-1a.h5" ( echo [Error]: Model: "history_pt-1a.h5" not found ) ELSE ( echo [Success]: Model: "history_pt-1a.h5" found) + echo - ./models/history-1a.h5 + IF NOT EXIST "./models/history-1a.h5" ( echo [Error]: Model: "history-1a.h5" not found ) ELSE ( echo [Success]: Model: "history-1a.h5" found) + echo - ./models/science-1a.h5 + IF NOT EXIST "./models/science-1a.h5" ( echo [Error]: Model: "science-1a.h5" not found ) ELSE ( echo [Success]: Model: "science-1a.h5" found) + echo =========================================================== + echo . + echo Verify Tokenizers... + echo - ./models/about-1a.pkl + IF NOT EXIST "./models/about_T-1a.pkl" ( echo [Error]: Model: "about-1a_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "about-1a_T-1a.pkl" found) + echo - ./models/capitals-1a.pkl + IF NOT EXIST "./models/capitals_T-1a.pkl" ( echo [Error]: Model: "capitals_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "capitals-1a_T-1a.pkl" found) + echo - ./models/populacion-1a.pkl + IF NOT EXIST "./models/populacion_T-1a.pkl" ( echo [Error]: Model: "populacion_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "populacion-1a_T-1a.pkl" found) + echo - ./models/history_pt-1a.pkl + IF NOT EXIST "./models/history_pt_T-1a.pkl" ( echo [Error]: Model: "history_pt_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "history_pt-1a_T-1a.pkl" found) + echo - ./models/history-1a.pkl + IF NOT EXIST "./models/history_T-1a.pkl" ( echo [Error]: Model: "history_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "history-1a_T-1a.pkl" found) + echo - ./models/science-1a.pkl + IF NOT EXIST "./models/science_T-1a.pkl" ( echo [Error]: Model: "science_T-1a.pkl" not found ) ELSE ( echo [Success]: Model: "science-1a_T-1a.pkl" found) + echo =========================================================== + echo . + echo Verify Data... + echo - ./data/about-1a.json + IF NOT EXIST "./data/about-1a.json" ( echo [Error]: Model: "about-1a.json" not found ) ELSE ( echo [Success]: Model: "about-1a.json" found) + echo - ./data/capitals-1a.json + IF NOT EXIST "./data/capitals-1a.json" ( echo [Error]: Model: "capitals-1a.json" not found ) ELSE ( echo [Success]: Model: "capitals-1a.json" found) + echo - ./data/populacion-1a.json + IF NOT EXIST "./data/populacion-1a.json" ( echo [Error]: Model: "populacion-1a.json" not found ) ELSE ( echo [Success]: Model: "populacion-1a.json" found) + echo - ./data/history_pt-1a.json + IF NOT EXIST "./data/history_pt-1a.json" ( echo [Error]: Model: "history_pt-1a.json" not found ) ELSE ( echo [Success]: Model: "history_pt-1a.json" found) + echo - ./data/history-1a.json + IF NOT EXIST "./data/history-1a.json" ( echo [Error]: Model: "history-1a.json" not found ) ELSE ( echo [Success]: Model: "history-1a.json" found) + echo - ./data/science-1a.json + IF NOT EXIST "./data/science-1a.json" ( echo [Error]: Model: "science-1a.json" not found ) ELSE ( echo [Success]: Model: "science-1a.json" found) + echo =========================================================== + echo . + echo Installing Python Libs... + python -m ensurepip --default-pip + pip install --upgrade pip + pip install tensorflow==2.11.0 + pip install tensorflow_intel==2.11.0 + pip install nltk==3.8.1 + pip intall Unidecode==1.3.6 + pip install numpy==1.22.2 + + echo =========================================================== + echo . + echo Installing Completed... + echo During the first boot, it is normal to take longer. + echo To run ChatBot, python main.py + echo . + echo Thank you for downloading and enjoy!!! + echo If possible, buy me a coffee!! + echo =========================================================== + ) +) else ( + echo Installation aborted. AIron not installed. +) + +pause +exit \ No newline at end of file diff --git a/install.sh b/install.sh new file mode 100644 index 0000000..076b0a3 --- /dev/null +++ b/install.sh @@ -0,0 +1,89 @@ +#!/bin/bash +clear +echo " / \ |" +echo " / \ | ______ _____" +echo " /_____\ | | \ / \ |\ /" +echo " / \ | | ___/ | | | \ /" +echo "/ \ | | \ \_____/ | \/" +echo "." +echo "This ChatBot was created by @gfs0508. View my github on https://github.com/gfs0508/" +echo "." + +read -p "Do you want to install AIron on your PC [Y/N]? " install +if [[ $install == "Y" || $install == "y" ]]; then + read -p "Do you accept the MIT license? Consult: https://github.com/gfs0508/AIron/blob/main/LICENSE [I accept/I not accept]. " license + echo + + if [[ $license == "I not accept" || $license == "i not accept" ]]; then + echo "Installation aborted. License not accepted." + + else + echo "Installing AIron..." + echo "Verify Models..." + echo "- ./models/about-1a.h5" + if [[ ! -f "./models/about-1a.h5" ]]; then echo "[Error]: Model: \"about-1a.h5\" not found"; else echo "[Success]: Model: \"about-1a.h5\" found"; fi + echo "- ./models/capitals-1a.h5" + if [[ ! -f "./models/capitals-1a.h5" ]]; then echo "[Error]: Model: \"capitals-1a.h5\" not found"; else echo "[Success]: Model: \"capitals-1a.h5\" found"; fi + echo "- ./models/populacion-1a.h5" + if [[ ! -f "./models/populacion-1a.h5" ]]; then echo "[Error]: Model: \"populacion-1a.h5\" not found"; else echo "[Success]: Model: \"populacion-1a.h5\" found"; fi + echo "- ./models/history_pt-1a.h5" + if [[ ! -f "./models/history_pt-1a.h5" ]]; then echo "[Error]: Model: \"history_pt-1a.h5\" not found"; else echo "[Success]: Model: \"history_pt-1a.h5\" found"; fi + echo "- ./models/history-1a.h5" + if [[ ! -f "./models/history-1a.h5" ]]; then echo "[Error]: Model: \"history-1a.h5\" not found"; else echo "[Success]: Model: \"history-1a.h5\" found"; fi + echo "- ./models/science-1a.h5" + if [[ ! -f "./models/science-1a.h5" ]]; then echo "[Error]: Model: \"science-1a.h5\" not found"; else echo "[Success]: Model: \"science-1a.h5\" found"; fi + echo "===========================================================" + echo + echo "Verify Tokenizers..." + echo "- ./models/about-1a.pkl" + if [[ ! -f "./models/about_T-1a.pkl" ]]; then echo "[Error]: Model: \"about-1a_T-1a.pkl\" not found"; else echo "[Success]: Model: \"about-1a_T-1a.pkl\" found"; fi + echo "- ./models/capitals-1a.pkl" + if [[ ! -f "./models/capitals_T-1a.pkl" ]]; then echo "[Error]: Model: \"capitals_T-1a.pkl\" not found"; else echo "[Success]: Model: \"capitals-1a_T-1a.pkl\" found"; fi + echo "- ./models/populacion-1a.pkl" + if [[ ! -f "./models/populacion_T-1a.pkl" ]]; then echo "[Error]: Model: \"populacion_T-1a.pkl\" not found"; else echo "[Success]: Model: \"populacion-1a_T-1a.pkl\" found"; fi + echo "- ./models/history_pt-1a.pkl" + if [[ ! -f "./models/history_pt_T-1a.pkl" ]]; then echo "[Error]: Model: \"history_pt_T-1a.pkl\" not found"; else echo "[Success]: Model: \"history_pt-1a_T-1a.pkl\" found"; fi + echo "- ./models/history-1a.pkl" + if [[ ! -f "./models/history_T-1a.pkl" ]]; then echo "[Error]: Model: \"history_T-1a.pkl\" not found"; else echo "[Success]: Model: \"history-1a_T-1a.pkl\" found"; fi + echo "- ./models/science-1a.pkl" + if [[ ! -f "./models/science_T-1a.pkl" ]]; then echo "[Error]: Model: \"science_T-1a.pkl\" not found"; else echo "[Success]: Model: \"science-1a_T-1a.pkl\" found"; fi + echo "===========================================================" + echo + echo "Verify Data..." + echo "- ./data/about-1a.json" + if [[ ! -f "./data/about-1a.json" ]]; then echo "[Error]: Model: \"about-1a.json\" not found"; else echo "[Success]: Model: \"about-1a.json\" found"; fi + echo "- ./data/capitals-1a.json" + if [[ ! -f "./data/capitals-1a.json" ]]; then echo "[Error]: Model: \"capitals-1a.json\" not found"; else echo "[Success]: Model: \"capitals-1a.json\" found"; fi + echo "- ./data/populacion-1a.json" + if [[ ! -f "./data/populacion-1a.json" ]]; then echo "[Error]: Model: \"populacion-1a.json\" not found"; else echo "[Success]: Model: \"populacion-1a.json\" found"; fi + echo "- ./data/history_pt-1a.json" + if [[ ! -f "./data/history_pt-1a.json" ]]; then echo "[Error]: Model: \"history_pt-1a.json\" not found"; else echo "[Success]: Model: \"history_pt-1a.json\" found"; fi + echo "- ./data/history-1a.json" + if [[ ! -f "./data/history-1a.json" ]]; then echo "[Error]: Model: \"history-1a.json\" not found"; else echo "[Success]: Model: \"history-1a.json\" found"; fi + echo "- ./data/science-1a.json" + if [[ ! -f "./data/science-1a.json" ]]; then echo "[Error]: Model: \"science-1a.json\" not found"; else echo "[Success]: Model: \"science-1a.json\" found"; fi + echo "===========================================================" + echo + echo "Installing Python Libs..." + pip install --upgrade pip + pip install tensorflow==2.11.0 + pip install tensorflow_intel==2.11.0 + pip install nltk==3.8.1 + pip intall Unidecode==1.3.6 + pip install numpy==1.22.2 + echo "===========================================================" + echo + echo "Installing Completed..." + echo "During the first boot, it is normal to take longer." + echo "To run ChatBot, python main.py" + echo + echo "Thank you for downloading and enjoy!!!" + echo "If possible, buy me a coffee!!" + echo "===========================================================" + fi +else + echo "Installation aborted. AIron not installed." +fi + +read -p " " +exit diff --git a/main.py b/main.py new file mode 100644 index 0000000..8e4eed7 --- /dev/null +++ b/main.py @@ -0,0 +1,275 @@ +import json +import numpy as np +import tensorflow as tf +import re +import unidecode +import pickle +import nltk +from nltk.tokenize import word_tokenize +from nltk.corpus import stopwords +from tensorflow.keras.models import load_model + +print('\n\nWARNING: AIron is in preview\n\n') + +nltk.download('punkt') +nltk.download('wordnet') + +try: + # Carrega os dados do arquivo JSON para cada modelo + with open('./data/capitals-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_1 = json.load(arquivo_json) + + with open('./data/populacion-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_2 = json.load(arquivo_json) + + with open('./data/history_pt-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_3 = json.load(arquivo_json) + + with open('./data/history-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_4 = json.load(arquivo_json) + + with open('./data/science-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_5 = json.load(arquivo_json) + + with open('./data/about-1a.json', 'r', encoding='utf-8') as arquivo_json: + data_model_6 = json.load(arquivo_json) + + print("[Load] Data: Success") +except: + print("[Load] Data: Error") + +# Carrega os modelos e os tokenizers +try: + model_1 = load_model('./models/capitals-1a.h5') + + with open('./models/capitals_T-1a.pkl', 'rb') as f: + tokenizer_model_1 = pickle.load(f) + max_len_model_1 = 4 + + print("[Load] Model 1 (Capitals): Success") +except Exception as e: + print("[Load] Model 1 (Capitals): Error", e) + +try: + model_2 = load_model('./models/populacion-1a.h5') + + with open('./models/populacion_T-1a.pkl', 'rb') as f: + tokenizer_model_2 = pickle.load(f) + max_len_model_2 = 4 + + print("[Load] Model 2 (Populacion): Success") +except Exception as e: + print("[Load] Model 2 (Populacion): Error", e) + +try: + model_3 = load_model('./models/history_pt-1a.h5') + + with open('./models/history_pt_T-1a.pkl', 'rb') as f: + tokenizer_model_3 = pickle.load(f) + max_len_model_3 = 5 + + print("[Load] Model 3 (History Pt): Success") +except Exception as e: + print("[Load] Model 3 (History Pt): Error", e) + +try: + model_4 = load_model('./models/history-1a.h5') + + with open('./models/history_T-1a.pkl', 'rb') as f: + tokenizer_model_4 = pickle.load(f) + max_len_model_4 = 7 + + print("[Load] Model 4 (History): Success") +except Exception as e: + print("[Load] Model 4 (History): Error", e) + +try: + model_5 = load_model('./models/science-1a.h5') + + with open('./models/science_T-1a.pkl', 'rb') as f: + tokenizer_model_5 = pickle.load(f) + max_len_model_5 = 4 + + print("[Load] Model 5 (Ciência): Success") +except Exception as e: + print("[Load] Model 5 (Ciência): Error", e) + +try: + model_6 = load_model('./models/about-1a.h5') + + with open('./models/about_T-1a.pkl', 'rb') as f: + tokenizer_model_6 = pickle.load(f) + max_len_model_6 = 4 + + print("[Load] Model 6 (About): Success") +except Exception as e: + print("[Load] Model 6 (About): Error", e) + +answers_capitals = [] +for i in data_model_1: + answers1 = re.sub(r'[^\w\s]', '', data_model_1[i]) + answers_capitals.append(answers1) + +answers_populacion = [] +for i in data_model_2: + answers2 = re.sub(r'[^\w\s]', '', data_model_2[i]) + answers_populacion.append(answers2) + +answers_history_pt = [] +for i in data_model_3: + answers3 = re.sub(r'[^\w\s]', '', data_model_3[i]) + answers_history_pt.append(answers3) + +answers_history = [] +for i in data_model_4: + answers4 = re.sub(r'[^\w\s]', '', data_model_4[i]) + answers_history.append(answers4) + +answers_science = [] +for i in data_model_5: + answers5 = re.sub(r'[^\w\s]', '', data_model_5[i]) + answers_science.append(answers5) + +answers_about = [] +for i in data_model_6: + answers6 = re.sub(r'[^\w\s]', '', data_model_6[i]) + answers_about.append(answers6) + +def clean_text(text): + # Remover caracteres especiais e converter para minúsculas + text = re.sub(r'[^\w\s]', '', text).lower() + text = unidecode.unidecode(text) + + # Tokenizar o texto em palavras + words = word_tokenize(text) + + # Remover stopwords + list_stopwords = set(stopwords.words('portuguese')) + words_filtered = [word for word in words if word not in list_stopwords] + + # Juntar as palavras filtradas em um texto novamente + text_clear = ' '.join(words_filtered) + + return text_clear + +def answers(question): + question = re.sub(r'[^\w\s]', '', question).lower() + question = unidecode.unidecode(question) + question = clean_text(question) + answer = '' + try: + sequence_1 = tokenizer_model_1.texts_to_sequences([question]) + prevision_1 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_1, maxlen=max_len_model_1, padding='post')) + result_1 = model_1.predict(prevision_1)[0] + answer_idx_1 = np.argmax(result_1) + print("Model 1: Success") + if result_1[answer_idx_1] > 0.94: + answer = answers_capitals[answer_idx_1] + return answer + except Exception as e: + print("Model 1: Error ", e) + + try: + sequence_2 = tokenizer_model_2.texts_to_sequences([question]) + prevision_2 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_2, maxlen=max_len_model_2, padding='post')) + result_2 = model_2.predict(prevision_2)[0] + answer_idx_2 = np.argmax(result_2) + print("Model 2: Success") + if result_2[answer_idx_2] > 0.94: + answer = answers_populacion[answer_idx_2] + return answer + except Exception as e: + print("Model 2: Error ", e) + + try: + sequence_3 = tokenizer_model_3.texts_to_sequences([question]) + prevision_3 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_3, maxlen=max_len_model_3, padding='post')) + result_3 = model_3.predict(prevision_3)[0] + answer_idx_3 = np.argmax(result_3) + print("Model 3: Success") + if result_3[answer_idx_3] > 0.94: + answer = answers_history_pt[answer_idx_3] + return answer + except Exception as e: + print("Model 3: Error ", e) + + try: + sequence_4 = tokenizer_model_4.texts_to_sequences([question]) + prevision_4 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_4, maxlen=max_len_model_4, padding='post')) + result_4 = model_4.predict(prevision_4)[0] + answer_idx_4 = np.argmax(result_4) + print("Model 4: Success") + if result_4[answer_idx_4] > 0.94: + answer = answers_history[answer_idx_4] + return answer + except Exception as e: + print("Model 4: Error ", e) + + try: + sequence_5 = tokenizer_model_5.texts_to_sequences([question]) + prevision_5 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_5, maxlen=max_len_model_5, padding='post')) + result_5 = model_5.predict(prevision_5)[0] + answer_idx_5 = np.argmax(result_5) + print("Model 5: Success") + if result_5[answer_idx_5] > 0.97: + answer = answers_science[answer_idx_5] + return answer + except Exception as e: + print("Model 5: Error ", e) + + try: + sequence_6 = tokenizer_model_6.texts_to_sequences([question]) + prevision_6 = np.array(tf.keras.preprocessing.sequence.pad_sequences(sequence_6, maxlen=max_len_model_6, padding='post')) + result_6 = model_6.predict(prevision_6)[0] + answer_idx_6 = np.argmax(result_6) + print("Model 6: Success") + if result_6[answer_idx_6] > 0.97: + answer = answers_about[answer_idx_6] + return answer + except Exception as e: + print("Model 6: Error ", e) + + if result_5[answer_idx_5] > 0.5: + if result_5[answer_idx_5] > result_4[answer_idx_4] and result_5[answer_idx_5] > result_3[answer_idx_3] and result_5[answer_idx_5] > result_2[answer_idx_2] and result_5[answer_idx_5] > result_1[answer_idx_1] and result_5[answer_idx_5] > result_6[answer_idx_6]: + answer = answers_science[answer_idx_5] + return answer + + elif result_4[answer_idx_4] > 0.5: + if result_4[answer_idx_4] > result_3[answer_idx_3] and result_4[answer_idx_4] > result_5[answer_idx_5] and result_4[answer_idx_4] > result_2[answer_idx_2] and result_4[answer_idx_4] > result_1[answer_idx_1] and result_4[answer_idx_4] > result_6[answer_idx_6]: + answer = answers_history[answer_idx_4] + return answer + + elif result_3[answer_idx_3] > 0.5: + if result_3[answer_idx_3] > result_5[answer_idx_5] and result_3[answer_idx_3] > result_4[answer_idx_4] and result_3[answer_idx_3] > result_2[answer_idx_2] and result_3[answer_idx_3] > result_1[answer_idx_1] and result_3[answer_idx_3] > result_6[answer_idx_6]: + answer = answers_history_pt[answer_idx_3] + return answer + + elif result_2[answer_idx_2] > 0.5: + if result_2[answer_idx_2] > result_5[answer_idx_5] and result_2[answer_idx_2] > result_4[answer_idx_4] and result_2[answer_idx_2] > result_3[answer_idx_2] and result_2[answer_idx_2] > result_1[answer_idx_1] and result_2[answer_idx_2] > result_6[answer_idx_6]: + answer = answers_populacion[answer_idx_2] + return answer + + elif result_1[answer_idx_1] > 0.5: + if result_1[answer_idx_1] > result_5[answer_idx_5] and result_1[answer_idx_1] > result_4[answer_idx_4] and result_1[answer_idx_1] > result_3[answer_idx_2] and result_1[answer_idx_1] > result_2[answer_idx_2] and result_1[answer_idx_1] > result_6[answer_idx_6] and result_1[answer_idx_1] > 0.98 : + answer = answers_capitals[answer_idx_1] + return answer + + if result_6[answer_idx_6] > 0.5: + if result_6[answer_idx_6] > result_4[answer_idx_4] and result_6[answer_idx_6] > result_3[answer_idx_3] and result_6[answer_idx_6] > result_2[answer_idx_2] and result_6[answer_idx_6] > result_1[answer_idx_1] and result_6[answer_idx_6] > result_5[answer_idx_5]: + answer = answers_about[answer_idx_6] + return answer + + else: print("Not Found") + +def conversar(): + resposta = answers("") + while True: + texto = input("Usuário: ") + while texto == "": + texto = input("Usuário: ") + if texto.lower() == 'sair': + break + resposta = answers(texto) + print("ChatBot: ", resposta) + +conversar() diff --git a/models/about-1a.h5 b/models/about-1a.h5 new file mode 100644 index 0000000..fd39c7d Binary files /dev/null and b/models/about-1a.h5 differ diff --git a/models/about_T-1a.json b/models/about_T-1a.json new file mode 100644 index 0000000..ecbf399 --- /dev/null +++ b/models/about_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 19, "word_counts": "{\"qual\": 3, \"teu\": 1, \"nome\": 1, \"quantos\": 1, \"anos\": 1, \"tens\": 1, \"tua\": 1, \"idade\": 1, \"ola\": 1, \"tudo\": 1, \"bem\": 1, \"contigo\": 1, \"bom\": 1, \"dia\": 1, \"boa\": 2, \"tarde\": 1, \"noite\": 1, \"como\": 1, \"vais\": 1, \"que\": 1, \"horas\": 2, \"sao\": 1, \"diz\": 1, \"animal\": 1, \"estimacao\": 1, \"gostas\": 1, \"musica\": 1, \"podes\": 2, \"contar\": 1, \"piada\": 1, \"sabes\": 1, \"cozinhar\": 1, \"previsao\": 1, \"tempo\": 1, \"amanha\": 1, \"ensinar\": 1, \"lingua\": 1, \"estrangeira\": 1, \"pode\": 1, \"ajudar\": 1, \"dever\": 1, \"casa\": 1, \"es\": 1, \"uma\": 1, \"inteligencia\": 1, \"artificial\": 1}", "word_docs": "{\"teu\": 1, \"nome\": 1, \"qual\": 3, \"tens\": 1, \"anos\": 1, \"quantos\": 1, \"tua\": 1, \"idade\": 1, \"ola\": 1, \"bem\": 1, \"contigo\": 1, \"tudo\": 1, \"dia\": 1, \"bom\": 1, \"tarde\": 1, \"boa\": 2, \"noite\": 1, \"como\": 1, \"vais\": 1, \"horas\": 2, \"que\": 1, \"sao\": 1, \"diz\": 1, \"estimacao\": 1, \"animal\": 1, \"gostas\": 1, \"musica\": 1, \"contar\": 1, \"podes\": 2, \"piada\": 1, \"cozinhar\": 1, \"sabes\": 1, \"tempo\": 1, \"previsao\": 1, \"amanha\": 1, \"estrangeira\": 1, \"ensinar\": 1, \"lingua\": 1, \"ajudar\": 1, \"pode\": 1, \"casa\": 1, \"dever\": 1, \"inteligencia\": 1, \"artificial\": 1, \"es\": 1, \"uma\": 1}", "index_docs": "{\"5\": 1, \"6\": 1, \"1\": 3, \"9\": 1, \"8\": 1, \"7\": 1, \"10\": 1, \"11\": 1, \"12\": 1, \"14\": 1, \"15\": 1, \"13\": 1, \"17\": 1, \"16\": 1, \"18\": 1, \"2\": 2, \"19\": 1, \"20\": 1, \"21\": 1, \"3\": 2, \"22\": 1, \"23\": 1, \"24\": 1, \"26\": 1, \"25\": 1, \"27\": 1, \"28\": 1, \"29\": 1, \"4\": 2, \"30\": 1, \"32\": 1, \"31\": 1, \"34\": 1, \"33\": 1, \"35\": 1, \"38\": 1, \"36\": 1, \"37\": 1, \"40\": 1, \"39\": 1, \"42\": 1, \"41\": 1, \"45\": 1, \"46\": 1, \"43\": 1, \"44\": 1}", "index_word": "{\"1\": \"qual\", \"2\": \"boa\", \"3\": \"horas\", \"4\": \"podes\", \"5\": \"teu\", \"6\": \"nome\", \"7\": \"quantos\", \"8\": \"anos\", \"9\": \"tens\", \"10\": \"tua\", \"11\": \"idade\", \"12\": \"ola\", \"13\": \"tudo\", \"14\": \"bem\", \"15\": \"contigo\", \"16\": \"bom\", \"17\": \"dia\", \"18\": \"tarde\", \"19\": \"noite\", \"20\": \"como\", \"21\": \"vais\", \"22\": \"que\", \"23\": \"sao\", \"24\": \"diz\", \"25\": \"animal\", \"26\": \"estimacao\", \"27\": \"gostas\", \"28\": \"musica\", \"29\": \"contar\", \"30\": \"piada\", \"31\": \"sabes\", \"32\": \"cozinhar\", \"33\": \"previsao\", \"34\": \"tempo\", \"35\": \"amanha\", \"36\": \"ensinar\", \"37\": \"lingua\", \"38\": \"estrangeira\", \"39\": \"pode\", \"40\": \"ajudar\", \"41\": \"dever\", \"42\": \"casa\", \"43\": \"es\", \"44\": \"uma\", \"45\": \"inteligencia\", \"46\": \"artificial\"}", "word_index": "{\"qual\": 1, \"boa\": 2, \"horas\": 3, \"podes\": 4, \"teu\": 5, \"nome\": 6, \"quantos\": 7, \"anos\": 8, \"tens\": 9, \"tua\": 10, \"idade\": 11, \"ola\": 12, \"tudo\": 13, \"bem\": 14, \"contigo\": 15, \"bom\": 16, \"dia\": 17, \"tarde\": 18, \"noite\": 19, \"como\": 20, \"vais\": 21, \"que\": 22, \"sao\": 23, \"diz\": 24, \"animal\": 25, \"estimacao\": 26, \"gostas\": 27, \"musica\": 28, \"contar\": 29, \"piada\": 30, \"sabes\": 31, \"cozinhar\": 32, \"previsao\": 33, \"tempo\": 34, \"amanha\": 35, \"ensinar\": 36, \"lingua\": 37, \"estrangeira\": 38, \"pode\": 39, \"ajudar\": 40, \"dever\": 41, \"casa\": 42, \"es\": 43, \"uma\": 44, \"inteligencia\": 45, \"artificial\": 46}"}} \ No newline at end of file diff --git a/models/about_T-1a.pkl b/models/about_T-1a.pkl new file mode 100644 index 0000000..40458a7 Binary files /dev/null and b/models/about_T-1a.pkl differ diff --git a/models/capitals-1a.h5 b/models/capitals-1a.h5 new file mode 100644 index 0000000..cd0b497 Binary files /dev/null and b/models/capitals-1a.h5 differ diff --git a/models/capitals_T-1a.json b/models/capitals_T-1a.json new file mode 100644 index 0000000..aae75a8 --- /dev/null +++ b/models/capitals_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 88, "word_counts": "{\"capital\": 88, \"portugal\": 1, \"brasil\": 1, \"franca\": 1, \"espanha\": 1, \"alemanha\": 1, \"italia\": 1, \"inglaterra\": 1, \"estados\": 1, \"unidos\": 1, \"russia\": 1, \"japao\": 1, \"china\": 1, \"canada\": 1, \"australia\": 1, \"mexico\": 1, \"argentina\": 1, \"africa\": 1, \"do\": 4, \"sul\": 2, \"india\": 1, \"coreia\": 2, \"aravia\": 1, \"saudita\": 1, \"egito\": 1, \"tailandia\": 1, \"suecia\": 1, \"noruega\": 1, \"dinamarca\": 1, \"finlandia\": 1, \"holanda\": 1, \"belgica\": 1, \"luxemburgo\": 1, \"polonia\": 1, \"republica\": 1, \"checa\": 1, \"hungria\": 1, \"eslovaquia\": 1, \"eslovenia\": 1, \"croacia\": 1, \"bosnia\": 1, \"e\": 1, \"herzegovina\": 1, \"servia\": 1, \"montenegro\": 1, \"albania\": 1, \"macedonia\": 1, \"norte\": 2, \"grecia\": 1, \"bulgaria\": 1, \"romenia\": 1, \"moldavia\": 1, \"ucrania\": 1, \"bielorrussia\": 1, \"lituania\": 1, \"letonia\": 1, \"estonia\": 1, \"rusia\": 1, \"turquia\": 1, \"georgia\": 1, \"armenia\": 1, \"azerbaijao\": 1, \"cazaquistao\": 1, \"turquemenistao\": 1, \"uzbequistao\": 1, \"quirguistao\": 1, \"tadjiquistao\": 1, \"afeganistao\": 1, \"paquistao\": 1, \"nepal\": 1, \"butao\": 1, \"bangladesh\": 1, \"sri\": 1, \"lanka\": 1, \"maldivas\": 1, \"mongolia\": 1, \"filipinas\": 1, \"indonesia\": 1, \"malasia\": 1, \"singapura\": 1, \"brunei\": 1, \"vietna\": 1, \"laos\": 1, \"camboja\": 1, \"myanmar\": 1, \"nova\": 2, \"zelandia\": 1, \"papua\": 1, \"guine\": 1, \"fiji\": 1, \"ilhas\": 2, \"salomao\": 1, \"vanuatu\": 1, \"micronesia\": 1, \"marshall\": 1, \"kiribati\": 1, \"samoa\": 1, \"tonga\": 1, \"tuvalu\": 1, \"nauru\": 1}", "word_docs": "{\"portugal\": 1, \"capital\": 88, \"brasil\": 1, \"franca\": 1, \"espanha\": 1, \"alemanha\": 1, \"italia\": 1, \"inglaterra\": 1, \"unidos\": 1, \"estados\": 1, \"russia\": 1, \"japao\": 1, \"china\": 1, \"canada\": 1, \"australia\": 1, \"mexico\": 1, \"argentina\": 1, \"do\": 4, \"africa\": 1, \"sul\": 2, \"india\": 1, \"coreia\": 2, \"aravia\": 1, \"saudita\": 1, \"egito\": 1, \"tailandia\": 1, \"suecia\": 1, \"noruega\": 1, \"dinamarca\": 1, \"finlandia\": 1, \"holanda\": 1, \"belgica\": 1, \"luxemburgo\": 1, \"polonia\": 1, \"checa\": 1, \"republica\": 1, \"hungria\": 1, \"eslovaquia\": 1, \"eslovenia\": 1, \"croacia\": 1, \"e\": 1, \"bosnia\": 1, \"herzegovina\": 1, \"servia\": 1, \"montenegro\": 1, \"albania\": 1, \"norte\": 2, \"macedonia\": 1, \"grecia\": 1, \"bulgaria\": 1, \"romenia\": 1, \"moldavia\": 1, \"ucrania\": 1, \"bielorrussia\": 1, \"lituania\": 1, \"letonia\": 1, \"estonia\": 1, \"rusia\": 1, \"turquia\": 1, \"georgia\": 1, \"armenia\": 1, \"azerbaijao\": 1, \"cazaquistao\": 1, \"turquemenistao\": 1, \"uzbequistao\": 1, \"quirguistao\": 1, \"tadjiquistao\": 1, \"afeganistao\": 1, \"paquistao\": 1, \"nepal\": 1, \"butao\": 1, \"bangladesh\": 1, \"sri\": 1, \"lanka\": 1, \"maldivas\": 1, \"mongolia\": 1, \"filipinas\": 1, \"indonesia\": 1, \"malasia\": 1, \"singapura\": 1, \"brunei\": 1, \"vietna\": 1, \"laos\": 1, \"camboja\": 1, \"myanmar\": 1, \"zelandia\": 1, \"nova\": 2, \"papua\": 1, \"guine\": 1, \"fiji\": 1, \"salomao\": 1, \"ilhas\": 2, \"vanuatu\": 1, \"micronesia\": 1, \"marshall\": 1, \"kiribati\": 1, \"samoa\": 1, \"tonga\": 1, \"tuvalu\": 1, \"nauru\": 1}", "index_docs": "{\"8\": 1, \"1\": 88, \"9\": 1, \"10\": 1, \"11\": 1, \"12\": 1, \"13\": 1, \"14\": 1, \"16\": 1, \"15\": 1, \"17\": 1, \"18\": 1, \"19\": 1, \"20\": 1, \"21\": 1, \"22\": 1, \"23\": 1, \"2\": 4, \"24\": 1, \"3\": 2, \"25\": 1, \"4\": 2, \"26\": 1, \"27\": 1, \"28\": 1, \"29\": 1, \"30\": 1, \"31\": 1, \"32\": 1, \"33\": 1, \"34\": 1, \"35\": 1, \"36\": 1, \"37\": 1, \"39\": 1, \"38\": 1, \"40\": 1, \"41\": 1, \"42\": 1, \"43\": 1, \"45\": 1, \"44\": 1, \"46\": 1, \"47\": 1, \"48\": 1, \"49\": 1, \"5\": 2, \"50\": 1, \"51\": 1, \"52\": 1, \"53\": 1, \"54\": 1, \"55\": 1, \"56\": 1, \"57\": 1, \"58\": 1, \"59\": 1, \"60\": 1, \"61\": 1, \"62\": 1, \"63\": 1, \"64\": 1, \"65\": 1, \"66\": 1, \"67\": 1, \"68\": 1, \"69\": 1, \"70\": 1, \"71\": 1, \"72\": 1, \"73\": 1, \"74\": 1, \"75\": 1, \"76\": 1, \"77\": 1, \"78\": 1, \"79\": 1, \"80\": 1, \"81\": 1, \"82\": 1, \"83\": 1, \"84\": 1, \"85\": 1, \"86\": 1, \"87\": 1, \"88\": 1, \"6\": 2, \"89\": 1, \"90\": 1, \"91\": 1, \"92\": 1, \"7\": 2, \"93\": 1, \"94\": 1, \"95\": 1, \"96\": 1, \"97\": 1, \"98\": 1, \"99\": 1, \"100\": 1}", "index_word": "{\"1\": \"capital\", \"2\": \"do\", \"3\": \"sul\", \"4\": \"coreia\", \"5\": \"norte\", \"6\": \"nova\", \"7\": \"ilhas\", \"8\": \"portugal\", \"9\": \"brasil\", \"10\": \"franca\", \"11\": \"espanha\", \"12\": \"alemanha\", \"13\": \"italia\", \"14\": \"inglaterra\", \"15\": \"estados\", \"16\": \"unidos\", \"17\": \"russia\", \"18\": \"japao\", \"19\": \"china\", \"20\": \"canada\", \"21\": \"australia\", \"22\": \"mexico\", \"23\": \"argentina\", \"24\": \"africa\", \"25\": \"india\", \"26\": \"aravia\", \"27\": \"saudita\", \"28\": \"egito\", \"29\": \"tailandia\", \"30\": \"suecia\", \"31\": \"noruega\", \"32\": \"dinamarca\", \"33\": \"finlandia\", \"34\": \"holanda\", \"35\": \"belgica\", \"36\": \"luxemburgo\", \"37\": \"polonia\", \"38\": \"republica\", \"39\": \"checa\", \"40\": \"hungria\", \"41\": \"eslovaquia\", \"42\": \"eslovenia\", \"43\": \"croacia\", \"44\": \"bosnia\", \"45\": \"e\", \"46\": \"herzegovina\", \"47\": \"servia\", \"48\": \"montenegro\", \"49\": \"albania\", \"50\": \"macedonia\", \"51\": \"grecia\", \"52\": \"bulgaria\", \"53\": \"romenia\", \"54\": \"moldavia\", \"55\": \"ucrania\", \"56\": \"bielorrussia\", \"57\": \"lituania\", \"58\": \"letonia\", \"59\": \"estonia\", \"60\": \"rusia\", \"61\": \"turquia\", \"62\": \"georgia\", \"63\": \"armenia\", \"64\": \"azerbaijao\", \"65\": \"cazaquistao\", \"66\": \"turquemenistao\", \"67\": \"uzbequistao\", \"68\": \"quirguistao\", \"69\": \"tadjiquistao\", \"70\": \"afeganistao\", \"71\": \"paquistao\", \"72\": \"nepal\", \"73\": \"butao\", \"74\": \"bangladesh\", \"75\": \"sri\", \"76\": \"lanka\", \"77\": \"maldivas\", \"78\": \"mongolia\", \"79\": \"filipinas\", \"80\": \"indonesia\", \"81\": \"malasia\", \"82\": \"singapura\", \"83\": \"brunei\", \"84\": \"vietna\", \"85\": \"laos\", \"86\": \"camboja\", \"87\": \"myanmar\", \"88\": \"zelandia\", \"89\": \"papua\", \"90\": \"guine\", \"91\": \"fiji\", \"92\": \"salomao\", \"93\": \"vanuatu\", \"94\": \"micronesia\", \"95\": \"marshall\", \"96\": \"kiribati\", \"97\": \"samoa\", \"98\": \"tonga\", \"99\": \"tuvalu\", \"100\": \"nauru\"}", "word_index": "{\"capital\": 1, \"do\": 2, \"sul\": 3, \"coreia\": 4, \"norte\": 5, \"nova\": 6, \"ilhas\": 7, \"portugal\": 8, \"brasil\": 9, \"franca\": 10, \"espanha\": 11, \"alemanha\": 12, \"italia\": 13, \"inglaterra\": 14, \"estados\": 15, \"unidos\": 16, \"russia\": 17, \"japao\": 18, \"china\": 19, \"canada\": 20, \"australia\": 21, \"mexico\": 22, \"argentina\": 23, \"africa\": 24, \"india\": 25, \"aravia\": 26, \"saudita\": 27, \"egito\": 28, \"tailandia\": 29, \"suecia\": 30, \"noruega\": 31, \"dinamarca\": 32, \"finlandia\": 33, \"holanda\": 34, \"belgica\": 35, \"luxemburgo\": 36, \"polonia\": 37, \"republica\": 38, \"checa\": 39, \"hungria\": 40, \"eslovaquia\": 41, \"eslovenia\": 42, \"croacia\": 43, \"bosnia\": 44, \"e\": 45, \"herzegovina\": 46, \"servia\": 47, \"montenegro\": 48, \"albania\": 49, \"macedonia\": 50, \"grecia\": 51, \"bulgaria\": 52, \"romenia\": 53, \"moldavia\": 54, \"ucrania\": 55, \"bielorrussia\": 56, \"lituania\": 57, \"letonia\": 58, \"estonia\": 59, \"rusia\": 60, \"turquia\": 61, \"georgia\": 62, \"armenia\": 63, \"azerbaijao\": 64, \"cazaquistao\": 65, \"turquemenistao\": 66, \"uzbequistao\": 67, \"quirguistao\": 68, \"tadjiquistao\": 69, \"afeganistao\": 70, \"paquistao\": 71, \"nepal\": 72, \"butao\": 73, \"bangladesh\": 74, \"sri\": 75, \"lanka\": 76, \"maldivas\": 77, \"mongolia\": 78, \"filipinas\": 79, \"indonesia\": 80, \"malasia\": 81, \"singapura\": 82, \"brunei\": 83, \"vietna\": 84, \"laos\": 85, \"camboja\": 86, \"myanmar\": 87, \"zelandia\": 88, \"papua\": 89, \"guine\": 90, \"fiji\": 91, \"salomao\": 92, \"vanuatu\": 93, \"micronesia\": 94, \"marshall\": 95, \"kiribati\": 96, \"samoa\": 97, \"tonga\": 98, \"tuvalu\": 99, \"nauru\": 100}"}} \ No newline at end of file diff --git a/models/capitals_T-1a.pkl b/models/capitals_T-1a.pkl new file mode 100644 index 0000000..28c04b6 Binary files /dev/null and b/models/capitals_T-1a.pkl differ diff --git a/models/history-1a.h5 b/models/history-1a.h5 new file mode 100644 index 0000000..cb0304b Binary files /dev/null and b/models/history-1a.h5 differ diff --git a/models/history_T-1a.json b/models/history_T-1a.json new file mode 100644 index 0000000..8e5f824 --- /dev/null +++ b/models/history_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 45, "word_counts": "{\"antigo\": 1, \"egito\": 1, \"imperio\": 1, \"romano\": 1, \"idade\": 1, \"media\": 1, \"renascimento\": 1, \"revolucao\": 14, \"cientifica\": 1, \"industrial\": 5, \"francesa\": 1, \"guerra\": 6, \"independencia\": 3, \"estados\": 4, \"unidos\": 4, \"russa\": 1, \"primeira\": 1, \"mundial\": 2, \"segunda\": 1, \"fria\": 1, \"descolonizacao\": 1, \"apartheid\": 3, \"vietna\": 1, \"movimento\": 4, \"pelos\": 2, \"direitos\": 5, \"civis\": 4, \"crise\": 2, \"dos\": 6, \"misseis\": 2, \"cuba\": 1, \"no\": 5, \"queda\": 1, \"muro\": 1, \"berlim\": 1, \"cultural\": 2, \"chinesa\": 1, \"nos\": 2, \"golpe\": 1, \"estado\": 1, \"chile\": 1, \"inglaterra\": 1, \"declaracao\": 1, \"universal\": 1, \"humanos\": 1, \"cortina\": 1, \"ferro\": 1, \"ira\": 1, \"massacre\": 1, \"nanquim\": 1, \"cubana\": 1, \"mexicana\": 1, \"india\": 1, \"1962\": 1, \"marcha\": 1, \"sobre\": 1, \"washington\": 1, \"por\": 1, \"trabalho\": 1, \"liberdade\": 1, \"canada\": 1, \"secessao\": 1, \"iraniana\": 1, \"africa\": 1, \"sul\": 1, \"chegada\": 1, \"homem\": 1, \"a\": 1, \"lua\": 1, \"invencao\": 1, \"lampada\": 1, \"eletrica\": 1, \"nascimento\": 1, \"expansao\": 1, \"islamismo\": 1, \"alemanha\": 1, \"meiji\": 1, \"japao\": 1, \"franca\": 1, \"tratado\": 1, \"versalhes\": 1}", "word_docs": "{\"antigo\": 1, \"egito\": 1, \"imperio\": 1, \"romano\": 1, \"media\": 1, \"idade\": 1, \"renascimento\": 1, \"cientifica\": 1, \"revolucao\": 14, \"industrial\": 5, \"francesa\": 1, \"estados\": 4, \"independencia\": 3, \"guerra\": 6, \"unidos\": 4, \"russa\": 1, \"mundial\": 2, \"primeira\": 1, \"segunda\": 1, \"fria\": 1, \"descolonizacao\": 1, \"apartheid\": 3, \"vietna\": 1, \"direitos\": 5, \"civis\": 4, \"movimento\": 4, \"pelos\": 2, \"cuba\": 1, \"misseis\": 2, \"dos\": 6, \"crise\": 2, \"no\": 5, \"muro\": 1, \"berlim\": 1, \"queda\": 1, \"cultural\": 2, \"chinesa\": 1, \"nos\": 2, \"chile\": 1, \"golpe\": 1, \"estado\": 1, \"inglaterra\": 1, \"declaracao\": 1, \"universal\": 1, \"humanos\": 1, \"ferro\": 1, \"cortina\": 1, \"ira\": 1, \"massacre\": 1, \"nanquim\": 1, \"cubana\": 1, \"mexicana\": 1, \"india\": 1, \"1962\": 1, \"liberdade\": 1, \"trabalho\": 1, \"sobre\": 1, \"marcha\": 1, \"por\": 1, \"washington\": 1, \"canada\": 1, \"secessao\": 1, \"iraniana\": 1, \"sul\": 1, \"africa\": 1, \"chegada\": 1, \"homem\": 1, \"a\": 1, \"lua\": 1, \"lampada\": 1, \"invencao\": 1, \"eletrica\": 1, \"nascimento\": 1, \"expansao\": 1, \"islamismo\": 1, \"alemanha\": 1, \"japao\": 1, \"meiji\": 1, \"franca\": 1, \"versalhes\": 1, \"tratado\": 1}", "index_docs": "{\"19\": 1, \"20\": 1, \"21\": 1, \"22\": 1, \"24\": 1, \"23\": 1, \"25\": 1, \"26\": 1, \"1\": 14, \"4\": 5, \"27\": 1, \"7\": 4, \"11\": 3, \"2\": 6, \"8\": 4, \"28\": 1, \"13\": 2, \"29\": 1, \"30\": 1, \"31\": 1, \"32\": 1, \"12\": 3, \"33\": 1, \"5\": 5, \"10\": 4, \"9\": 4, \"14\": 2, \"34\": 1, \"16\": 2, \"3\": 6, \"15\": 2, \"6\": 5, \"36\": 1, \"37\": 1, \"35\": 1, \"17\": 2, \"38\": 1, \"18\": 2, \"41\": 1, \"39\": 1, \"40\": 1, \"42\": 1, \"43\": 1, \"44\": 1, \"45\": 1, \"47\": 1, \"46\": 1, \"48\": 1, \"49\": 1, \"50\": 1, \"51\": 1, \"52\": 1, \"53\": 1, \"54\": 1, \"60\": 1, \"59\": 1, \"56\": 1, \"55\": 1, \"58\": 1, \"57\": 1, \"61\": 1, \"62\": 1, \"63\": 1, \"65\": 1, \"64\": 1, \"66\": 1, \"67\": 1, \"68\": 1, \"69\": 1, \"71\": 1, \"70\": 1, \"72\": 1, \"73\": 1, \"74\": 1, \"75\": 1, \"76\": 1, \"78\": 1, \"77\": 1, \"79\": 1, \"81\": 1, \"80\": 1}", "index_word": "{\"1\": \"revolucao\", \"2\": \"guerra\", \"3\": \"dos\", \"4\": \"industrial\", \"5\": \"direitos\", \"6\": \"no\", \"7\": \"estados\", \"8\": \"unidos\", \"9\": \"movimento\", \"10\": \"civis\", \"11\": \"independencia\", \"12\": \"apartheid\", \"13\": \"mundial\", \"14\": \"pelos\", \"15\": \"crise\", \"16\": \"misseis\", \"17\": \"cultural\", \"18\": \"nos\", \"19\": \"antigo\", \"20\": \"egito\", \"21\": \"imperio\", \"22\": \"romano\", \"23\": \"idade\", \"24\": \"media\", \"25\": \"renascimento\", \"26\": \"cientifica\", \"27\": \"francesa\", \"28\": \"russa\", \"29\": \"primeira\", \"30\": \"segunda\", \"31\": \"fria\", \"32\": \"descolonizacao\", \"33\": \"vietna\", \"34\": \"cuba\", \"35\": \"queda\", \"36\": \"muro\", \"37\": \"berlim\", \"38\": \"chinesa\", \"39\": \"golpe\", \"40\": \"estado\", \"41\": \"chile\", \"42\": \"inglaterra\", \"43\": \"declaracao\", \"44\": \"universal\", \"45\": \"humanos\", \"46\": \"cortina\", \"47\": \"ferro\", \"48\": \"ira\", \"49\": \"massacre\", \"50\": \"nanquim\", \"51\": \"cubana\", \"52\": \"mexicana\", \"53\": \"india\", \"54\": \"1962\", \"55\": \"marcha\", \"56\": \"sobre\", \"57\": \"washington\", \"58\": \"por\", \"59\": \"trabalho\", \"60\": \"liberdade\", \"61\": \"canada\", \"62\": \"secessao\", \"63\": \"iraniana\", \"64\": \"africa\", \"65\": \"sul\", \"66\": \"chegada\", \"67\": \"homem\", \"68\": \"a\", \"69\": \"lua\", \"70\": \"invencao\", \"71\": \"lampada\", \"72\": \"eletrica\", \"73\": \"nascimento\", \"74\": \"expansao\", \"75\": \"islamismo\", \"76\": \"alemanha\", \"77\": \"meiji\", \"78\": \"japao\", \"79\": \"franca\", \"80\": \"tratado\", \"81\": \"versalhes\"}", "word_index": "{\"revolucao\": 1, \"guerra\": 2, \"dos\": 3, \"industrial\": 4, \"direitos\": 5, \"no\": 6, \"estados\": 7, \"unidos\": 8, \"movimento\": 9, \"civis\": 10, \"independencia\": 11, \"apartheid\": 12, \"mundial\": 13, \"pelos\": 14, \"crise\": 15, \"misseis\": 16, \"cultural\": 17, \"nos\": 18, \"antigo\": 19, \"egito\": 20, \"imperio\": 21, \"romano\": 22, \"idade\": 23, \"media\": 24, \"renascimento\": 25, \"cientifica\": 26, \"francesa\": 27, \"russa\": 28, \"primeira\": 29, \"segunda\": 30, \"fria\": 31, \"descolonizacao\": 32, \"vietna\": 33, \"cuba\": 34, \"queda\": 35, \"muro\": 36, \"berlim\": 37, \"chinesa\": 38, \"golpe\": 39, \"estado\": 40, \"chile\": 41, \"inglaterra\": 42, \"declaracao\": 43, \"universal\": 44, \"humanos\": 45, \"cortina\": 46, \"ferro\": 47, \"ira\": 48, \"massacre\": 49, \"nanquim\": 50, \"cubana\": 51, \"mexicana\": 52, \"india\": 53, \"1962\": 54, \"marcha\": 55, \"sobre\": 56, \"washington\": 57, \"por\": 58, \"trabalho\": 59, \"liberdade\": 60, \"canada\": 61, \"secessao\": 62, \"iraniana\": 63, \"africa\": 64, \"sul\": 65, \"chegada\": 66, \"homem\": 67, \"a\": 68, \"lua\": 69, \"invencao\": 70, \"lampada\": 71, \"eletrica\": 72, \"nascimento\": 73, \"expansao\": 74, \"islamismo\": 75, \"alemanha\": 76, \"meiji\": 77, \"japao\": 78, \"franca\": 79, \"tratado\": 80, \"versalhes\": 81}"}} \ No newline at end of file diff --git a/models/history_T-1a.pkl b/models/history_T-1a.pkl new file mode 100644 index 0000000..196bc89 Binary files /dev/null and b/models/history_T-1a.pkl differ diff --git a/models/history_pt-1a.h5 b/models/history_pt-1a.h5 new file mode 100644 index 0000000..64da127 Binary files /dev/null and b/models/history_pt-1a.h5 differ diff --git a/models/history_pt_T-1a.json b/models/history_pt_T-1a.json new file mode 100644 index 0000000..7de4226 --- /dev/null +++ b/models/history_pt_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 55, "word_counts": "{\"rei\": 6, \"d\": 12, \"afonso\": 3, \"henriques\": 1, \"rainha\": 6, \"leonor\": 2, \"teles\": 1, \"presidente\": 11, \"ramalho\": 2, \"eanes\": 3, \"explorador\": 7, \"bartolomeu\": 2, \"dias\": 2, \"poeta\": 3, \"camoes\": 1, \"jorge\": 1, \"sampaio\": 1, \"escritor\": 11, \"eca\": 1, \"de\": 4, \"queiroz\": 1, \"gaspar\": 1, \"corte\": 1, \"real\": 1, \"fernao\": 2, \"lopes\": 1, \"marcelo\": 1, \"rebelo\": 1, \"sousa\": 1, \"bocage\": 1, \"navegador\": 8, \"diogo\": 1, \"cao\": 2, \"camilo\": 1, \"castelo\": 1, \"branco\": 1, \"pedro\": 3, \"nunes\": 1, \"vasco\": 2, \"da\": 1, \"gama\": 2, \"almeida\": 2, \"garrett\": 1, \"antonio\": 3, \"aragao\": 1, \"magalhaes\": 1, \"oliveira\": 2, \"salazar\": 2, \"sophia\": 2, \"mello\": 2, \"breyner\": 2, \"gil\": 1, \"joao\": 1, \"ii\": 2, \"catarina\": 2, \"braganca\": 1, \"sidonio\": 1, \"pais\": 1, \"jose\": 1, \"saramago\": 1, \"alvares\": 2, \"cabral\": 2, \"poetisa\": 2, \"florbela\": 1, \"espanca\": 1, \"manuel\": 3, \"julio\": 1, \"dinis\": 1, \"amelia\": 1, \"teofilo\": 1, \"braga\": 1, \"alfredo\": 1, \"keil\": 1, \"arriaga\": 1, \"miguel\": 1, \"torga\": 1, \"tristao\": 2, \"vaz\": 1, \"teixeira\": 1, \"fernando\": 1, \"pessoa\": 1, \"iii\": 1, \"austria\": 1, \"francisco\": 1, \"costa\": 1, \"gomes\": 1, \"pero\": 1, \"alenquer\": 1, \"negreiros\": 1, \"i\": 1, \"beatriz\": 1, \"castela\": 1, \"oscar\": 1, \"carmona\": 1, \"mario\": 1, \"sa\": 1, \"carneiro\": 1, \"nuno\": 1, \"andresen\": 1, \"iv\": 1, \"bernardino\": 1, \"machado\": 1}", "word_docs": "{\"d\": 12, \"afonso\": 3, \"henriques\": 1, \"rei\": 6, \"teles\": 1, \"leonor\": 2, \"rainha\": 6, \"eanes\": 3, \"ramalho\": 2, \"presidente\": 11, \"dias\": 2, \"bartolomeu\": 2, \"explorador\": 7, \"camoes\": 1, \"poeta\": 3, \"sampaio\": 1, \"jorge\": 1, \"eca\": 1, \"de\": 4, \"escritor\": 11, \"queiroz\": 1, \"gaspar\": 1, \"corte\": 1, \"real\": 1, \"fernao\": 2, \"lopes\": 1, \"sousa\": 1, \"marcelo\": 1, \"rebelo\": 1, \"bocage\": 1, \"diogo\": 1, \"navegador\": 8, \"cao\": 2, \"camilo\": 1, \"castelo\": 1, \"branco\": 1, \"nunes\": 1, \"pedro\": 3, \"vasco\": 2, \"gama\": 2, \"da\": 1, \"garrett\": 1, \"almeida\": 2, \"antonio\": 3, \"aragao\": 1, \"magalhaes\": 1, \"oliveira\": 2, \"salazar\": 2, \"sophia\": 2, \"breyner\": 2, \"mello\": 2, \"gil\": 1, \"ii\": 2, \"joao\": 1, \"catarina\": 2, \"braganca\": 1, \"pais\": 1, \"sidonio\": 1, \"jose\": 1, \"saramago\": 1, \"alvares\": 2, \"cabral\": 2, \"poetisa\": 2, \"florbela\": 1, \"espanca\": 1, \"manuel\": 3, \"julio\": 1, \"dinis\": 1, \"amelia\": 1, \"braga\": 1, \"teofilo\": 1, \"keil\": 1, \"alfredo\": 1, \"arriaga\": 1, \"torga\": 1, \"miguel\": 1, \"teixeira\": 1, \"tristao\": 2, \"vaz\": 1, \"pessoa\": 1, \"fernando\": 1, \"iii\": 1, \"austria\": 1, \"gomes\": 1, \"francisco\": 1, \"costa\": 1, \"alenquer\": 1, \"pero\": 1, \"negreiros\": 1, \"i\": 1, \"castela\": 1, \"beatriz\": 1, \"oscar\": 1, \"carmona\": 1, \"sa\": 1, \"mario\": 1, \"carneiro\": 1, \"nuno\": 1, \"andresen\": 1, \"iv\": 1, \"bernardino\": 1, \"machado\": 1}", "index_docs": "{\"1\": 12, \"9\": 3, \"35\": 1, \"6\": 6, \"36\": 1, \"15\": 2, \"7\": 6, \"10\": 3, \"16\": 2, \"2\": 11, \"18\": 2, \"17\": 2, \"5\": 7, \"37\": 1, \"11\": 3, \"39\": 1, \"38\": 1, \"40\": 1, \"8\": 4, \"3\": 11, \"41\": 1, \"42\": 1, \"43\": 1, \"44\": 1, \"19\": 2, \"45\": 1, \"48\": 1, \"46\": 1, \"47\": 1, \"49\": 1, \"50\": 1, \"4\": 8, \"20\": 2, \"51\": 1, \"52\": 1, \"53\": 1, \"54\": 1, \"12\": 3, \"21\": 2, \"22\": 2, \"55\": 1, \"56\": 1, \"23\": 2, \"13\": 3, \"57\": 1, \"58\": 1, \"24\": 2, \"25\": 2, \"26\": 2, \"28\": 2, \"27\": 2, \"59\": 1, \"29\": 2, \"60\": 1, \"30\": 2, \"61\": 1, \"63\": 1, \"62\": 1, \"64\": 1, \"65\": 1, \"31\": 2, \"32\": 2, \"33\": 2, \"66\": 1, \"67\": 1, \"14\": 3, \"68\": 1, \"69\": 1, \"70\": 1, \"72\": 1, \"71\": 1, \"74\": 1, \"73\": 1, \"75\": 1, \"77\": 1, \"76\": 1, \"79\": 1, \"34\": 2, \"78\": 1, \"81\": 1, \"80\": 1, \"82\": 1, \"83\": 1, \"86\": 1, \"84\": 1, \"85\": 1, \"88\": 1, \"87\": 1, \"89\": 1, \"90\": 1, \"92\": 1, \"91\": 1, \"93\": 1, \"94\": 1, \"96\": 1, \"95\": 1, \"97\": 1, \"98\": 1, \"99\": 1, \"100\": 1, \"101\": 1, \"102\": 1}", "index_word": "{\"1\": \"d\", \"2\": \"presidente\", \"3\": \"escritor\", \"4\": \"navegador\", \"5\": \"explorador\", \"6\": \"rei\", \"7\": \"rainha\", \"8\": \"de\", \"9\": \"afonso\", \"10\": \"eanes\", \"11\": \"poeta\", \"12\": \"pedro\", \"13\": \"antonio\", \"14\": \"manuel\", \"15\": \"leonor\", \"16\": \"ramalho\", \"17\": \"bartolomeu\", \"18\": \"dias\", \"19\": \"fernao\", \"20\": \"cao\", \"21\": \"vasco\", \"22\": \"gama\", \"23\": \"almeida\", \"24\": \"oliveira\", \"25\": \"salazar\", \"26\": \"sophia\", \"27\": \"mello\", \"28\": \"breyner\", \"29\": \"ii\", \"30\": \"catarina\", \"31\": \"alvares\", \"32\": \"cabral\", \"33\": \"poetisa\", \"34\": \"tristao\", \"35\": \"henriques\", \"36\": \"teles\", \"37\": \"camoes\", \"38\": \"jorge\", \"39\": \"sampaio\", \"40\": \"eca\", \"41\": \"queiroz\", \"42\": \"gaspar\", \"43\": \"corte\", \"44\": \"real\", \"45\": \"lopes\", \"46\": \"marcelo\", \"47\": \"rebelo\", \"48\": \"sousa\", \"49\": \"bocage\", \"50\": \"diogo\", \"51\": \"camilo\", \"52\": \"castelo\", \"53\": \"branco\", \"54\": \"nunes\", \"55\": \"da\", \"56\": \"garrett\", \"57\": \"aragao\", \"58\": \"magalhaes\", \"59\": \"gil\", \"60\": \"joao\", \"61\": \"braganca\", \"62\": \"sidonio\", \"63\": \"pais\", \"64\": \"jose\", \"65\": \"saramago\", \"66\": \"florbela\", \"67\": \"espanca\", \"68\": \"julio\", \"69\": \"dinis\", \"70\": \"amelia\", \"71\": \"teofilo\", \"72\": \"braga\", \"73\": \"alfredo\", \"74\": \"keil\", \"75\": \"arriaga\", \"76\": \"miguel\", \"77\": \"torga\", \"78\": \"vaz\", \"79\": \"teixeira\", \"80\": \"fernando\", \"81\": \"pessoa\", \"82\": \"iii\", \"83\": \"austria\", \"84\": \"francisco\", \"85\": \"costa\", \"86\": \"gomes\", \"87\": \"pero\", \"88\": \"alenquer\", \"89\": \"negreiros\", \"90\": \"i\", \"91\": \"beatriz\", \"92\": \"castela\", \"93\": \"oscar\", \"94\": \"carmona\", \"95\": \"mario\", \"96\": \"sa\", \"97\": \"carneiro\", \"98\": \"nuno\", \"99\": \"andresen\", \"100\": \"iv\", \"101\": \"bernardino\", \"102\": \"machado\"}", "word_index": "{\"d\": 1, \"presidente\": 2, \"escritor\": 3, \"navegador\": 4, \"explorador\": 5, \"rei\": 6, \"rainha\": 7, \"de\": 8, \"afonso\": 9, \"eanes\": 10, \"poeta\": 11, \"pedro\": 12, \"antonio\": 13, \"manuel\": 14, \"leonor\": 15, \"ramalho\": 16, \"bartolomeu\": 17, \"dias\": 18, \"fernao\": 19, \"cao\": 20, \"vasco\": 21, \"gama\": 22, \"almeida\": 23, \"oliveira\": 24, \"salazar\": 25, \"sophia\": 26, \"mello\": 27, \"breyner\": 28, \"ii\": 29, \"catarina\": 30, \"alvares\": 31, \"cabral\": 32, \"poetisa\": 33, \"tristao\": 34, \"henriques\": 35, \"teles\": 36, \"camoes\": 37, \"jorge\": 38, \"sampaio\": 39, \"eca\": 40, \"queiroz\": 41, \"gaspar\": 42, \"corte\": 43, \"real\": 44, \"lopes\": 45, \"marcelo\": 46, \"rebelo\": 47, \"sousa\": 48, \"bocage\": 49, \"diogo\": 50, \"camilo\": 51, \"castelo\": 52, \"branco\": 53, \"nunes\": 54, \"da\": 55, \"garrett\": 56, \"aragao\": 57, \"magalhaes\": 58, \"gil\": 59, \"joao\": 60, \"braganca\": 61, \"sidonio\": 62, \"pais\": 63, \"jose\": 64, \"saramago\": 65, \"florbela\": 66, \"espanca\": 67, \"julio\": 68, \"dinis\": 69, \"amelia\": 70, \"teofilo\": 71, \"braga\": 72, \"alfredo\": 73, \"keil\": 74, \"arriaga\": 75, \"miguel\": 76, \"torga\": 77, \"vaz\": 78, \"teixeira\": 79, \"fernando\": 80, \"pessoa\": 81, \"iii\": 82, \"austria\": 83, \"francisco\": 84, \"costa\": 85, \"gomes\": 86, \"pero\": 87, \"alenquer\": 88, \"negreiros\": 89, \"i\": 90, \"beatriz\": 91, \"castela\": 92, \"oscar\": 93, \"carmona\": 94, \"mario\": 95, \"sa\": 96, \"carneiro\": 97, \"nuno\": 98, \"andresen\": 99, \"iv\": 100, \"bernardino\": 101, \"machado\": 102}"}} \ No newline at end of file diff --git a/models/history_pt_T-1a.pkl b/models/history_pt_T-1a.pkl new file mode 100644 index 0000000..be8b8ae Binary files /dev/null and b/models/history_pt_T-1a.pkl differ diff --git a/models/populacion-1a.h5 b/models/populacion-1a.h5 new file mode 100644 index 0000000..4e00672 Binary files /dev/null and b/models/populacion-1a.h5 differ diff --git a/models/populacion_T-1a.json b/models/populacion_T-1a.json new file mode 100644 index 0000000..41fbd40 --- /dev/null +++ b/models/populacion_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 64, "word_counts": "{\"populacao\": 64, \"portugal\": 1, \"brasil\": 1, \"franca\": 1, \"espanha\": 1, \"alemanha\": 1, \"italia\": 1, \"grecia\": 1, \"suica\": 1, \"suecia\": 1, \"noruega\": 1, \"dinamarca\": 1, \"finlandia\": 1, \"holanda\": 1, \"belgica\": 1, \"luxemburgo\": 1, \"polonia\": 1, \"republica\": 1, \"checa\": 1, \"hungria\": 1, \"eslovaquia\": 1, \"eslovenia\": 1, \"croacia\": 1, \"bosnia\": 1, \"e\": 1, \"herzegovina\": 1, \"servia\": 1, \"montenegro\": 1, \"albania\": 1, \"macedonia\": 1, \"do\": 1, \"norte\": 1, \"bulgaria\": 1, \"romenia\": 1, \"moldavia\": 1, \"ucrania\": 1, \"bielorrussia\": 1, \"lituania\": 1, \"letonia\": 1, \"estonia\": 1, \"rusia\": 1, \"turquia\": 1, \"georgia\": 1, \"armenia\": 1, \"azerbaijao\": 1, \"cazaquistao\": 1, \"turquemenistao\": 1, \"uzbequistao\": 1, \"quirguistao\": 1, \"tadjiquistao\": 1, \"afeganistao\": 1, \"paquistao\": 1, \"india\": 1, \"nepal\": 1, \"bangladesh\": 1, \"sri\": 1, \"lanka\": 1, \"maldivas\": 1, \"australia\": 1, \"nova\": 2, \"zelandia\": 1, \"papua\": 1, \"guine\": 1, \"fiji\": 1, \"ilhas\": 2, \"salomao\": 1, \"vanuatu\": 1, \"micronesia\": 1, \"marshall\": 1, \"kiribati\": 1, \"samoa\": 1, \"tonga\": 1, \"tuvalu\": 1, \"nauru\": 1}", "word_docs": "{\"populacao\": 64, \"portugal\": 1, \"brasil\": 1, \"franca\": 1, \"espanha\": 1, \"alemanha\": 1, \"italia\": 1, \"grecia\": 1, \"suica\": 1, \"suecia\": 1, \"noruega\": 1, \"dinamarca\": 1, \"finlandia\": 1, \"holanda\": 1, \"belgica\": 1, \"luxemburgo\": 1, \"polonia\": 1, \"checa\": 1, \"republica\": 1, \"hungria\": 1, \"eslovaquia\": 1, \"eslovenia\": 1, \"croacia\": 1, \"e\": 1, \"herzegovina\": 1, \"bosnia\": 1, \"servia\": 1, \"montenegro\": 1, \"albania\": 1, \"macedonia\": 1, \"do\": 1, \"norte\": 1, \"bulgaria\": 1, \"romenia\": 1, \"moldavia\": 1, \"ucrania\": 1, \"bielorrussia\": 1, \"lituania\": 1, \"letonia\": 1, \"estonia\": 1, \"rusia\": 1, \"turquia\": 1, \"georgia\": 1, \"armenia\": 1, \"azerbaijao\": 1, \"cazaquistao\": 1, \"turquemenistao\": 1, \"uzbequistao\": 1, \"quirguistao\": 1, \"tadjiquistao\": 1, \"afeganistao\": 1, \"paquistao\": 1, \"india\": 1, \"nepal\": 1, \"bangladesh\": 1, \"sri\": 1, \"lanka\": 1, \"maldivas\": 1, \"australia\": 1, \"nova\": 2, \"zelandia\": 1, \"papua\": 1, \"guine\": 1, \"fiji\": 1, \"salomao\": 1, \"ilhas\": 2, \"vanuatu\": 1, \"micronesia\": 1, \"marshall\": 1, \"kiribati\": 1, \"samoa\": 1, \"tonga\": 1, \"tuvalu\": 1, \"nauru\": 1}", "index_docs": "{\"1\": 64, \"4\": 1, \"5\": 1, \"6\": 1, \"7\": 1, \"8\": 1, \"9\": 1, \"10\": 1, \"11\": 1, \"12\": 1, \"13\": 1, \"14\": 1, \"15\": 1, \"16\": 1, \"17\": 1, \"18\": 1, \"19\": 1, \"21\": 1, \"20\": 1, \"22\": 1, \"23\": 1, \"24\": 1, \"25\": 1, \"27\": 1, \"28\": 1, \"26\": 1, \"29\": 1, \"30\": 1, \"31\": 1, \"32\": 1, \"33\": 1, \"34\": 1, \"35\": 1, \"36\": 1, \"37\": 1, \"38\": 1, \"39\": 1, \"40\": 1, \"41\": 1, \"42\": 1, \"43\": 1, \"44\": 1, \"45\": 1, \"46\": 1, \"47\": 1, \"48\": 1, \"49\": 1, \"50\": 1, \"51\": 1, \"52\": 1, \"53\": 1, \"54\": 1, \"55\": 1, \"56\": 1, \"57\": 1, \"58\": 1, \"59\": 1, \"60\": 1, \"61\": 1, \"2\": 2, \"62\": 1, \"63\": 1, \"64\": 1, \"65\": 1, \"66\": 1, \"3\": 2, \"67\": 1, \"68\": 1, \"69\": 1, \"70\": 1, \"71\": 1, \"72\": 1, \"73\": 1, \"74\": 1}", "index_word": "{\"1\": \"populacao\", \"2\": \"nova\", \"3\": \"ilhas\", \"4\": \"portugal\", \"5\": \"brasil\", \"6\": \"franca\", \"7\": \"espanha\", \"8\": \"alemanha\", \"9\": \"italia\", \"10\": \"grecia\", \"11\": \"suica\", \"12\": \"suecia\", \"13\": \"noruega\", \"14\": \"dinamarca\", \"15\": \"finlandia\", \"16\": \"holanda\", \"17\": \"belgica\", \"18\": \"luxemburgo\", \"19\": \"polonia\", \"20\": \"republica\", \"21\": \"checa\", \"22\": \"hungria\", \"23\": \"eslovaquia\", \"24\": \"eslovenia\", \"25\": \"croacia\", \"26\": \"bosnia\", \"27\": \"e\", \"28\": \"herzegovina\", \"29\": \"servia\", \"30\": \"montenegro\", \"31\": \"albania\", \"32\": \"macedonia\", \"33\": \"do\", \"34\": \"norte\", \"35\": \"bulgaria\", \"36\": \"romenia\", \"37\": \"moldavia\", \"38\": \"ucrania\", \"39\": \"bielorrussia\", \"40\": \"lituania\", \"41\": \"letonia\", \"42\": \"estonia\", \"43\": \"rusia\", \"44\": \"turquia\", \"45\": \"georgia\", \"46\": \"armenia\", \"47\": \"azerbaijao\", \"48\": \"cazaquistao\", \"49\": \"turquemenistao\", \"50\": \"uzbequistao\", \"51\": \"quirguistao\", \"52\": \"tadjiquistao\", \"53\": \"afeganistao\", \"54\": \"paquistao\", \"55\": \"india\", \"56\": \"nepal\", \"57\": \"bangladesh\", \"58\": \"sri\", \"59\": \"lanka\", \"60\": \"maldivas\", \"61\": \"australia\", \"62\": \"zelandia\", \"63\": \"papua\", \"64\": \"guine\", \"65\": \"fiji\", \"66\": \"salomao\", \"67\": \"vanuatu\", \"68\": \"micronesia\", \"69\": \"marshall\", \"70\": \"kiribati\", \"71\": \"samoa\", \"72\": \"tonga\", \"73\": \"tuvalu\", \"74\": \"nauru\"}", "word_index": "{\"populacao\": 1, \"nova\": 2, \"ilhas\": 3, \"portugal\": 4, \"brasil\": 5, \"franca\": 6, \"espanha\": 7, \"alemanha\": 8, \"italia\": 9, \"grecia\": 10, \"suica\": 11, \"suecia\": 12, \"noruega\": 13, \"dinamarca\": 14, \"finlandia\": 15, \"holanda\": 16, \"belgica\": 17, \"luxemburgo\": 18, \"polonia\": 19, \"republica\": 20, \"checa\": 21, \"hungria\": 22, \"eslovaquia\": 23, \"eslovenia\": 24, \"croacia\": 25, \"bosnia\": 26, \"e\": 27, \"herzegovina\": 28, \"servia\": 29, \"montenegro\": 30, \"albania\": 31, \"macedonia\": 32, \"do\": 33, \"norte\": 34, \"bulgaria\": 35, \"romenia\": 36, \"moldavia\": 37, \"ucrania\": 38, \"bielorrussia\": 39, \"lituania\": 40, \"letonia\": 41, \"estonia\": 42, \"rusia\": 43, \"turquia\": 44, \"georgia\": 45, \"armenia\": 46, \"azerbaijao\": 47, \"cazaquistao\": 48, \"turquemenistao\": 49, \"uzbequistao\": 50, \"quirguistao\": 51, \"tadjiquistao\": 52, \"afeganistao\": 53, \"paquistao\": 54, \"india\": 55, \"nepal\": 56, \"bangladesh\": 57, \"sri\": 58, \"lanka\": 59, \"maldivas\": 60, \"australia\": 61, \"zelandia\": 62, \"papua\": 63, \"guine\": 64, \"fiji\": 65, \"salomao\": 66, \"vanuatu\": 67, \"micronesia\": 68, \"marshall\": 69, \"kiribati\": 70, \"samoa\": 71, \"tonga\": 72, \"tuvalu\": 73, \"nauru\": 74}"}} \ No newline at end of file diff --git a/models/populacion_T-1a.pkl b/models/populacion_T-1a.pkl new file mode 100644 index 0000000..3cb4d11 Binary files /dev/null and b/models/populacion_T-1a.pkl differ diff --git a/models/science-1a.h5 b/models/science-1a.h5 new file mode 100644 index 0000000..32cebca Binary files /dev/null and b/models/science-1a.h5 differ diff --git a/models/science_T-1a.json b/models/science_T-1a.json new file mode 100644 index 0000000..26136a0 --- /dev/null +++ b/models/science_T-1a.json @@ -0,0 +1 @@ +{"class_name": "Tokenizer", "config": {"num_words": null, "filters": "", "lower": true, "split": " ", "char_level": false, "oov_token": null, "document_count": 34, "word_counts": "{\"teoria\": 6, \"relatividade\": 2, \"evolucao\": 2, \"genetica\": 2, \"astronomia\": 1, \"fisica\": 2, \"quantica\": 2, \"biologia\": 5, \"molecular\": 1, \"big\": 1, \"bang\": 1, \"engenharia\": 6, \"psicologia\": 1, \"neurociencia\": 1, \"geral\": 1, \"selecao\": 1, \"natural\": 1, \"quimica\": 1, \"organica\": 1, \"biotecnologia\": 1, \"geologia\": 1, \"gravidade\": 1, \"celular\": 1, \"energia\": 1, \"renovavel\": 1, \"marinha\": 1, \"informacao\": 1, \"civil\": 1, \"antropologia\": 1, \"astrofisica\": 1, \"eletrica\": 1, \"evolutiva\": 1, \"mecanica\": 2, \"ecologia\": 1, \"software\": 1, \"bioquimica\": 1, \"particulas\": 1, \"materiais\": 1, \"psiquiatria\": 1, \"desenvolvimento\": 1}", "word_docs": "{\"teoria\": 6, \"relatividade\": 2, \"evolucao\": 2, \"genetica\": 2, \"astronomia\": 1, \"quantica\": 2, \"fisica\": 2, \"biologia\": 5, \"molecular\": 1, \"big\": 1, \"bang\": 1, \"engenharia\": 6, \"psicologia\": 1, \"neurociencia\": 1, \"geral\": 1, \"selecao\": 1, \"natural\": 1, \"quimica\": 1, \"organica\": 1, \"biotecnologia\": 1, \"geologia\": 1, \"gravidade\": 1, \"celular\": 1, \"renovavel\": 1, \"energia\": 1, \"marinha\": 1, \"informacao\": 1, \"civil\": 1, \"antropologia\": 1, \"astrofisica\": 1, \"eletrica\": 1, \"evolutiva\": 1, \"mecanica\": 2, \"ecologia\": 1, \"software\": 1, \"bioquimica\": 1, \"particulas\": 1, \"materiais\": 1, \"psiquiatria\": 1, \"desenvolvimento\": 1}", "index_docs": "{\"1\": 6, \"4\": 2, \"5\": 2, \"6\": 2, \"10\": 1, \"8\": 2, \"7\": 2, \"3\": 5, \"11\": 1, \"12\": 1, \"13\": 1, \"2\": 6, \"14\": 1, \"15\": 1, \"16\": 1, \"17\": 1, \"18\": 1, \"19\": 1, \"20\": 1, \"21\": 1, \"22\": 1, \"23\": 1, \"24\": 1, \"26\": 1, \"25\": 1, \"27\": 1, \"28\": 1, \"29\": 1, \"30\": 1, \"31\": 1, \"32\": 1, \"33\": 1, \"9\": 2, \"34\": 1, \"35\": 1, \"36\": 1, \"37\": 1, \"38\": 1, \"39\": 1, \"40\": 1}", "index_word": "{\"1\": \"teoria\", \"2\": \"engenharia\", \"3\": \"biologia\", \"4\": \"relatividade\", \"5\": \"evolucao\", \"6\": \"genetica\", \"7\": \"fisica\", \"8\": \"quantica\", \"9\": \"mecanica\", \"10\": \"astronomia\", \"11\": \"molecular\", \"12\": \"big\", \"13\": \"bang\", \"14\": \"psicologia\", \"15\": \"neurociencia\", \"16\": \"geral\", \"17\": \"selecao\", \"18\": \"natural\", \"19\": \"quimica\", \"20\": \"organica\", \"21\": \"biotecnologia\", \"22\": \"geologia\", \"23\": \"gravidade\", \"24\": \"celular\", \"25\": \"energia\", \"26\": \"renovavel\", \"27\": \"marinha\", \"28\": \"informacao\", \"29\": \"civil\", \"30\": \"antropologia\", \"31\": \"astrofisica\", \"32\": \"eletrica\", \"33\": \"evolutiva\", \"34\": \"ecologia\", \"35\": \"software\", \"36\": \"bioquimica\", \"37\": \"particulas\", \"38\": \"materiais\", \"39\": \"psiquiatria\", \"40\": \"desenvolvimento\"}", "word_index": "{\"teoria\": 1, \"engenharia\": 2, \"biologia\": 3, \"relatividade\": 4, \"evolucao\": 5, \"genetica\": 6, \"fisica\": 7, \"quantica\": 8, \"mecanica\": 9, \"astronomia\": 10, \"molecular\": 11, \"big\": 12, \"bang\": 13, \"psicologia\": 14, \"neurociencia\": 15, \"geral\": 16, \"selecao\": 17, \"natural\": 18, \"quimica\": 19, \"organica\": 20, \"biotecnologia\": 21, \"geologia\": 22, \"gravidade\": 23, \"celular\": 24, \"energia\": 25, \"renovavel\": 26, \"marinha\": 27, \"informacao\": 28, \"civil\": 29, \"antropologia\": 30, \"astrofisica\": 31, \"eletrica\": 32, \"evolutiva\": 33, \"ecologia\": 34, \"software\": 35, \"bioquimica\": 36, \"particulas\": 37, \"materiais\": 38, \"psiquiatria\": 39, \"desenvolvimento\": 40}"}} \ No newline at end of file diff --git a/models/science_T-1a.pkl b/models/science_T-1a.pkl new file mode 100644 index 0000000..b1f854b Binary files /dev/null and b/models/science_T-1a.pkl differ diff --git a/requirements.txt b/requirements.txt new file mode 100644 index 0000000..c0a1c27 --- /dev/null +++ b/requirements.txt @@ -0,0 +1,5 @@ +nltk==3.8.1 +numpy==1.22.2 +tensorflow==2.11.0 +tensorflow_intel==2.11.0 +Unidecode==1.3.6 \ No newline at end of file diff --git a/version.txt b/version.txt new file mode 100644 index 0000000..d8ce05b --- /dev/null +++ b/version.txt @@ -0,0 +1 @@ +preview 1 \ No newline at end of file