Buscador rápido, preciso y apropiado para indexación distribuida
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
doc
herram
regr
.gitignore
CasosPrueba.hpp
Creditos.md
Dedicatoria.md
Derechos.md
Doc.cpp
Doc.hpp
DocCasoPrueba.cpp
DocCasoPrueba.hpp
Doxyfile
Elias.cpp
Elias.hpp
EliasCasoPrueba.cpp
EliasCasoPrueba.hpp
Instala.md
Makefile
NodoTrieS.cpp
NodoTrieS.hpp
NodoTrieSCasoPrueba.cpp
NodoTrieSCasoPrueba.hpp
Novedades.md
Operaciones.cpp
Operaciones.hpp
Pos.cpp
Pos.hpp
PosCasoPrueba.cpp
PosCasoPrueba.hpp
README.md
RamDisco.cpp
RamDisco.hpp
RamDiscoCasoPrueba.cpp
RamDiscoCasoPrueba.hpp
Tareas.md
TrieSDisco.cpp
TrieSDisco.hpp
TrieSDiscoCasoPrueba.cpp
TrieSDiscoCasoPrueba.hpp
buscador.cpp
comun.cpp
comun.hpp
comunCasoPrueba.cpp
comunCasoPrueba.hpp
conf.sh
confv.empty
depuraindice.cpp
funzipuno.cpp
funzipuno.hpp
indexador.cpp
leeHTML.cpp
leeHTML.hpp
leeODT.cpp
leeODT.hpp
leePDF.cpp
leePDF.hpp
leeXML.cpp
leeXML.hpp
operaindice.cpp
pruebaCppUnit.cpp
sha256.cpp
sha256.hpp
tomsha256.cpp
txtdeodt.cpp
unzipuno.cpp
verdad.txt
verdadlarga.txt

README.md

Mt77 es un motor de búsqueda rápido, preciso, apto para indexación distribuida y de dominio público

  1. Características:
  • Más veloz en búsquedas que Lucene y que Amberfish, aunque los índices son más grandes y requieren más tiempo de construcción
  • Especialmente diseñado para textos en Español
  • Puede leer textos planos, archivos XML, HTML, PDF y ODF
  • Permite buscar una o varias palabras, así como una o más cadenas
  • Permite indexar y buscar metainformación (título, tipo de archivo, sitio de origen, etiquetas XML)
  • Escrito en C++ siguiendo estándares, con pruebas de unidad (con make limpia; make prueba; make unidad) y de regresión (con make limpia; make prueba; make regr)
  1. Herramientas

Consta de las siguientes herramientas:

  • buscador para buscar palabras o metainformación en un índice
  • indexador para crear un índice a partir de uno o más textos
  • operaindice para mezclar índices en disco o RAM y hacer otras operaciones
  • txtdeodt extraer texto de un documento odt (Open Document Format)
  • unzipuno extraer un sólo archivo de un conteneder ZIP
  • tomsha256 Calcula hash sha256 empleando rutina de libtomcrypt-1.16