Skip to content

Commit

Permalink
plots added in tex
Browse files Browse the repository at this point in the history
  • Loading branch information
MarcosTirador committed Dec 21, 2022
1 parent efcbb41 commit 6b11757
Show file tree
Hide file tree
Showing 7 changed files with 20 additions and 27 deletions.
18 changes: 9 additions & 9 deletions docs/Marcos_part/Proyecto_Final_Sherlock_marcos_part.aux
Original file line number Diff line number Diff line change
Expand Up @@ -56,22 +56,22 @@
\@writefile{toc}{\contentsline {subsection}{\numberline {5.2}Implementaci\'on.}{8}{}\protected@file@percent }
\@writefile{toc}{\contentsline {section}{\numberline {6}Evaluaci\'on de los modelos}{8}{}\protected@file@percent }
\citation{B1}
\@writefile{toc}{\contentsline {subsection}{\numberline {6.1}Modelo Booleano}{10}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {6.2}Modelo Vectorial}{11}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {6.3}Modelo Fuzzy}{12}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {6.1}Modelo Booleano}{9}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {6.2}Modelo Vectorial}{10}{}\protected@file@percent }
\citation{B2}
\@writefile{toc}{\contentsline {subsection}{\numberline {6.3}Modelo Fuzzy}{12}{}\protected@file@percent }
\citation{B6}
\citation{B1}
\@writefile{toc}{\contentsline {section}{\numberline {7}Agrupamiento}{14}{}\protected@file@percent }
\@writefile{toc}{\contentsline {section}{\numberline {7}Agrupamiento}{13}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {7.1}K-means}{14}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {7.2}Objetivo perseguido}{15}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {7.3}Implementaci\'on}{15}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {7.2}Objetivo perseguido}{14}{}\protected@file@percent }
\@writefile{toc}{\contentsline {subsection}{\numberline {7.3}Implementaci\'on}{14}{}\protected@file@percent }
\bibcite{B1}{1}
\bibcite{B2}{2}
\@writefile{toc}{\contentsline {subsection}{\numberline {7.4}Resultados}{15}{}\protected@file@percent }
\@writefile{toc}{\contentsline {section}{\numberline {8}Conclusiones y trabajo futuro}{15}{}\protected@file@percent }
\bibcite{B3}{3}
\bibcite{B4}{4}
\bibcite{B5}{5}
\@writefile{toc}{\contentsline {subsection}{\numberline {7.4}Resultados}{16}{}\protected@file@percent }
\@writefile{toc}{\contentsline {section}{\numberline {8}Conclusiones y trabajo futuro}{16}{}\protected@file@percent }
\bibcite{B6}{6}
\gdef \@abspage@last{20}
\gdef \@abspage@last{19}
Binary file modified docs/Marcos_part/Proyecto_Final_Sherlock_marcos_part.pdf
Binary file not shown.
Binary file modified docs/Marcos_part/Proyecto_Final_Sherlock_marcos_part.synctex.gz
Binary file not shown.
15 changes: 4 additions & 11 deletions docs/Marcos_part/Proyecto_Final_Sherlock_marcos_part.tex
Original file line number Diff line number Diff line change
Expand Up @@ -336,21 +336,16 @@

Las conjuntos de consultas de prueba tanto de \emph{Cranfield} como de \emph{Vaswani} no est\'an pensadas para aplicarlas sobre un modelo booleano. Esto se puede apreciar del simple hecho de que las mismas constituyen oraciones y no expresiones l\'ogicas.


\begin{center}
\includegraphics[width=10cm]{cranfield_boolean}

\includegraphics[width=10cm]{vaswani_boolean}

\includegraphics[width=10cm]{cord19_boolean}
\includegraphics[width=10cm]{boolean}
\end{center}

\subsection{Modelo Vectorial}

El modelo vectorial no se comporta bien en corpus de dominio específico. Tanto \emph{Cranfield}, como \emph{Vaswani} y \emph{Cord19} son corpus de dominio específico, por lo que las evaluaciones no son muy acertadas.

\begin{center}
\includegraphics[width=10cm]{PR_plot(k=300).png}
\includegraphics[width=10cm]{PR_plot(k=300).png}
\end{center}

En esta gráfica se muestra hasta los primeros 300 documentos, como se comporta el modelo con los 3 corpus.
Expand All @@ -367,16 +362,14 @@

\subsection{Modelo Fuzzy}

Al ser un modelo que extiende al modelo booleano, aunque resuelve muchas de las dificultades del anterior, este aun acarrea otras de sus deficiencias. Una de estas principales dificultades es que el lenguaje de consultas es complejo para inexpertos.
Al ser un modelo que extiende al modelo booleano, aunque resuelve muchas de las dificultades del anterior, este aun acarrea otras de sus deficiencias. Una de estas principales dificultades es que el lenguaje de consultas es complejo para inexpertos. Las conjuntos de consultas de prueba tanto de \emph{Cranfield} como de \emph{Vaswani} no est\'an pensadas para aplicarlas sobre un modelo booleano. Esto se puede apreciar del simple hecho de que las mismas constituyen oraciones y no expresiones l\'ogicas.

Sin embargo, si se puede apreciar una ligera mejor\'ia respecto al modelo booleano (en el caso de \emph{Crenfield} se obtiene un valor de la F-medida casi cuatro veces mayor). Este resultado es de esperar ya que este modelo mejora algunas de las dificultades del anterior, como por ejemplo que en este caso la coincidencia de los documentos no tiene que ser exacta, se crea un ranking, se adiciona cierta sem\'antica a los t\'erminos analizando cierta correlaci\'on entre los pares de ellos y adem\'as, de esto \'ultimo se puede inferir que no todos los t\'erminos seguir\'an siendo igual de importantes.

En el caso del conjunto de datos \emph{cord19} este no pudo usarse en el modelo fuzzy ya que la gran cantidad de documentos y t\'erminos que posee este es muy grande, lo que hace que calcular la correlaci\'on entre cada par de t\'erminos incurra en un uso de recursos muy elevado. Si dicha correlaci\'on se precalcula, har\'ian falta m\'as de $20 GB$ de RAM seg\'un los c\'alculos hechos (que no se presentan pues son aproximaciones poco formales). Si en cambio se hace en el momento de cada consulta solo para los t\'erminos de la consulta, ejecutar cada consulta tomar\'ia m\'as de $5$ minutos. Adem\'as, el modelo fuzzy no has sido extensamente probado en experimentos con colecciones grandes de documentos\footnote{Esta idea se tom\'o de \cite{B2}, p\'agina $38$.}.

\begin{center}
\includegraphics[width=10cm]{cranfield_fuzzy}

\includegraphics[width=10cm]{vaswani_fuzzy}
\includegraphics[width=10cm]{fuzzy}
\end{center}

\section{Agrupamiento}
Expand Down
14 changes: 7 additions & 7 deletions docs/Marcos_part/Proyecto_Final_Sherlock_marcos_part.toc
Original file line number Diff line number Diff line change
Expand Up @@ -24,12 +24,12 @@
\contentsline {subsection}{\numberline {5.1}Descripci\'on del modelo usado}{7}{}%
\contentsline {subsection}{\numberline {5.2}Implementaci\'on.}{8}{}%
\contentsline {section}{\numberline {6}Evaluaci\'on de los modelos}{8}{}%
\contentsline {subsection}{\numberline {6.1}Modelo Booleano}{10}{}%
\contentsline {subsection}{\numberline {6.2}Modelo Vectorial}{11}{}%
\contentsline {subsection}{\numberline {6.1}Modelo Booleano}{9}{}%
\contentsline {subsection}{\numberline {6.2}Modelo Vectorial}{10}{}%
\contentsline {subsection}{\numberline {6.3}Modelo Fuzzy}{12}{}%
\contentsline {section}{\numberline {7}Agrupamiento}{14}{}%
\contentsline {section}{\numberline {7}Agrupamiento}{13}{}%
\contentsline {subsection}{\numberline {7.1}K-means}{14}{}%
\contentsline {subsection}{\numberline {7.2}Objetivo perseguido}{15}{}%
\contentsline {subsection}{\numberline {7.3}Implementaci\'on}{15}{}%
\contentsline {subsection}{\numberline {7.4}Resultados}{16}{}%
\contentsline {section}{\numberline {8}Conclusiones y trabajo futuro}{16}{}%
\contentsline {subsection}{\numberline {7.2}Objetivo perseguido}{14}{}%
\contentsline {subsection}{\numberline {7.3}Implementaci\'on}{14}{}%
\contentsline {subsection}{\numberline {7.4}Resultados}{15}{}%
\contentsline {section}{\numberline {8}Conclusiones y trabajo futuro}{15}{}%
Binary file added docs/Marcos_part/boolean.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docs/Marcos_part/fuzzy.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit 6b11757

Please sign in to comment.