Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Analyser le nombre d'occurrences présentant les mêmes facteurs #56

Open
seza443 opened this issue Apr 14, 2017 · 0 comments
Open

Analyser le nombre d'occurrences présentant les mêmes facteurs #56

seza443 opened this issue Apr 14, 2017 · 0 comments

Comments

@seza443
Copy link
Member

seza443 commented Apr 14, 2017

ref #53 (comment)

Pour "number of symptoms having the same factors"
Je ne sais pas comment faire. Pour le moment, toutes les occurrences ont les mêmes facteurs: humidité, température, description textuelle de la météo, coordonnées gps.
LCM reçoit en input un fichier ne pouvant contenir que des integer.

On pourrait donc faire qqch comme:

  • On se limite à 1 seul symptome
  • 1 ligne = 1 occurrence de ce symptome
  • les valeurs de la ligne sont quoi du coup? On ne peut pas écrire toutes les valeurs des facteurs car les valeurs textuelles ne passeront pas. Même si on n'écrit que les valeurs entières, lorsqu'on lira l'output et que l'on verra une ligne ressemblant à 10 15 1 2, on n'aura aucune idée de quelle valeur est associée à quel facteur

Du coup on pourrait se limiter à 1 symptome et 1 seul facteur

  • 1 ligne = 1 occurrence
  • les valeurs de la ligne sont les valeurs du facteur pour l'occurrence. A priori il n'y a qu'une seule valeur d'un même facteur associé à une occurrence => il n'y aurait qu'un nombre par ligne
    Dans ce cas-ci, on perd l'avantage d'utiliser LCM. En effet, on pourrait produire le même output avec une requete SQL.

On pourrait ne pas se limiter à 1 seul symptome. Mais d'une part, je ne vois de nouveau pas comment mettre en forme l'input. Et d'autre part, ça ne me semble pas intéressant de connaitre, pour plusieurs symptomes, quels sont les valeurs de facteurs communes.
C'est bien plus intéressant d'avoir les valeurs de facteurs communes pour 1 symptome afin de déterminer quel facteur induit ce symptome particulièrement

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant