Skip to content

Commit

Permalink
night, blog
Browse files Browse the repository at this point in the history
  • Loading branch information
sdpython committed Feb 7, 2018
1 parent d734977 commit 7307f3e
Show file tree
Hide file tree
Showing 6 changed files with 895 additions and 641 deletions.
1 change: 1 addition & 0 deletions _doc/examples/ml_basic/README.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,5 @@

.. _l-cheatsheet-ml:

Problèmes standard de machine learning
--------------------------------------
Expand Down
634 changes: 2 additions & 632 deletions _doc/notebooks/lectures/wines_color.ipynb

Large diffs are not rendered by default.

838 changes: 838 additions & 0 deletions _doc/notebooks/lectures/wines_color_roc.ipynb

Large diffs are not rendered by default.

38 changes: 38 additions & 0 deletions _doc/sphinxdoc/source/blog/2018/2018-02-08_sessions2.rst
Original file line number Diff line number Diff line change
@@ -0,0 +1,38 @@

.. blogpost::
:title: Session 2
:keywords: session 2
:date: 2018-02-08
:categories: session

Suite :

* :ref:`l-regclass`
* formalisation de la :ref:`régression <l-regression-f>`,
de la :ref:`classification <l-classification-f>`
* :ref:`classification multi-classe <l-multiclass>`
* paramètres de régularisation,
`Ridge <http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Ridge.html>`_,
`Lasso <http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html#sklearn.linear_model.Lasso>`_,
`ElasticNet <http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ElasticNet.html#sklearn.linear_model.ElasticNet>`_
* `clustering <http://scikit-learn.org/stable/modules/clustering.html#clustering>`_,
`k-means <http://www.xavierdupre.fr/app/mlstatpy/helpsphinx/c_clus/kmeans.html>`_
un exemple avec
les `vélos à Chicago <http://www.xavierdupre.fr/app/ensae_projects/helpsphinx/notebooks/city_bike_challenge.html>`_
et l'utilisation du clustering pour trouver les
`profils de cyclistes à Chicago <http://www.xavierdupre.fr/app/ensae_projects/helpsphinx/notebooks/city_bike_solution_cluster_start.html>`_
* `ranking <https://github.com/dmlc/xgboost/tree/master/demo/rank>`_
* recommandations,
`Factorisation de matrices non-négatives <http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.NMF.html>`_,
`Liens entre factorisation de matrices, ACP, k-means <http://www.xavierdupre.fr/app/mlstatpy/helpsphinx/c_ml/missing_values_mf.html>`_
* :ref:`l-cheatsheet-ml`
* résumé de l'`interface scikit-learn <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/notebooks/02_basic_of_machine_learning_with_scikit-learn.html#a-recap-on-scikit-learn-s-estimator-interface>`_

Exercices :

* Ecrire un programme qui construire deux prédicteurs de la note d'un vin,
un pour les vins blancs, un autre pour les rouges, comparer sa performance
avec le même modèle appris sur l'ensemble de la base
* Pourrait-on envisager l'écriture d'un régresseur un peu plus générique
qui estimerait un modèle sur chacune des modalités prises par une variable de la base.
On pourra s'inspirer de `SkLearnerBase <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/ensae_teaching_cs/ml/sklearn_base_learner.html?highlight=skbaselearner#ensae_teaching_cs.ml.sklearn_base_learner.SkBaseLearner>`_.
23 changes: 14 additions & 9 deletions _doc/sphinxdoc/source/lectures/regclass.rst
Original file line number Diff line number Diff line change
Expand Up @@ -266,6 +266,8 @@ Deux problèmes à la base de beaucoup d'autres

.. index:: régression

.. _l-regression-f:

Régression
++++++++++

Expand Down Expand Up @@ -337,6 +339,8 @@ donne de mauvais résultats.
../notebooks/wines_reg
../notebooks/wines_reg_poly

.. _l-classification-f:

Classification
++++++++++++++

Expand Down Expand Up @@ -431,6 +435,16 @@ la classification utilise une fonction

../notebooks/wines_color
../notebooks/wines_color_line
../notebooks/wines_color_roc

Les modèles linéaires sont simples, robustes, interprétables.
Un modèle plus compliqué améliore souvent les performances.
Il est possible aussi d'ajouter des variables construites
de façon non linéaire à partir des premières. Le procédé est plus
ou moins automatique mais donne parfois de bons résultats :
`Features ou modèle <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/notebooks/ml_features_model.html>`_.

.. _l-multiclass:

Classification multi-classe
+++++++++++++++++++++++++++
Expand All @@ -441,12 +455,3 @@ puisque la note est entière et prend peu de valeurs distinctes.
Chaque vin peut être considéré comme faisant partie du groupe
associé à tous les vins portant la même note. Ce problème
est différent du précédent car il y a plus de deux classes.

apprentissage

évaluation

Modèles ou features
+++++++++++++++++++

`Features ou modèle <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/notebooks/ml_features_model.html>`_
2 changes: 2 additions & 0 deletions _doc/sphinxdoc/source/rappel.rst
Original file line number Diff line number Diff line change
Expand Up @@ -352,6 +352,8 @@ C'est la représentation informatique d'une matrice
et des opérations qui lui sont associées.
Pour vous exercez :
`Calcul Matriciel, Optimisation <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/notebooks/td2a_cenonce_session_2A.html>`_.
Lire également
`Pourquoi pandas et numpy, pourquoi pas seulement pandas (2A) ? <http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/blog/2017/2017-09-19_pandas_numpy.html>`_.

.. index:: fonction de hash, hash

Expand Down

0 comments on commit 7307f3e

Please sign in to comment.