# **Problème** comment accéder à la fonction de scoring utilisée par un modèle

Problème : pas d'introspection possible a priori du score utilisé par le modèle pour son entrainement.

**La seule chose que l'on puisse faire est le réutiliser pour réévaluer une performance, mais sans savoir lequel il est avec certitude**

Contexte d'apparition du problème :

Je souhaitais effectuer une validation croisée d'abord sur la base du fonctionnement par défaut de `cross_val_score` qui utilise le scorer du modèle qui lui est passé en argument.

Seulement voilà, pas moyen d'accéder à la fonction réelle qui est masquée par un `<bound method ClassifierMixin.score of TheModel()>`

```Python
from sklearn.model_selection import cross_val_score
scores = cross_val_score(model, X, y, cv=5)
print(scores)
print(f"{scores.mean()} {score_name} with a standard deviation of {scores.std()}")
```

## Tentatives d'introspection (pour le moment en échec)

Le seul champ qui m'apporte une information d'identification est le champ `__doc__`

Je n'estime pas que cela soit suffisamment fiable, je veux pouvoir comparer la fonction sous-jacente wrappée directement avec ma collection de fonctions, les skl, comme toute fonction parsonnalisée qui pourrait avoir été définie.

Fonctions qui pourraient être utiles :
* `from sklearn.metrics import get_scorer`


In [1]:
from sklearn.metrics import accuracy_score
from sklearn.linear_model import LogisticRegression

estimator = LogisticRegression()
score_func = getattr(estimator, "score")
if score_func is accuracy_score:
    print("Estimator uses mean accuracy score")
# print(dir(score_func))
print(score_func)
print(score_func.__repr__)
display({m: getattr(score_func, m) for m in dir(score_func)})

<bound method ClassifierMixin.score of LogisticRegression()>
<method-wrapper '__repr__' of method object at 0x000001E91F517100>


{'__call__': <method-wrapper '__call__' of method object at 0x000001E91F517100>,
 '__class__': method,
 '__delattr__': <method-wrapper '__delattr__' of method object at 0x000001E91F517100>,
 '__dir__': <function method.__dir__()>,
 '__doc__': '\n        Return the mean accuracy on the given test data and labels.\n\n        In multi-label classification, this is the subset accuracy\n        which is a harsh metric since you require for each sample that\n        each label set be correctly predicted.\n\n        Parameters\n        ----------\n        X : array-like of shape (n_samples, n_features)\n            Test samples.\n\n        y : array-like of shape (n_samples,) or (n_samples, n_outputs)\n            True labels for `X`.\n\n        sample_weight : array-like of shape (n_samples,), default=None\n            Sample weights.\n\n        Returns\n        -------\n        score : float\n            Mean accuracy of ``self.predict(X)`` w.r.t. `y`.\n        ',
 '__eq__': <method-wrapper

## Liste des scorers

In [None]:
from sklearn.metrics import SCORERS
display(SCORERS)



{'explained_variance': make_scorer(explained_variance_score),
 'r2': make_scorer(r2_score),
 'max_error': make_scorer(max_error, greater_is_better=False),
 'matthews_corrcoef': make_scorer(matthews_corrcoef),
 'neg_median_absolute_error': make_scorer(median_absolute_error, greater_is_better=False),
 'neg_mean_absolute_error': make_scorer(mean_absolute_error, greater_is_better=False),
 'neg_mean_absolute_percentage_error': make_scorer(mean_absolute_percentage_error, greater_is_better=False),
 'neg_mean_squared_error': make_scorer(mean_squared_error, greater_is_better=False),
 'neg_mean_squared_log_error': make_scorer(mean_squared_log_error, greater_is_better=False),
 'neg_root_mean_squared_error': make_scorer(mean_squared_error, greater_is_better=False, squared=False),
 'neg_mean_poisson_deviance': make_scorer(mean_poisson_deviance, greater_is_better=False),
 'neg_mean_gamma_deviance': make_scorer(mean_gamma_deviance, greater_is_better=False),
 'accuracy': make_scorer(accuracy_score),
 