L'objectif de cet exercice est de construire une IA capable de reconnaître des chiffres manuscrits.

***

## Partie 1 - Comprendre les données utilisées

On importe les librairies qui nous seront utiles pour résoudre le problème :  
- __MNIST__ : pour l'import de la base de données MNIST contenant 100.000 chiffres manuscrits  
- __Numpy__ : pour travailler facilement des tableaux / matrices de données  
- __Matplotlib.pyplot__ : pour faire des graphiques    

In [1]:
from mnist import MNIST
import numpy as np
import matplotlib.pyplot as plt

On importe les données du use case :
- un dataset de données __images_train__ et __labels_train__ qu'on utilisera pour l'entraînement de l'intelligence artificielle
- un dataset de données __images_test__ et __labels_test__ qu'on utilisera pour tester l'intelligence artificielle    

In [46]:
mndata = MNIST('./Resources')
images_train, labels_train = mndata.load_training()
images_test, labels_test = mndata.load_testing()

<font color="blue">Q1.1 : Que représentent les données __images_train__ et __labels_train__ ? Idem pour __images_test__ et __labels_test__.</font>

In [47]:
print("Type de images_train : " + str(type(images_train)))
print("Type de labels_train : " + str(type(labels_train)))

Type de images_train : <class 'list'>
Type de labels_train : <class 'array.array'>


In [48]:
print("Nombre d'éléments dans images_train : " + str(len(images_train)))
print("Nombre d'éléments dans labels_train : " + str(len(labels_train)))

Nombre d'éléments dans images_train : 60000
Nombre d'éléments dans labels_train : 60000


In [49]:
print("Type d'un élément de images_train : " + str(type(images_train[0])))
print("Type d'un élément de labels_train : " + str(type(labels_train[0])))

Type d'un élément de images_train : <class 'list'>
Type d'un élément de labels_train : <class 'int'>


In [52]:
print("Type d'un élément d'un élément de images_train : " + str(type(images_train[0][0])))
print("Nombre d'éléments d'un élément de images_train : " + str(len(images_train[0])))

Type d'un élément d'un élément de images_train : <class 'int'>
Nombre d'éléments d'un élément de images_train : 784


In [51]:
print("Exemple de représentation d'un élément de images_train : " + str(images_train[0]))
print("Exemple de label d'un élément de labels_train : " + str(labels_train[0]))

Exemple de représentation d'un élément de images_train : [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 18, 18, 18, 126, 136, 175, 26, 166, 255, 247, 127, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 30, 36, 94, 154, 170, 253, 253, 253, 253, 253, 225, 172, 253, 242, 195, 64, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 49, 238, 253, 253, 253, 253, 253, 253, 253, 253, 251, 93, 82, 82, 56, 39, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 18, 219, 253, 253, 253, 253, 253, 198, 182, 247, 241, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 80, 156, 107, 253, 253, 205, 11, 0, 43, 154, 0, 0, 0, 0, 0, 0, 0, 0, 

Les données d'entraînement et de test sont composés de :
- une liste d'images représentant chacune un chiffre manuscrit images_train (pour l'entraînement), images_test (pour le test)
- une liste de labels représentant chacun le chiffre que le manuscrit est censé représenté labels_train (pour l'entraînement), labels_test (pour le test)

Chaque image est représentée par une liste de 784 valeurs comprises entre 0 et 255. Chaque valeur représente l'intensité d'un pixel de l'image (0 = noir, 255 = blanc)

In [None]:
random_num = np.random.randint(0,n_train)
random_image = images_train[random_num]
n_pxl = len(random_image)
print("Nombre de pixels : " + str(n_pxl))
print("Exemple de représentation d'une donnée : " + str(random_image))
print("Exemple de label d'une image : " + str(labels_train[random_num]))

Pour rendre l'affichage d'une de ces données plus lisible pour un humain, on procède de la manière suivante :

In [None]:
# on sélectionne une donnée au hasard parmi les données d'entraînement
random_num = np.random.randint(0,n_train)
random_image = images_train[random_num]

def aff_image(image, title, ax = None): 
    # on recompose l'image sous forme de tableau contenant 28x28 pixels (car 28x28 = 784)
    # et on crée un graphique pour l'afficher
    image_reshape = np.array(image).reshape(28,28, order='C')
    if ax is None:
        f, ax = plt.subplots(1,1)
    ax.imshow(image_reshape, cmap='gray')
    ax.set_title(title)

# on rajoute le label en titre et on affiche le graphique
aff_image(image = random_image, \
          title = "Label : " + str(labels_train[random_num]))
plt.show()

Avant de passer à la partie suivante, il est toujours bon de s'assurer que nos échantillons sont bien représentatifs. Pour cela, on affiche la distribution des chiffres manuscrits dans nos échantillons de test et d'entraînement.
Quel constat pouvons-nous faire ici ?

In [None]:
plt.figure(figsize = (10,6))
plt.hist([labels_train, labels_test], bins = np.arange(0,11) - 0.5, ec='black', \
        weights=[np.ones(len(labels_train)) / len(labels_train), np.ones(len(labels_test)) / len(labels_test)], \
        label = ["Entraînement", "Test"])
plt.xlabel("Chiffres manuscrits")
plt.ylabel("Fréquence d'occurrence")
plt.xticks(range(0,10))
plt.title("Distribution des échantillons")
plt.legend(loc='upper right')
plt.show()

Enfin, on peut construire l'image moyenne de nos échantillons pour se donner une idée de la diversité des échantillons. Que peut-on en déduire ici ?

In [None]:
# on construit l'image moyenne des échantillons d'entraînement et de test
# chaque pixel de cette image représente la moyenne des mêmes pixels de chaque image de l'échantillon
average_image_train = [sum([image[i] for image in images_train])/len(images_train) for i in range(0,784)]
average_image_test = [sum([image[i] for image in images_test])/len(images_test) for i in range(0,784)]

In [None]:
# on affiche chacune des images moyennes ainsi calculées
f, axis = plt.subplots(1,2, figsize=(10,5))
aff_image(image = average_image_train, \
          title = "Image moyenne (échantillon d'entraînement)", \
          ax = axis[0])
aff_image(image = average_image_test, \
          title = "Image moyenne (échantillon de test)", \
          ax = axis[1])
plt.show()

---

# Partie 2 - Construction d'un réseau de neurones artificiels

Avant de parler des réseaux de neurones artificiels, introduisons ce qu'est un neurone formel. Un neurone formel prend en entrée un certain nombre de données i1, ... in auxquelles il applique des coefficients ou poids w1, ... wn, qu'il apprend à définir lui-même. Il en fait ensuite la somme et il applique au résultat ainsi obtenu une fonction d'activation (non linéaire).
Pour comprendre à quoi peut servir un neurone formel, prenons un exemple. Supposons qu'on souhaite prédire si un consultant va démissionner dans le prochain mois. On considère que les données qui peuvent être utilisées pour prédire ce résultat sont : le nombre de formations suivies lors du dernier trimestre, la distance moyenne de ses derniers clients par rapport à Paris, son grade, son salaire et son sexe. On construit un échantillon d'entraînement (disons de 1000 consultants) et on envoie chacune de ces données dans un neurone formel.
Le neurone va prendre en entrée ces 5 paramètres i1, i2, i3, i4, i5 et calculer les poids associés w1, w2, w3, w4, w5. Au début il ne saura pas comment choisir ces poids et le fera au hasard. Pour le premier consultant qu'il verra (disons qu'il n'ait pas démissionné), il choisira peut-être que tous les poids valent 1. Il passera donc la somme i1 + ... + i5 dans la fonction d'activation qui sortira un résultat compris entre 0 et 1, disons 0,8. On considère que si le résultat est supérieur à 0,5 alors le consultant va démissionner. Donc sur ce cas, le neurone s'est trompé. Il va alors adapter les paramètres w1, ..., w5 pour se conformer à ce résultat. Il va ensuite regarder le cas du deuxième consultant et appliqué le même procédé. Au fil des consultants vus, le neurone va de plus en plus finement adapter ses poids w1, ... w5. Au bout de 1000 consultants, normalement les poids devraient être optimisés pour qu'il parvienne à prédire correctement le résultat sur un nombre de cas significatifs.

![title](Resources/Neurone.jpg)

Un seul neurone formel n'est souvent pas suffisant pour obtenir de bons résultats car le neurone formel ne calcule des poids que sur chaque paramètre d'entrée pris individuellement. Or parfois, c'est bien la combinaison de paramètres en entrée qui peut faciliter la prédiction (par exemple la combinaison âge du consultant et distance de sa dernière mission par rapport à Paris). On construit donc une architecture de neurones formels qui va multiplier les combinaisons des paramètres d'entrée. Chaque neurone peut alors envoyer son résultat à d'autres neurones si le réseau est constitué de plusieurs couches. Cette architecture, un peu "bourrine", est toutefois redoutablement efficace !

![Exemple de réseau de neurones à deux couches](Resources/Réseau de neurones.png)

Cette partie vise à construire un réseau de neurones artificiels pour prédire le chiffre manuscrit présent sur une image. Les données envoyées en entrée de l'algorithme seront les pixels des images de nos bases de données et la sortie sera le label de l'image (le chiffre représenté sur l'image). Il y a ura donc 784 données en entrée.

Pour commencer, on importe les librairies dont on aura besoin.

In [None]:
import keras # librairie facile à utiliser pour créer des réseaux de neurones artificiels 
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras import optimizers
from sklearn import preprocessing # librairie utilisée pour normaliser les données en entrée du problème
from sklearn.preprocessing import OneHotEncoder # pour modifier le format des labels
from sklearn.metrics import accuracy_score # pour mesurer la performance de l'IA
import random # pour sélectionner des nombres aléatoirement

Malheureusement, on ne peut pas envoyer les pixels tels quels dans le réseau de neurones, car il faut que les valeurs envoyées en entrée soient toutes strictement comparables. Si on reprend l'exemple de la prédiction du consultant qui va démissionner. L'âge et le salaire ne sont pas des données strictement comparables car le salaire est souvent bien plus élevé que l'âge. Le réseau de neurones sera donc beaucoup plus sensible au salaire qu'à l'âge. (une variation de 10 ans d'âge ne sera rien comparée à une variation de 1000€ de salaire).
Un moyen simple d'éviter ce problème est de centrer toutes les valeurs autour de 0 et de les "normer" pour quel majorité d'entre elles aient une valeur comprise entre -1 et 1.

On centre donc toutes les valeurs de pixels autour de 0 et on les normalise.

In [None]:
scaler = preprocessing.StandardScaler()
normalized_images_train = scaler.fit_transform(images_train)
normalized_images_test = scaler.transform(images_test)

La majorité des pixels ont maintenant une valeur comprise entre -1 et 1

In [None]:
# on sélectionne une donnée au hasard parmi les données d'entraînement et on l'affiche
random_num = np.random.randint(0,n_train)
print(normalized_images_train[random_num])

Dernière étape avant de pouvoir construire notre réseau de neurones. il va falloir changer la manière donc sont labellisés les images ! En effet, un réseau de neurones artificiels sort toujours une probabilité. Ici il sortira donc la probabilité que l'image représente un 0, un 1, un 2, ... ou un 9. Ce sera donc une liste de 10 probabilité et on considérera que le chiffre représenté sur l'image sera celui ayant la plus haute probabilité.

Ainsi si dans les données d'entraînement, on indique au réseau de neurones que le chiffre représenté sur l'image est un 9, il ne comprendra pas (car ce n'est pas une liste contenant 10 probabilités). En revanche il comprendra si on lui donne la liste [0,0,0,0,0,0,0,0,0,1] (tous les chiffres ont une probabilité de 0, sauf le dernier (le 9) qui a une probabilité de 1

On va donc transformer tous les labels pour qu'ils soient des listes de 10 probabilités.

In [None]:
onehotencoder = OneHotEncoder()
encoded_labels_train = onehotencoder.fit_transform(np.array(labels_train).reshape(-1,1)).toarray()
encoded_labels_test = onehotencoder.transform(np.array(labels_test).reshape(-1,1)).toarray()

# on vérifie le résultat
random_num = np.random.randint(0,10000)
print("Le label d'entraînement " + str(labels_train[random_num]) + " a été encodé en " + str(encoded_labels_train[random_num]))
print("Le label de test " + str(labels_test[random_num]) + " a été encodé en " + str(encoded_labels_test[random_num]))

On est enfin prêt pour créer notre réseau de neurones artificiels. On aura donc n=784 données principalement comprises entre -1 et 1 en entrée du réseau de neurones et en sortie, on aura une liste de 10 probabilités. 

On va créer une réseau de neurones avec 2 couches de neurones, constituées de 25 neurones pour la première, et de 10 neurones pour la deuxième (nos 10 résultats possibles).

In [None]:
# On définit les paramètres-clés de notre réseau de neurones artificiels
n = 784 # nombre de prédicteurs (pixels) donnés en entrée du réseau
h = 50 # nombre de neurones dans la première couche couche
k = 10 # nombre de neurones dans la deuxième (dernière) couche

In [None]:
# On crée notre réseau de neurones artificiels simplement en utilisant l'API de Keras
model = Sequential() # initialisation
model.add(Dense(h, input_dim= n)) # première couche de h neurones, prenant en entrée n prédicteurs (pixels)
model.add(Activation('sigmoid')) # fonction d'activation de la première couche
model.add(Dense(h)) # première couche de h neurones, prenant en entrée n prédicteurs (pixels)
model.add(Activation('sigmoid')) # fonction d'activation de la première couche
model.add(Dense(h)) # première couche de h neurones, prenant en entrée n prédicteurs (pixels)
model.add(Activation('sigmoid')) # fonction d'activation de la première couche
model.add(Dense(h)) # première couche de h neurones, prenant en entrée n prédicteurs (pixels)
model.add(Activation('sigmoid')) # fonction d'activation de la première couche
model.add(Dense(k)) # deuxième couche de k neurones
model.add(Activation('softmax')) # fonction d'activation de la deuxième (dernière) couche
model.compile(optimizer=optimizers.adam(lr=0.001), # compilation du réseau de neurones artificiels et définition de
              loss='categorical_crossentropy',  # - la fonction de coût à minimiser
              metrics=['accuracy'])             # - l'indicateur à afficher

In [None]:
# Entraînement du réseau de neurones avec les 60000 images de l'échantillon d'entraînement 
model.fit(normalized_images_train, encoded_labels_train, epochs=20, batch_size=100)

On a maintenant entraîné le réseau de neurones, qui devrait avoir une précision comprise entre 95% et 100% (pourcentage de prédictions correctes sur l'échantillon d'entraînement).

Pour mesurer la performance de l'algorithme maintenant entraîné, on le teste sur les 10 000 images de test

In [None]:
labels_test_pred_list = model.predict(normalized_images_test)

# on affiche un exemple de prédiction
random_num = np.random.randint(0,n_test)
print("Exemple de prédiction pour une image de test choisie au hasard : " + str(labels_test_pred_list[random_num]))

Comme on pouvait s'y attendre, ces prédictions prennent la forme d'une liste de 10 probabilités. Pour obtenir une prédiction un peu plus "interprétable", on retient la position de l'élément de la liste ayant la plus haute probabilité. C'est cette position que le réseau de neurones juge la plus probable.

In [None]:
def predict(images, model):
    normalized_images = scaler.transform(images)
    labels_pred_list = model.predict(normalized_images)
    labels_pred = [list(pred).index(max(pred)) for pred in labels_pred_list]
    confiance = [max(pred) for pred in labels_pred_list]
    return labels_pred, confiance

labels_test_pred, confiance = predict(images_test, model)

# on vérifie le résultat
random_num = np.random.randint(0,n_test)
print("La prédiction : " + str(labels_test_pred_list[random_num]) + \
      " correspond au label : " + str(labels_test_pred[random_num]) + \
      " avec un taux de confiance de " + str(confiance[random_num]))

On peut maintenant mesurer la précision des prédictions de l'algorithme sur l'échantillon de test avec 

In [None]:
print("Le pourcentage de prédictions correctes est de " + \
      str(round(accuracy_score(np.array(labels_test), labels_test_pred)*100,1)) + "%")

Affichons quelques résultats pour vérifier que la plupart des prédictions dont correctes

In [None]:
random_idx = random.sample(range(n_test), 100)
f, axis = plt.subplots(10,10, figsize=(18,22))
for i,ax in zip(random_idx, axis.flatten()):
    aff_image(image = images_test[i], \
              title = "Label : " + str(labels_test[i]) + "\nPrédiction : " + str(labels_test_pred[i]), \
              ax = ax)
    ax.set_axis_off()
plt.show()

---

# Partie 3 - Analyse des résultats

In [None]:
# On importe les librairies dont on aura besoins
from collections import Counter, deque # pour compter le nombre d'occurrence des éléments d'une liste

In [None]:
# on sépare les prédictions correctes des prédictions erronées
corr_pred_idx = list(list(np.where(np.array(labels_test) - labels_test_pred == 0))[0])
err_pred_idx = list(list(np.where(np.array(labels_test) - labels_test_pred != 0))[0])

Affichons maintenant quelques résultats incorrects. Quel constat peut-on faire ?

In [None]:
random_idx = random.sample(err_pred_idx, min(100, len(err_pred_idx)))
f, axis = plt.subplots(10,10, figsize=(15,20))
for i,ax in zip(random_idx, axis.flatten()):
    aff_image(image = images_test[i], \
              title = "Label : " + str(labels_test[i]) + "\nPrédiction : " + str(labels_test_pred[i]), \
              ax = ax)
    ax.set_axis_off()
plt.show()

On va commencer par regarder sur quels chiffres l'algorithme se trompe le plus souvent

In [None]:
count_err_par_chiffre = np.array([Counter([labels_test[i] for i in err_pred_idx])[j] for j in range(0,10)])
count_par_chiffres = np.array([Counter(labels_test)[j] for j in range(0,10)])
percent_err_par_chiffre = count_err_par_chiffre/count_par_chiffres

In [None]:
plt.bar(range(0,10),percent_err_par_chiffre)
plt.xticks(range(0,10))
plt.title("Fréquence d'erreurs par chiffre")
plt.ylabel("Fréquence d'erreurs")
plt.xlabel("Chiffre manuscrit")
plt.show()

In [None]:
err_idx_par_chiffre = [list(np.where((np.array(labels_test) - labels_test_pred != 0) & \
                                         (np.array(labels_test) == i))[0]) for i in range(0,10)]

In [None]:
count_err_par_chiffre_par_chiffre_pred = [[Counter([labels_test_pred[i] \
                                           for i in err_idx_par_chiffre[k]])[j] \
                                           for j in range(0,10)] \
                                           for k in range(0,10)]

In [None]:
plt.imshow(count_err_par_chiffre_par_chiffre_pred, cmap= 'Reds')
plt.yticks(range(0,10))
plt.xticks(range(0,10))
plt.ylabel("Chiffre réel")
plt.xlabel("Chiffre prédit")
plt.title("Chiffre réel vs chiffre prédit sur les prédictions erronées")
plt.show()

On va essayer d'interpréter les décisions de l'algorithme pour comprendre les raisons de ses erreurs

In [None]:
# on choisit une image pour laquelle l'algorithme a prédit que c'était un 3 alors que c'était un 5
random_err_idx = random.choice([err_index for err_index in err_idx_par_chiffre[5] if labels_test_pred[err_index] == 3 ])
random_err_image = np.array(images_test[random_err_idx])

In [None]:
aff_image(image = random_err_image, \
          title = "Label : " + str(labels_test[random_err_idx]) + "\nPrédiction : " + str(labels_test_pred[random_err_idx]))
plt.show()

On peut afficher le taux de confiance de l'IA sur les erreurs

In [None]:
confiance_sur_erreur = [confiance[i] for i in err_pred_idx]
confiance_sur_correct = [confiance[i] for i in corr_pred_idx]

In [None]:
distr_confiance_sur_err = np.histogram(confiance_sur_erreur, [i/100 for i in range(0,101)])
distr_confiance_sur_corr = np.histogram(confiance_sur_correct, [i/100 for i in range(0,101)])

In [None]:
per_distr_confiance_sur_err = distr_confiance_sur_err[0] / (distr_confiance_sur_corr[0] + distr_confiance_sur_err[0])
per_distr_confiance_sur_corr = distr_confiance_sur_corr[0] / (distr_confiance_sur_corr[0] + distr_confiance_sur_err[0])
per_distr_confiance_sur_err[np.isnan(per_distr_confiance_sur_err)] = 0
per_distr_confiance_sur_corr[np.isnan(per_distr_confiance_sur_corr)] = 0

In [None]:
plt.figure(figsize = (20,8))
plt.bar(distr_confiance_sur_corr[1][:-1] + 0.0075, per_distr_confiance_sur_err, width=0.008, label = "erreur", \
        color = 'red')
plt.bar(distr_confiance_sur_corr[1][:-1] + 0.0075, per_distr_confiance_sur_corr, width=0.008, label = "correct", \
        bottom=per_distr_confiance_sur_err, color = 'green')
plt.xlabel("Taux de confiance")
plt.ylabel("%age correct / erreur")
plt.xticks([i / 20 for i in range(0,21)])
plt.xlim(0.5,1)
plt.title("Vue des prédictions correctes / erronées par taux de confiance")
plt.legend(loc='upper right')
plt.show()

In [None]:
print("En demandant à un humain de traiter manuellement les cas où l'IA est confiante à moins de 99%, \
on automatisera " + str(round(len(np.where(np.array(confiance) > 0.99)[0])/10000*100,1)) + "% des cas avec un taux d'erreur \
de l'IA de " + str(round(per_distr_confiance_sur_err[-1]*100,1)) + "%")

Testons un peu la robustesse de l'algorithme

In [None]:
# on choisit une prédiction correcte au hasard
random_corr_idx = random.choice(corr_pred_idx)
random_corr_image = images_test[random_corr_idx]
image_reshape = np.array(random_corr_image).reshape(28,28, order='C')
plt.imshow(image_reshape, cmap='gray')

# on rajoute le label en titre et on affiche le graphique
plt.title("Label : " + str(labels_test[random_corr_idx]) + "\nPrédiction : " + str(labels_test_pred[random_corr_idx]))
plt.show()

On va tester la robustesse de l'algorithme lorsqu'on modifie l'image pour qu'elle soit noire sur fond blanc

In [None]:
rev_image = list(255 - np.array(random_corr_image))

# on rajoute le label en titre et on affiche le graphique
aff_image(image = rev_image, \
          title = "Label : " + str(labels_test[random_corr_idx]))
plt.show()

In [None]:
pred, confiance = predict([rev_image], model)
print("La prédiction de l'IA est " + str(pred[0]) + " avec une confiance de " + str(round(confiance[0] * 100, 1)) + "%")

On teste maintenant la robustesse de l'algorithme lorsqu'on décale l'image de quelques pixels

In [None]:
pxl_shift = 5 # nombre de pixels dont on décale l'image

In [None]:
shift_image = list(np.array([np.roll(row, pxl_shift) for row in np.array(random_corr_image).reshape(28,28)]).flatten())

In [None]:
f, axis = plt.subplots(1,2, figsize=(10,5))
aff_image(random_corr_image, "Image originale", axis[0])
aff_image(np.array(shift_image).flatten(), "Image décalée", axis[1])
plt.show()

In [None]:
pred, confiance = predict([shift_image], model)
print("La prédiction de l'IA est " + str(pred[0]) + " avec une confiance de " + str(round(confiance[0] * 100, 1)) + "%")