# Labels et Format

Sur un tableau de données dans un rapport présenté à un client de l'entreprise où vous travaillez, une colonne appelée variable_1 qui contient des chiffres au format scientifique (1.1578e5) ne représente rien dans l’esprit de ce client. Ce dernier souhaiterait mieux voir quelque chose comme (Primes reçues au premier trimestre = 115 780 $). Dans cette section, nous verrons comment changer l’affichage des noms de variables ainsi que les formats des données qu'elles contiennent.

## Label
Afin de changer l'**affichage** des variables, nous utilisant la déclaration `LABEL variable_1='nouvelle variable' ... varraible_2= 'une autre variable';`

Il est important de noter que cette déclaration permet de changer seulement le l'**affichage** des variables et non le nom des variables

## Format

Cette déclaration sert à changer l'affichage des observations, elle ne change pas leurs valeurs. Par exemple, si nous arrondissons une variable de huit décimale en un affichage de 2 décimales, cette variable possède toujours les huit décimales dans l'ensemble de données (_data set_)

La liste complète se trouve [ici](http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a001263753.htm)

`<$>format<w>.<d>`

<style type="text/css">
	table.tableizer-table {
		font-size: 12px;
		border: 1px solid #CCC; 
		font-family: Arial, Helvetica, sans-serif;
	} 
	.tableizer-table td {
		padding: 4px;
		margin: 3px;
		border: 1px solid #CCC;
	}
	.tableizer-table th {
		background-color: #104E8B; 
		color: #FFF;
		font-weight: bold;
	}
</style>
<table class="tableizer-table">
<thead><tr class="tableizer-firstrow"><th>signe</th><th>signification</th></tr></thead><tbody>
 <tr><td>$</td><td>indique le format de type caractère</td></tr>
 <tr><td>[Format](http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a001263753.htm)</td><td>Les noms de format SAS</td></tr>
 <tr><td>w</td><td>Précise la largeur du format incluant les décimales </td></tr>
 <tr><td>.</td><td>toujours requis</td></tr>
 <tr><td>d</td><td>le nombre de décimales à placer derrière le point</td></tr>
</tbody></table>

# Exemple
Regardons un exemple avec les données `emprunt_bancaire.csv` que vous pouvez trouvez dans SAS OD ou les télécharger sur [GitHub](https://github.com/nmeraihi/data)

In [1]:
filename mesDos 'data/emprunt_bancaire.csv';
/* utilisez la ligne suivante dans SAS OD */
*filename mesDos '/home/nmeraihi1/mondossier/emprunt_bancaire.csv';
data loan;
    infile mesDos dsd
     firstobs=2;
    input Loan_ID $ loan_status $ Principal terms age education $ Gender $;
run;
title "Les données originales du dataset emprunt_bancaire";
proc print data=loan noobs;
run;

SAS Connection established. Subprocess id is 16674



Loan_ID,loan_status,Principal,terms,age,education,Gender
xqd20166,PAIDOFF,1000,30,45,High Sch,male
xqd20168,PAIDOFF,500,30,50,Bechalor,female
xqd20160,PAIDOFF,1000,30,33,Bechalor,female
xqd20160,PAIDOFF,895,15,27,college,male
xqd20160,PAIDOFF,1000,30,28,college,female


Dans cet exemple nous avons gardé les noms de variables tel qu'elle sont écrite dans le jeux de données original. Si nous voulons changer garder les même noms de variable en anglais, mais que nous désiron remplacer l'affichage de **Gender** par **Sex**, nous écrivons ceci:

In [2]:
title "Ici nous changeons l'affichage de la variable Gender par Sex";
/* il est important d'ajouter l'option label à la fin de la ligne <proc print...>*/
proc print data=loan noobs label;
label  Gender='Sex';
run;

Loan_ID,loan_status,Principal,terms,age,education,Sex
xqd20166,PAIDOFF,1000,30,45,High Sch,male
xqd20168,PAIDOFF,500,30,50,Bechalor,female
xqd20160,PAIDOFF,1000,30,33,Bechalor,female
xqd20160,PAIDOFF,895,15,27,college,male
xqd20160,PAIDOFF,1000,30,28,college,female


Regardons maintenant le détail de ces données avec la procédure `contents`. plus  précisément le troisième tableau;

In [3]:
proc contents data=loan;
run;

0,1,2,3
Data Set Name,WORK.LOAN,Observations,5
Member Type,DATA,Variables,7
Engine,V9,Indexes,0
Created,01/18/2018 14:35:52,Observation Length,56
Last Modified,01/18/2018 14:35:52,Deleted Observations,0
Protection,,Compressed,NO
Data Set Type,,Sorted,NO
Label,,,
Data Representation,"SOLARIS_X86_64, LINUX_X86_64, ALPHA_TRU64, LINUX_IA64",,
Encoding,utf-8 Unicode (UTF-8),,

Engine/Host Dependent Information,Engine/Host Dependent Information.1
Data Set Page Size,65536
Number of Data Set Pages,1
First Data Page,1
Max Obs per Page,1166
Obs in First Data Page,5
Number of Data Set Repairs,0
Filename,/tmp/SAS_work94B000004122_localhost.localdomain/loan.sas7bdat
Release Created,9.0401M5
Host Created,Linux
Inode Number,674483

Alphabetic List of Variables and Attributes,Alphabetic List of Variables and Attributes,Alphabetic List of Variables and Attributes,Alphabetic List of Variables and Attributes
#,Variable,Type,Len
7,Gender,Char,8
1,Loan_ID,Char,8
3,Principal,Num,8
5,age,Num,8
6,education,Char,8
2,loan_status,Char,8
4,terms,Num,8


Une autre façon d'avoir le détail sur un jeu de données auparavant crée

In [None]:
proc datasets NOLIST;
   contents data=loan;
run;

À la première ligne du tableau _Alphabetic List of Variables and Attributes_ on voit bien que le nom de variable `Gender` n'a pas vraiment changé de nom, mais bien l'affichage de celle-ci qui a changé.

Et si nous voulons maintenant changer le format de la variable `Principal` en $

In [47]:
title "Ici nous changeons l'affichage de la variable Gender par Sex";
proc print data=loan noobs label;
label  Gender='Sex';
format Principal dollar12.;
run;


Loan_ID,loan_status,Principal,terms,age,education,Sex
xqd20166,PAIDOFF,"$1,000",30,45,High Sch,male
xqd20168,PAIDOFF,$500,30,50,Bechalor,female
xqd20160,PAIDOFF,"$1,000",30,33,Bechalor,female
xqd20160,PAIDOFF,$895,15,27,college,male
xqd20160,PAIDOFF,"$1,000",30,28,college,female


### Formats de dates

Point important à souligner, lorsque SAS affiche les dates, les chiffres affichés sont le nombre de jours depuis le **Jan 1 1960** à la date saisie. 

Par exemple, le  **Jan 1 1961** c'est **365** qui sera affiché. Alors que **Jan 1 1959** sera **-365**

In [61]:
filename mesDos22 'data/emprunt_bancaire_2.csv';
/* utilisez la ligne suivante dans SAS OD */
*filename mesDos '/home/nmeraihi1/mondossier/emprunt_bancaire.csv';
data loan_1_2;
    infile mesDos22 dsd
     firstobs=2;
    input Loan_ID $ loan_status $ Principal terms age education $ Gender $ effective_date MMDDYY10. due_date MMDDYY10.;
run;
title "Les données originales du dataset emprunt_bancaire";
proc print data=loan_1_2 noobs;
label  Gender='Sex';
format Principal dollar12. effective_date MMDDYY10. due_date MMDDYY10.;
run;

Loan_ID,loan_status,Principal,terms,age,education,Gender,effective_date,due_date
xqd20166,PAIDOFF,"$1,000",30,45,High Sch,male,09/08/2016,.
xqd20160,PAIDOFF,"$1,000",30,33,Bechalor,female,09/08/2016,.


Reprenons le même exemple que celui présenté ci-haut, mais cette fois nous avons deux nouvelles variables **effective_date** et **due_date**. 

Utilisons une autre façon d'importer les données;

In [60]:
filename mesDos 'data/emprunt_bancaire_2.csv';
/* utilisez la ligne suivante dans SAS OD */
*filename mesDos '/home/nmeraihi1/mondossier/emprunt_bancaire_2.csv';

proc import datafile=mesDos
    DBMS=csv
    out=loan_5;
run;    

title "Changement de l'affichage des variables et du format";
proc print data=loan_5 noobs label;
label  Gender='Sex';
format Principal dollar12. ;
run;

Loan_ID,loan_status,Principal,terms,age,education,Sex,effective_date,due_date
xqd20166231,PAIDOFF,"$1,000",30,45,High School or Below,male,09/08/2016,10/07/2016
xqd20168902,PAIDOFF,$500,30,50,Bechalor,female,09/08/2016,10/07/2016
xqd20160003,PAIDOFF,"$1,000",30,33,Bechalor,female,09/08/2016,10/07/2016
xqd20160004,PAIDOFF,$895,15,27,college,male,09/08/2016,09/22/2016
xqd20160005,PAIDOFF,"$1,000",30,28,college,female,09/09/2016,10/08/2016


Avec la méthode `proc import` SAS est capable d'interpréter les dates sans même préciser le format!

In [62]:
title "Changement de l'affichage des variables et du format";
proc print data=loan_5 noobs label;
label  Gender='Sex';
format Principal dollar12. effective_date MMDDYY10. due_date MMDDYY10.;
run;


Loan_ID,loan_status,Principal,terms,age,education,Sex,effective_date,due_date
xqd20166231,PAIDOFF,"$1,000",30,45,High School or Below,male,09/08/2016,10/07/2016
xqd20168902,PAIDOFF,$500,30,50,Bechalor,female,09/08/2016,10/07/2016
xqd20160003,PAIDOFF,"$1,000",30,33,Bechalor,female,09/08/2016,10/07/2016
xqd20160004,PAIDOFF,$895,15,27,college,male,09/08/2016,09/22/2016
xqd20160005,PAIDOFF,"$1,000",30,28,college,female,09/09/2016,10/08/2016


# PROC FORMAT

Ce que nous avons vu précédemment nous sert à changer le format lors de l'affichage des données avec un affichage prédéfini. Y'a-t-il une façon de créer ses propres formats?

Par exemple, on veut changer **male** par **Homme** et **female** par **Femme**. Il existe une procédure appelée `PROC FORMAT`. Le nom du nouveau format personnalisé peut prendre de 1 à 31 caractères qui doit commencer par le signe $ pour les caractères de type _string_.

In [64]:
proc format;
value $sexefmt 'female'='Fille' 'male'='Garçon';                
run;

N'oublions pas le point requis à la fin du format créé.

In [67]:
title "Changement de l'affichage des variables et du format en plus du format personnel";
proc print data=loan_5 noobs label;
label  Gender='Sex';
format Principal dollar12. Gender $sexefmt.;
run;

Loan_ID,loan_status,Principal,terms,age,education,Sex,effective_date,due_date
xqd20166231,PAIDOFF,"$1,000",30,45,High School or Below,Garçon,09/08/2016,10/07/2016
xqd20168902,PAIDOFF,$500,30,50,Bechalor,Fille,09/08/2016,10/07/2016
xqd20160003,PAIDOFF,"$1,000",30,33,Bechalor,Fille,09/08/2016,10/07/2016
xqd20160004,PAIDOFF,$895,15,27,college,Garçon,09/08/2016,09/22/2016
xqd20160005,PAIDOFF,"$1,000",30,28,college,Fille,09/09/2016,10/08/2016


## PROC FORMAT numérqiue

In [76]:
proc format;
value age_form low-<30='jeune'
            30-35='encore jeune'
            35<-high='moins jeune';
run;


title "Changement de l'affichage des variables et du format en plus du format personnel";
proc print data=loan_5 noobs label;
label  Gender='Sex';
format Principal dollar12. Gender $sexefmt. age age_form.;
run;

Loan_ID,loan_status,Principal,terms,age,education,Sex,effective_date,due_date
xqd20166231,PAIDOFF,"$1,000",30,moins jeune,High School or Below,Garçon,09/08/2016,10/07/2016
xqd20168902,PAIDOFF,$500,30,moins jeune,Bechalor,Fille,09/08/2016,10/07/2016
xqd20160003,PAIDOFF,"$1,000",30,encore jeune,Bechalor,Fille,09/08/2016,10/07/2016
xqd20160004,PAIDOFF,$895,15,jeune,college,Garçon,09/08/2016,09/22/2016
xqd20160005,PAIDOFF,"$1,000",30,jeune,college,Fille,09/09/2016,10/08/2016
