In [1]:
import pandas as pd

In [62]:
# Charger le fichier CSV
man_df = pd.read_csv('data/ANSUR_II_FEMALE_renommé.csv', encoding='cp1252', sep=';')

# Dictionnaire de renommage (sans doublons)
colonnes_a_renommer = {
    "stature": "Taille",
    "anklecircumference": "Tour de cheville", 
    "shoulderelbowlength": "Longueur de bras",
    "waistbacklength": "Profondeur des aisselles",
    "biacromialbreadth": "Largeur des epaules",
    "waistcircumference": "Tour de taille",
    "bicepscircumferenceflexed": "Tour de biceps",
    "chestcircumference": "Tour de poitrine",
    "chestheight": "Hauteur de poitrine",
    "calfcircumference": "Tour de mollet",
    "crotchheight": "Hauteur d’entrejambe",
    "forearmcircumferenceflexed": "Tour d_avant-bras",
    "forearmcenterofgriplength": "Longueur d_avant-bras",
    "headcircumference": "Tour de tete",
    "hipbreadth": "Largeur des hanches",
    "iliocristaleheight": "Hauteur des hanches",
    "kneeheightmidpatella": "Hauteur des genoux",
    "neckcircumference": "Tour du cou",
    "buttockkneelength": "Longueur du cou au genou",
    "acromialheight": "Hauteur des epaules",
    "bideltoidbreadth": "Largeur des epaules à l_horizontale",
    "sleevelengthspinewrist": "Longueur de la colonne vertebrale jusqu_au poignet",
    "thighcircumference": "Tour de cuisse",
    "sittingheight": "Longueur du tronc",
    "waistbreadth": "Largeur de la taille",
    "waistheightomphalion": "Hauteur de la taille",
    "wristcircumference": "Tour de poignet",
    "weightkg": "Poids en kg",
    "Age": "Age"
}

# Renommer les colonnes
man_df = man_df.rename(columns=colonnes_a_renommer)

# (Facultatif) Sauvegarder le fichier nettoyé
man_df.to_csv('data/ANSUR_II_FEMALE_corrigé.csv', encoding='utf-8', sep=';', index=False)


In [63]:
man_df.columns

Index(['ï»¿SubjectId', 'abdominalextensiondepthsitting',
       'Hauteur des Ã©paules (acromion)', 'acromionradialelength',
       'Tour de cheville', 'axillaheight', 'balloffootcircumference',
       'balloffootlength', 'Largeur des Ã©paules (biacromiale)',
       'Tour de biceps (contractÃ©)',
       ...
       'Branch', 'PrimaryMOS', 'SubjectsBirthLocation', 'SubjectNumericRace',
       'Ethnicity', 'DODRace', 'Ã‚ge', 'Heightin', 'Weightlbs',
       'WritingPreference'],
      dtype='object', length=108)

In [64]:
colonnes_voulues = [
    "Taille",
    "Tour de cheville",
    "Longueur du dos (fesses–genoux)",  # approximation de "Longueur du cou au genou"
    "Hauteur des épaules (acromion)",
    "Largeur des épaules (biacromiale)",
    "Tour de biceps (contracté)",
    "Tour de poitrine",
    "Hauteur de poitrine",
    "Tour de mollet",
    "Hauteur d’entrejambe",  # Corriger encodage si besoin
    "Tour d’avant-bras (contracté)",
    "Longueur centre de la main – avant-bras",
    "Tour de tête",
    "Largeur des hanches",
    "Hauteur des hanches (iliaques)",
    "Hauteur des genoux (milieu rotule)",
    "Tour du cou",
    "Largeur des épaules à l’horizontale (bi-deltoïde)",
    "Longueur de manche (colonne → poignet)",
    "Tour de cuisse",
    "Longueur du dos",
    "Largeur de la taille",
    "Tour de taille",
    "Hauteur de la taille (au nombril)",
    "Tour de poignet",
    "Poids (kg)",
    "Âge"  # ou 'Ã‚ge' si problème d'encodage
]

# Charger les colonnes existantes
man_df = pd.read_csv('data/ANSUR_II_MALE_renommé.csv', encoding='cp1252', sep=';')
man_df.columns = man_df.columns.str.strip()  # Nettoyage

# Correction pour le nom encodé d'Âge
if 'Ã‚ge' in man_df.columns:
    man_df = man_df.rename(columns={'Ã‚ge': 'Âge'})

# Sélection des colonnes
man_df = man_df[[col for col in colonnes_voulues if col in man_df.columns]]

print(man_df.head())


   Taille  Tour de cheville  Tour de poitrine  Hauteur de poitrine  \
0    1776               222              1074                 1292   
1    1702               220              1021                 1244   
2    1735               230              1120                 1288   
3    1655               230              1114                 1205   
4    1914               247              1048                 1452   

   Tour de mollet  Largeur des hanches  Hauteur des hanches (iliaques)  \
0             373                  332                            1071   
1             357                  312                            1046   
2             412                  349                            1053   
3             395                  338                             986   
4             425                  332                            1251   

   Hauteur des genoux (milieu rotule)  Tour du cou  Tour de cuisse  \
0                                 502          400             6

In [29]:
print(man_df.columns.tolist())

['Taille', 'Tour de cheville', 'Tour de poitrine', 'Hauteur de poitrine', 'Tour de mollet', 'Largeur des hanches', 'Hauteur des hanches (iliaques)', 'Hauteur des genoux (milieu rotule)', 'Tour du cou', 'Tour de cuisse', 'Longueur du dos', 'Largeur de la taille', 'Tour de taille', 'Hauteur de la taille (au nombril)', 'Tour de poignet', 'Poids (kg)', 'Âge']


In [30]:
man_df.columns

Index(['Taille', 'Tour de cheville', 'Tour de poitrine', 'Hauteur de poitrine',
       'Tour de mollet', 'Largeur des hanches',
       'Hauteur des hanches (iliaques)', 'Hauteur des genoux (milieu rotule)',
       'Tour du cou', 'Tour de cuisse', 'Longueur du dos',
       'Largeur de la taille', 'Tour de taille',
       'Hauteur de la taille (au nombril)', 'Tour de poignet', 'Poids (kg)',
       'Âge'],
      dtype='object')

In [31]:
man_df=man_df[['Taille', 'Tour de cheville', 'Tour de poitrine', 'Hauteur de poitrine',
       'Tour de mollet', 'Largeur des hanches',
       'Hauteur des hanches (iliaques)', 'Hauteur des genoux (milieu rotule)',
       'Tour du cou', 'Tour de cuisse', 'Longueur du dos',
       'Largeur de la taille', 'Tour de taille',
       'Hauteur de la taille (au nombril)', 'Tour de poignet', 'Poids (kg)',
       'Âge']]

In [32]:
man_df.shape

(4082, 17)

In [33]:
man_df.describe()

Unnamed: 0,Taille,Tour de cheville,Tour de poitrine,Hauteur de poitrine,Tour de mollet,Largeur des hanches,Hauteur des hanches (iliaques),Hauteur des genoux (milieu rotule),Tour du cou,Tour de cuisse,Longueur du dos,Largeur de la taille,Tour de taille,Hauteur de la taille (au nombril),Tour de poignet,Poids (kg),Âge
count,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0
mean,1756.214601,229.343949,1058.705537,1291.118569,392.260657,345.733219,1061.629348,488.388045,397.648947,625.142332,477.612445,326.437286,940.577413,1056.485301,175.916707,855.239588,30.158991
std,68.550788,14.649102,87.435272,56.956697,29.708841,24.165314,52.015421,28.126196,25.776764,58.452171,27.728286,34.738095,111.705875,52.154671,8.955055,142.206992,8.810118
min,1491.0,156.0,774.0,1088.0,266.0,264.0,854.0,397.0,311.0,412.0,383.0,232.0,648.0,876.0,141.0,393.0,17.0
25%,1710.0,219.25,996.0,1252.25,372.0,329.25,1028.0,469.0,379.25,586.0,459.25,301.0,857.0,1020.0,170.0,756.0,23.0
50%,1755.0,228.0,1056.0,1289.0,392.0,344.0,1061.0,487.0,395.0,624.0,477.0,325.0,937.0,1055.0,176.0,846.0,28.0
75%,1802.0,239.0,1117.0,1329.0,412.0,361.0,1095.0,507.0,413.75,662.0,495.0,350.0,1016.0,1090.0,182.0,944.0,36.0
max,1993.0,293.0,1469.0,1506.0,523.0,452.0,1253.0,612.0,514.0,843.0,598.0,459.0,1379.0,1245.0,216.0,1442.0,58.0


In [34]:
bdims_df=pd.read_csv('data/bdims_corrigé.csv', encoding='cp1252', sep=';')

In [35]:
bdims_df.describe()

Unnamed: 0,Largeur des Ã©paules (biacromiale),Largeur des hanches (bi-iliaque),Largeur des hanches (bitrochantÃ©rienne),Profondeur de poitrine,Largeur de poitrine,Largeur du coude,Largeur du poignet,Largeur du genou,Largeur de la cheville,Tour dâ€™Ã©paule,...,Tour de biceps,Tour dâ€™avant-bras,Tour de genou,Tour de mollet,Tour de cheville,Tour de poignet,Ã‚ge,Poids,Taille,Sexe
count,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0,...,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0,507.0
mean,38.81144,27.82998,31.980473,19.226036,27.973767,13.385207,10.542604,18.810651,13.863314,108.195069,...,31.169625,25.942998,36.202959,36.078304,22.157396,16.097436,30.18146,69.147535,171.143787,0.487179
std,3.059132,2.206308,2.030916,2.515877,2.74165,1.352906,0.944361,1.347595,1.247351,10.374834,...,4.246941,2.830579,2.61757,2.847661,1.862337,1.380931,9.608472,13.345762,9.407205,0.500329
min,32.4,18.7,24.7,14.3,22.2,9.9,8.1,15.7,9.9,85.9,...,22.4,19.6,29.0,28.4,16.4,13.0,18.0,42.0,147.2,0.0
25%,36.2,26.5,30.6,17.3,25.65,12.4,9.8,17.9,13.0,99.45,...,27.6,23.6,34.4,34.1,21.0,15.0,23.0,58.4,163.8,0.0
50%,38.7,28.0,32.0,19.0,27.8,13.3,10.5,18.7,13.8,108.2,...,31.0,25.8,36.0,36.0,22.0,16.1,27.0,68.2,170.3,0.0
75%,41.15,29.25,33.35,20.9,29.95,14.4,11.2,19.6,14.8,116.55,...,34.45,28.4,37.95,38.0,23.3,17.1,36.0,78.85,177.8,1.0
max,47.4,34.7,38.0,27.5,35.6,16.7,13.3,24.3,17.2,134.8,...,42.4,32.5,49.0,47.7,29.3,19.6,67.0,116.4,198.1,1.0


In [36]:
bdims_df.columns

Index(['Largeur des Ã©paules (biacromiale)',
       'Largeur des hanches (bi-iliaque)',
       'Largeur des hanches (bitrochantÃ©rienne)', 'Profondeur de poitrine',
       'Largeur de poitrine', 'Largeur du coude', 'Largeur du poignet',
       'Largeur du genou', 'Largeur de la cheville', 'Tour dâ€™Ã©paule',
       'Tour de poitrine', 'Tour de taille', 'Tour du nombril',
       'Tour de hanches', 'Tour de cuisse', 'Tour de biceps',
       'Tour dâ€™avant-bras', 'Tour de genou', 'Tour de mollet',
       'Tour de cheville', 'Tour de poignet', 'Ã‚ge', 'Poids', 'Taille',
       'Sexe'],
      dtype='object')

In [37]:
caesar_df=pd.read_csv('data/caesar_corrigé.csv', encoding='cp1252', sep=';')

In [38]:
caesar_df.describe()

Unnamed: 0.1,index,Unnamed: 0,Ã‚ge,num_children,reported_height,reported_weight,reported_pants_size_waist,reported_pants_size_inseam,Tour de poitrine mesurÃ© Ã la main,bra_size_cup,...,ankle_height_inside,ankle_height_outside,axilla_height,elbow_height,Hauteur des genoux,Longueur de lâ€™avant-bras,sleeve_inseam,Longueur du cÃ´tÃ©,acromion_radial_stylion_len,Longueur de lâ€™Ã©paule
count,4465.0,4464.0,4452.0,4387.0,4452.0,4449.0,2285.0,2115.0,2139.0,2139.0,...,4331.0,4332.0,4334.0,4332.0,4331.0,4330.0,4332.0,4331.0,4329.0,4452.0
mean,2232.0,5980.450045,37.788971,0.988147,67.8473,163.852259,34.132867,32.200804,35.836372,2.26274,...,3.20305,2.7063,50.511886,43.26755,18.501728,9.840839,17.340661,21.842705,22.278755,7.996718
std,1289.078805,5985.331676,12.785712,1.256391,4.178552,39.760143,3.377014,2.354081,2.717329,1.130895,...,0.333025,0.262821,3.268623,2.754131,1.490363,0.805401,1.337167,1.645732,1.671648,0.697827
min,0.0,1.0,17.5,0.0,51.18,82.0,28.0,27.0,32.0,0.0,...,1.575,1.93,40.395,34.725,14.13,7.465,12.89,16.95,17.385,5.94
25%,1116.0,1622.75,26.5,0.0,64.96,135.0,32.0,30.0,34.0,1.0,...,2.97,2.52,48.19,41.34,17.4,9.245,16.41,20.625,21.065,7.48
50%,2232.0,2866.5,37.0,0.0,67.72,158.0,34.0,32.0,36.0,2.0,...,3.19,2.695,50.3525,43.07,18.41,9.8125,17.33,21.78,22.2,7.95
75%,3348.0,11335.5,48.0,2.0,70.87,185.0,36.0,34.0,38.0,3.0,...,3.425,2.875,52.635,45.1025,19.51,10.385,18.21625,22.98,23.44,8.47
max,4464.0,17079.0,79.0,8.0,85.83,415.0,59.1,40.0,46.0,6.0,...,4.82,4.04,64.805,55.23,25.335,13.49,23.56,29.2,29.175,10.79


In [39]:
caesar_df.columns

Index(['index', 'Unnamed: 0', 'Ã‚ge', 'num_children', 'Sexe',
       'reported_height', 'reported_weight', 'reported_pants_size_waist',
       'reported_pants_size_inseam', 'Tour de poitrine mesurÃ© Ã  la main',
       'bra_size_cup', 'age_range', 'shoe_size_us', 'Tour de cheville',
       'spine_to_scye_len', 'spine_to_elbow_len', 'Longueur de bras',
       'Longueur du bras', 'arm_len_shoulder_elbow', 'scye_circum',
       'Tour de poitrine', 'chest_circum_below_bust', 'chest_circum_scye',
       'Hauteur dâ€™entrejambe', 'hand_len', 'Tour de hanches haut',
       'Hauteur des hanches', 'Tour du cou', 'Largeur des Ã©paules', 'Taille',
       'Tour de cuisse', 'u_crotch', 'Tour de taille', 'Hauteur de la taille',
       'Poids', 'Largeur des Ã©paules Ã  lâ€™horizontale', 'bicristal_breadth',
       'bust_to_bust', 'cervical_height', 'Hauteur de poitrine',
       'interscye_dist', 'Hauteur des Ã©paules', 'acromion_radial_len',
       'ankle_height_inside', 'ankle_height_outside', 'axil

In [42]:
caesar_df=caesar_df[['Tour de poitrine mesurÃ© Ã  la main',
        'Tour de cheville',
       'Longueur de bras',
       'Longueur du bras', 
       'Tour de poitrine', 
       'Hauteur dâ€™entrejambe',
        'Tour de hanches haut',
       'Hauteur des hanches', 'Tour du cou', 'Largeur des Ã©paules', 'Taille',
       'Tour de cuisse','Tour de taille', 'Hauteur de la taille',
       'Poids', 'Largeur des Ã©paules Ã  lâ€™horizontale',
       'Hauteur de poitrine',
       'Hauteur des Ã©paules',
       'Hauteur des genoux', 'Longueur de lâ€™avant-bras',
       'Longueur du cÃ´tÃ©',
       'Longueur de lâ€™Ã©paule']]

KeyError: "['Tour de poitrine mesurÃ© Ã  la main', 'Largeur des Ã©paules Ã  lâ€™horizontale'] not in index"

In [40]:
caesar_df.describe()

Unnamed: 0.1,index,Unnamed: 0,Ã‚ge,num_children,reported_height,reported_weight,reported_pants_size_waist,reported_pants_size_inseam,Tour de poitrine mesurÃ© Ã la main,bra_size_cup,...,ankle_height_inside,ankle_height_outside,axilla_height,elbow_height,Hauteur des genoux,Longueur de lâ€™avant-bras,sleeve_inseam,Longueur du cÃ´tÃ©,acromion_radial_stylion_len,Longueur de lâ€™Ã©paule
count,4465.0,4464.0,4452.0,4387.0,4452.0,4449.0,2285.0,2115.0,2139.0,2139.0,...,4331.0,4332.0,4334.0,4332.0,4331.0,4330.0,4332.0,4331.0,4329.0,4452.0
mean,2232.0,5980.450045,37.788971,0.988147,67.8473,163.852259,34.132867,32.200804,35.836372,2.26274,...,3.20305,2.7063,50.511886,43.26755,18.501728,9.840839,17.340661,21.842705,22.278755,7.996718
std,1289.078805,5985.331676,12.785712,1.256391,4.178552,39.760143,3.377014,2.354081,2.717329,1.130895,...,0.333025,0.262821,3.268623,2.754131,1.490363,0.805401,1.337167,1.645732,1.671648,0.697827
min,0.0,1.0,17.5,0.0,51.18,82.0,28.0,27.0,32.0,0.0,...,1.575,1.93,40.395,34.725,14.13,7.465,12.89,16.95,17.385,5.94
25%,1116.0,1622.75,26.5,0.0,64.96,135.0,32.0,30.0,34.0,1.0,...,2.97,2.52,48.19,41.34,17.4,9.245,16.41,20.625,21.065,7.48
50%,2232.0,2866.5,37.0,0.0,67.72,158.0,34.0,32.0,36.0,2.0,...,3.19,2.695,50.3525,43.07,18.41,9.8125,17.33,21.78,22.2,7.95
75%,3348.0,11335.5,48.0,2.0,70.87,185.0,36.0,34.0,38.0,3.0,...,3.425,2.875,52.635,45.1025,19.51,10.385,18.21625,22.98,23.44,8.47
max,4464.0,17079.0,79.0,8.0,85.83,415.0,59.1,40.0,46.0,6.0,...,4.82,4.04,64.805,55.23,25.335,13.49,23.56,29.2,29.175,10.79


In [46]:
import pandas as pd

# Chargement du fichier CSV
df = pd.read_csv('data/bdims_corrigé.csv', encoding='cp1252', sep=';')

# Nouvelle liste de noms de colonnes
new_columns = [
"Largeur des epaules (biacromiale)",
"Largeur des hanches (bi-iliaque)",
"Largeur des hanches (bitrochanterienne)", 
"Profondeur de poitrine",
"Largeur de poitrine", 
"Largeur du coude", 
"Largeur du poignet",
"Largeur du genou", 
"Largeur de la cheville", 
"Tour d_epaule",
"Tour de poitrine", 
"Tour de taille", 
"Tour du nombril",
"Tour de hanches", 
"Tour de cuisse", 
"Tour de biceps",
"Tour d_avant-bras", 
"Tour de genou",
"Tour de mollet",
"Tour de cheville",
"Tour de poignet",
"Age",
"Poids",
"Taille",
"Sexe"]

# Attribution des nouveaux noms
df.columns = new_columns

# Sauvegarde du fichier modifié
df.to_csv("data/bdims_corrigé.csv", index=False)


In [47]:
df.columns

Index(['Largeur des epaules (biacromiale)', 'Largeur des hanches (bi-iliaque)',
       'Largeur des hanches (bitrochanterienne)', 'Profondeur de poitrine',
       'Largeur de poitrine', 'Largeur du coude', 'Largeur du poignet',
       'Largeur du genou', 'Largeur de la cheville', 'Tour d_epaule',
       'Tour de poitrine', 'Tour de taille', 'Tour du nombril',
       'Tour de hanches', 'Tour de cuisse', 'Tour de biceps',
       'Tour d_avant-bras', 'Tour de genou', 'Tour de mollet',
       'Tour de cheville', 'Tour de poignet', 'Age', 'Poids', 'Taille',
       'Sexe'],
      dtype='object')

In [60]:
man_df = pd.read_csv('data/ANSUR_II_MALE_corrigé.csv', encoding='cp1252', sep=';')

In [61]:
man_df.columns

Index(['Ã¯Â»Â¿subjectid', 'abdominalextensiondepthsitting',
       'Hauteur des ÃƒÂ©paules (acromion)', 'acromionradialelength',
       'Tour de cheville', 'axillaheight', 'balloffootcircumference',
       'balloffootlength', 'Largeur des ÃƒÂ©paules (biacromiale)',
       'Tour de biceps (contractÃƒÂ©)',
       ...
       'Branch', 'PrimaryMOS', 'SubjectsBirthLocation', 'SubjectNumericRace',
       'Ethnicity', 'DODRace', 'Ãƒâ€šge', 'Heightin', 'Weightlbs',
       'WritingPreference'],
      dtype='object', length=108)

In [75]:
man_df = pd.read_csv('data/ANSUR_II_MALE_corrigé.csv', encoding='cp1252', sep=';')
man_df = man_df[["Taille",
"Tour de cheville",
"Longueur de bras",
"Hauteur des aisselles",
"Longueur du dos",
"Largeur du dos",
"Tour de ventre maximal",
"Tour de biceps",
"Tour de poitrine",
"Tour de poitrine mesure à la main ",
"Hauteur de poitrine",
"Tour de mollet",
"Hauteur d_entrejambe",             
"Tour d_avant-bras",
"Longueur avant (main comprise)",
"Tour de tête",
"Tour de hanches haut",
"Largeur des hanches",
"Tour de hanches (assis)",
"Hauteur des hanches",
"Hauteur des genoux",
"Tour du cou",
"Longueur du dos jusqu_au genou",
"Largeur d_epaules",
"Hauteur des epaules",
"Largeur des epaules (horizontale)",
"Longueur du côte",
"Longueur de la colonne vertebrale jusqu_au poignet",
"Tour de cuisse",
"Longueur du tronc",
"Longueur du bras",
"Largeur de la taille",
"Tour de taille",   
"Hauteur de la taille",
"Tour de poignet"]
]

KeyError: "['Tour de cheville', 'Longueur de bras', 'Hauteur des aisselles', 'Longueur du dos', 'Largeur du dos', 'Tour de ventre maximal', 'Tour de biceps', 'Tour de poitrine', 'Tour de poitrine mesure à la main ', 'Hauteur de poitrine', 'Tour de mollet', 'Hauteur d_entrejambe', 'Tour d_avant-bras', 'Longueur avant (main comprise)', 'Tour de tête', 'Tour de hanches haut', 'Tour de hanches (assis)', 'Hauteur des hanches', 'Hauteur des genoux', 'Tour du cou', 'Longueur du dos jusqu_au genou', 'Largeur d_epaules', 'Hauteur des epaules', 'Largeur des epaules (horizontale)', 'Longueur du côte', 'Longueur de la colonne vertebrale jusqu_au poignet', 'Tour de cuisse', 'Longueur du tronc', 'Longueur du bras', 'Tour de taille', 'Hauteur de la taille', 'Tour de poignet'] not in index"

In [74]:
man_df.describe()

Unnamed: 0,ID sujet,Profondeur abdominale assis,Hauteur acromiale,Longueur acromion-radial,Circonference de la cheville,Hauteur de l_aisselle,Circonference du metatarse,Longueur du metatarse,Largeur biacromiale,Circonference du biceps flechi,...,Longueur frontale de la taille assis,Hauteur taille-omphalion,Poids (kg),Circonference du poignet,Hauteur du poignet,Race numerique du sujet,Race (DOD),Age,Taille (pouces),Poids (livres)
count,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,...,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0,4082.0
mean,20003.370897,254.650906,1440.736894,335.244488,229.343949,1329.082068,252.017148,200.935081,415.675649,358.135718,...,387.642822,1056.485301,855.239588,175.916707,847.511514,8.973542,1.534052,30.158991,70.035767,188.0049
std,6568.435122,37.327178,63.287242,17.482795,14.649102,59.516123,12.936131,10.470947,19.161654,34.618093,...,29.349007,52.154671,142.206992,8.955055,41.655628,83.012638,0.958815,8.810118,2.947419,29.941869
min,10027.0,163.0,1194.0,270.0,156.0,1106.0,186.0,156.0,337.0,246.0,...,293.0,876.0,393.0,141.0,695.0,1.0,1.0,17.0,60.0,0.0
25%,14270.25,227.0,1398.0,324.0,219.25,1289.0,243.0,194.0,403.0,335.0,...,367.0,1020.0,756.0,170.0,819.0,1.0,1.0,23.0,68.0,168.0
50%,17236.5,251.0,1439.0,335.0,228.0,1328.0,252.0,201.0,415.0,357.0,...,386.0,1055.0,846.0,176.0,847.0,1.0,1.0,28.0,70.0,185.0
75%,27315.75,279.0,1481.0,346.0,239.0,1367.0,261.0,208.0,428.0,380.0,...,407.0,1090.0,944.0,182.0,875.0,2.0,2.0,36.0,72.0,207.0
max,29452.0,451.0,1683.0,393.0,293.0,1553.0,306.0,245.0,489.0,490.0,...,494.0,1245.0,1442.0,216.0,1009.0,4251.0,8.0,58.0,94.0,321.0


In [71]:
df=read

In [72]:
df.columns

Index(['ID sujet', 'Profondeur abdominale assis', 'Hauteur acromiale',
       'Longueur acromion-radial', 'Circonference de la cheville',
       'Hauteur de l_aisselle', 'Circonference du metatarse',
       'Longueur du metatarse', 'Largeur biacromiale',
       'Circonference du biceps flechi',
       ...
       'Branche', 'Specialite principale (MOS)', 'Lieu de naissance du sujet',
       'Race numerique du sujet', 'Ethnie', 'Race (DOD)', 'Age',
       'Taille (pouces)', 'Poids (livres)', 'Preference d_ecriture'],
      dtype='object', length=108)

In [90]:
import pandas as pd

# Chargement du fichier avec encodage et séparateur corrects
df = pd.read_csv('data/ANSUR_II_MALE.csv', encoding='cp1252', sep=';')

# Liste des noms de colonnes traduits
colonnes_fr = ["ID sujet",
    "Profondeur abdominale assis",
    "Hauteur acromiale",
    "Longueur acromion-radial",
    "Circonference de la cheville",
    "Hauteur de l_aisselle",
    "Circonference du metatarse",
    "Longueur du metatarse",
    "Largeur biacromiale",
    "Circonference du biceps flechi",
    "Largeur bicristale",
    "Largeur bideltoïdienne",
    "Largeur bimalleolaire",
    "Arc tragion-menton",
    "Arc tragion-sous-mandibule",
    "Largeur bizygomatique",
    "Circonference des fesses",
    "Profondeur des fesses",
    "Hauteur des fesses",
    "Longueur fesses-genoux",
    "Longueur fesses-poplite",
    "Circonference du mollet",
    "Hauteur cervicale",
    "Largeur de la poitrine",
    "Circonference de la poitrine",
    "Profondeur de la poitrine",
    "Hauteur de la poitrine",
    "Hauteur de l_entrejambe",
    "Longueur entrejambe-omphalion",
    "Longueur entrejambe-posterieure-omphalion",
    "Largeur de l_oreille",
    "Longueur de l_oreille",
    "Saillie de l_oreille",
    "Hauteur du coude au repos",
    "Hauteur des yeux assis",
    "Largeur du pied (horizontal)",
    "Longueur du pied",
    "Longueur centre-prise avant-bras",
    "Circonference de l_avant-bras flechi",
    "Largeur avant-bras",
    "Longueur avant-bras-main",
    "Longueur fonctionnelle de la jambe",
    "Largeur de la main",
    "Circonference de la main",
    "Longueur de la main",
    "Largeur de la tête",
    "Circonference de la tête",
    "Longueur de la tête",
    "Circonference talon-cheville",
    "Largeur du talon",
    "Largeur des hanches",
    "Largeur des hanches assis",
    "Hauteur ilio-cristale",
    "Largeur interpupillaire",
    "Distance interscye I",
    "Distance interscye II",
    "Hauteur du genou (milieu de la rotule)",
    "Hauteur du genou assis",
    "Hauteur de l_epicondyle femoral lateral",
    "Hauteur de la malleole laterale",
    "Circonference basse de la cuisse",
    "Longueur menton-sellion",
    "Circonference du cou",
    "Circonference de la base du cou",
    "Portee des doigts au-dessus de la tête assis",
    "Longueur de la paume",
    "Hauteur poplitee",
    "Longueur radius-stylion",
    "Circonference de l_epaule",
    "Longueur epaule-coude",
    "Longueur de l_epaule",
    "Hauteur assise",
    "Longueur de manche (colonne vertebrale-poignet)",
    "Longueur exterieure de la manche",
    "Envergure",
    "Taille",
    "Hauteur suprasternale",
    "Hauteur de la 10e côte",
    "Circonference de la cuisse",
    "Degagement de la cuisse",
    "Portee du bout du pouce",
    "Hauteur tibiale",
    "Hauteur tragion-sommet de la tête",
    "Hauteur trochanterienne",
    "Circonference verticale du tronc (USA)",
    "Longueur arrière de la taille",
    "Largeur de la taille",
    "Circonference de la taille",
    "Profondeur de la taille",
    "Longueur frontale de la taille assis",
    "Hauteur taille-omphalion",
    "Poids (kg)",
    "Circonference du poignet",
    "Hauteur du poignet",
    "Genre",
    "Date",
    "Installation",
    "Composant",
    "Branche",
    "Specialite principale (MOS)",
    "Lieu de naissance du sujet",
    "Race numerique du sujet",
    "Ethnie",
    "Race (DOD)",
    "Age",
    "Taille (pouces)",
    "Poids (livres)",
    "Preference d_ecriture"]
    


# Vérification
assert len(df.columns) == len(colonnes_fr), f"Mismatch: {len(df.columns)} colonnes dans le CSV vs {len(colonnes_fr)} noms fournis."

# Renommage des colonnes
df.columns = colonnes_fr

# Sauvegarde dans un nouveau fichier
df.to_csv('data/ANSUR_II_MALE_corrigé.csv', index=False, sep=';', encoding='cp1252')


In [85]:
df_bdims = pd.read_csv('data/bdims_corrigé.csv', encoding='cp1252', sep=',')
df_bdims.columns

Index(['Largeur des epaules (biacromiale)', 'Largeur des hanches (bi-iliaque)',
       'Largeur des hanches (bitrochanterienne)', 'Profondeur de poitrine',
       'Largeur de poitrine', 'Largeur du coude', 'Largeur du poignet',
       'Largeur du genou', 'Largeur de la cheville', 'Tour d_epaule',
       'Tour de poitrine', 'Tour de taille', 'Tour du nombril',
       'Tour de hanches', 'Tour de cuisse', 'Tour de biceps',
       'Tour d_avant-bras', 'Tour de genou', 'Tour de mollet',
       'Tour de cheville', 'Tour de poignet', 'Age', 'Poids', 'Taille',
       'Sexe'],
      dtype='object')

In [83]:
df_caesar = pd.read_csv('data/caesar_corrigé.csv', encoding='cp1252', sep=',')
df_caesar.columns

Index(['index', 'Unnamed: 0', 'Age', 'num_children', 'Sexe', 'reported_height',
       'reported_weight', 'reported_pants_size_waist',
       'reported_pants_size_inseam', 'Tour de poitrine mesure Ã  la main',
       'bra_size_cup', 'age_range', 'shoe_size_us', 'Tour de cheville',
       'spine_to_scye_len', 'spine_to_elbow_len', 'Longueur de bras',
       'Longueur du bras', 'arm_len_shoulder_elbow', 'scye_circum',
       'Tour de poitrine', 'chest_circum_below_bust', 'chest_circum_scye',
       'Hauteur d_entrejambe', 'hand_len', 'Tour de hanches haut',
       'Hauteur des hanches', 'Tour du cou', 'Largeur des epaules', 'Taille',
       'Tour de cuisse', 'u_crotch', 'Tour de taille', 'Hauteur de la taille',
       'Poids', 'Largeur des epaules Ã  l_horizontale', 'bicristal_breadth',
       'bust_to_bust', 'cervical_height', 'Hauteur de poitrine',
       'interscye_dist', 'Hauteur des epaules', 'acromion_radial_len',
       'ankle_height_inside', 'ankle_height_outside', 'axilla_height

In [84]:
df_caesar.describe()

Unnamed: 0.1,index,Unnamed: 0,Age,num_children,reported_height,reported_weight,reported_pants_size_waist,reported_pants_size_inseam,Tour de poitrine mesure Ã la main,bra_size_cup,...,ankle_height_inside,ankle_height_outside,axilla_height,elbow_height,Hauteur des genoux,Longueur de l_avant-bras,sleeve_inseam,Longueur du cote,acromion_radial_stylion_len,Longueur de l_epaule
count,4465.0,4464.0,4452.0,4387.0,4452.0,4449.0,2285.0,2115.0,2139.0,2139.0,...,4331.0,4332.0,4334.0,4332.0,4331.0,4330.0,4332.0,4331.0,4329.0,4452.0
mean,2232.0,5980.450045,37.788971,0.988147,67.8473,163.852259,34.132867,32.200804,35.836372,2.26274,...,3.20305,2.7063,50.511886,43.26755,18.501728,9.840839,17.340661,21.842705,22.278755,7.996718
std,1289.078805,5985.331676,12.785712,1.256391,4.178552,39.760143,3.377014,2.354081,2.717329,1.130895,...,0.333025,0.262821,3.268623,2.754131,1.490363,0.805401,1.337167,1.645732,1.671648,0.697827
min,0.0,1.0,17.5,0.0,51.18,82.0,28.0,27.0,32.0,0.0,...,1.575,1.93,40.395,34.725,14.13,7.465,12.89,16.95,17.385,5.94
25%,1116.0,1622.75,26.5,0.0,64.96,135.0,32.0,30.0,34.0,1.0,...,2.97,2.52,48.19,41.34,17.4,9.245,16.41,20.625,21.065,7.48
50%,2232.0,2866.5,37.0,0.0,67.72,158.0,34.0,32.0,36.0,2.0,...,3.19,2.695,50.3525,43.07,18.41,9.8125,17.33,21.78,22.2,7.95
75%,3348.0,11335.5,48.0,2.0,70.87,185.0,36.0,34.0,38.0,3.0,...,3.425,2.875,52.635,45.1025,19.51,10.385,18.21625,22.98,23.44,8.47
max,4464.0,17079.0,79.0,8.0,85.83,415.0,59.1,40.0,46.0,6.0,...,4.82,4.04,64.805,55.23,25.335,13.49,23.56,29.2,29.175,10.79


In [88]:
import pandas as pd

# Chargement du fichier
df = pd.read_csv("data/caesar_corrigé.csv")

# Liste des nouveaux noms de colonnes en français
colonnes_fr = [
"index", 
"Unnamed: 0", 
"Age", 
"num_children", 
"Sexe",
"reported_height", 
"reported_weight", 
"reported_pants_size_waist",
"reported_pants_size_inseam", 
"Tour de poitrine mesure a la main",
"bra_size_cup", 
"age_range", 
"shoe_size_us", 
"Tour de cheville",
"spine_to_scye_len", 
"spine_to_elbow_len", 
"Longueur de bras",
"Longueur du bras", 
"arm_len_shoulder_elbow", 
"scye_circum",
"Tour de poitrine",
"chest_circum_below_bust", 
"chest_circum_scye",
"Hauteur d_entrejambe",
"hand_len", 
"Tour de hanches haut",
"Hauteur des hanches", 
"Tour du cou", 
"Largeur des epaules", 
"Taille",
"Tour de cuisse", 
"u_crotch", 
"Tour de taille", 
"Hauteur de la taille",
"Poids", 
"Largeur des epaules a l_horizontale",
"bicristal_breadth", 
"bust_to_bust", 
"cervical_height",
"Hauteur de poitrine", 
"interscye_dist", 
"Hauteur des epaules",
"acromion_radial_len", 
"ankle_height_inside", 
"ankle_height_outside",
"axilla_height", 
"elbow_height",
"Hauteur des genoux",
"Longueur de l_avant-bras", 
"sleeve_inseam", 
"Longueur du cote",
"acromion_radial_stylion_len", 
"Longueur de l_epaule", 
"dataset"]

# Vérification de la correspondance
assert len(df.columns) == len(colonnes_fr), "Le nombre de colonnes ne correspond pas"

# Renommage
df.columns = colonnes_fr

# Sauvegarde
df.to_csv("data/caesar_corrigé.csv", index=False, sep=';', encoding='cp1252')
