data = csvRead("data.csv", ",", [], 'string');
genre = data(:,3);
nb_femmes = sum(genre == "Female");
nb_hommes = sum(genre == "Male");
Effectis = [nb_femmes; nb_hommes];
Etiquettes = ["Femmes", "Hommes"];
pie(Effectifs, Etiquettes);
data = csvRead("data.csv", ",", [], "string");
genre = data(:, 3);
niveau_etudes = strtod(data(:, 4));
niveau_etudes = [« High School », « Bachelor », « Master », « PhD »];
nb_femmes_hs = sum(genre == « Female » & niveau_etudes == 0);
nb_femmes_bachelor = sum(genre == « Female » & niveau_etudes == 1);
nb_femmes_master = sum(genre == « Female » & niveau_etudes == 2);
nb_femmes_phd = sum(genre == « Female » & niveau_etudes == 3);
nb_hommes_hs = sum(genre == « Mâle » & niveau_etudes == 0);
nb_hommes_bachelor = sum(genre == « Mâle » & niveau_etudes == 1);
nb_hommes_master = sum(genre == « Mâle « & niveau_etudes == 2);
nb_hommes_phd = sum(genre == « Mâle » & niveau_etudes == 3);
nb_other_hs = sum(genre == « Other » & niveau_etudes == 0);
nb_other_bachelor = sum(genre == « Other » & niveau_etudes == 1);
nb_other_master = sum(genre == « Other » & niveau_etudes == 2);
nb_other_bachelor = sum(genre == « Other » & niveau_etudes == 3);
effectifs_femmes = [nb_femmes_hs; nb_femmes_bachelor; nb_femmes_master; nb_femmes_phd];
effectifs_hommes = [nb_hommes_hs; nb_hommes_bachelor; nb_hommes_master; nb_hommes_phd];
effectifs_other = [nb_other_hs; nb_other_bachelor; nb_other_master; nb_other_phd];
Effectifs = [effectifs_femmes, effectifs_hommes, effectifs_other];
bar(Effectifs);
Legend(« Femmes », « Hommes », « Other »);
xlabel(« Niveau études »);
ylabel(« Effectifs »);
title(« Répartition des niveaux études selon le genre »);
data = csvRead("data.csv", ",", [], 'string');
salaire = strtod(data(:, 7));
age = strtod(data(:, 2));
experience = strtod(data(:, 6));
niveau_etudes = strtod(data(:, 4));
salaire_hs = salaire(niveau_etudes == 0);
age_hs = age(niveau_etudes == 0);
experience_hs = experience(niveau_etudes == 0);
salaire_bachelor = salaire(niveau_etudes == 1);
age_bachelor = age(niveau_etudes == 1);
experience_bachelor = experience(niveau_etudes == 1);
salaire_master = salaire(niveau_etudes == 2);
age_master = age(niveau_etudes == 2);
experience_master = experience(niveau_etudes == 2);
salaire_phd = salaire(niveau_etudes == 3);
age_phd = age(niveau_etudes == 3);
experience_phd = experience(niveau_etudes == 3);
moyenne_salaire_hs = mean(salaire_hs);
moyenne_age_hs = mean(age_hs);
moyenne_experience_hs = mean(experience_hs);
moyenne_salaire_bachelor = mean(salaire_bachelor);
moyenne_age_bachelor = mean(age_bachelor);
moyenne_experience_bachelor = mean(experience_bachelor);
moyenne_salaire_master = mean(salaire_master);
moyenne_age_master = mean(age_master);
moyenne_experience_master = mean(experience_master);
moyenne_salaire_phd = mean(salaire_phd);
moyenne_age_phd = mean(age_phd);
moyenne_experience_phd = mean(experience_phd);
| Niveau d'études | Moyenne Salaire | Moyenne Âge | Moyenne Expérience |
|---|---|---|---|
| High School | 36706.694 | 26.854911 | 1.9151786 |
| Bachelor | 95082.909 | 30.260179 | 5.4195631 |
| Master | 130112.06 | 35.171505 | 9.6456989 |
| PhD | 165651.46 | 41.154858 | 13.915267 |
data = csvRead('data.csv', ',', [], 'string');
salaire = strtod(data(:, 7));
age = strtod(data(:, 2));
experience = strtod(data(:, 6));
genre = data(:, 3);
salaire_homme = salaire(genre == "Male");
age_homme = age(genre == "Male");
experience_homme = experience(genre == "Male");
salaire_femme = salaire(genre == "Female");
age_femme = age(genre == "Female");
experience_femme = experience(genre == "Female");
salaire_other = salaire(genre == "Other");
age_other = age(genre == "Other");
experience_other = experience(genre == "Other");
moyenne_salaire_homme = mean(salaire_homme);
moyenne_age_homme = mean(age_homme);
moyenne_experience_homme = mean(experience_homme);
moyenne_salaire_femme = mean(salaire_femme);
moyenne_age_femme = mean(age_femme);
moyenne_experience_femme = mean(experience_femme);
moyenne_salaire_other = mean(salaire_other);
moyenne_age_other = mean(age_other);
moyenne_experience_other = mean(experience_other);
| Genre | Moyenne Salaire | Moyenne Âge | Moyenne Expérience |
|---|---|---|---|
| Femmes | 107889.00 | 32.626286 | 7.4201792 |
| Hommes | 121389.87 | 34.416394 | 8.6169662 |
| Autres | 125869.86 | 39.571429 | 16.428571 |
data = csvRead("data.csv", ",",[], 'string');
age = strtod(data(:,2));
nb_classe = [18:1:70];
histplot(nb_classe, age);
xlabel('Age');
ylabel('Frequence');
title('Distribution des ages');
data = csvRead("data.csv", ",",[], 'string');
experience = strtod(data(:,6));
nb_classe = [-1:1:25];
histplot(nb_classe, experience);
xlabel('Expérience');
ylabel('Frequence');
title('Distribution Expérience');
data = csvRead("data.csv", ",", [], 'string');
age = strtod(data(:,2));
Q = perctl(age, [20, 50, 75]);
Q1 = Q(1);
Q2 = Q(2);
Q3 = Q(3);
IQR = Q3 - Q1;
min_age = min(age);
max_age = max(age);
mean_age = mean(age);
unique_valeur = unique(age);
frequences = histc(age, unique_valeur);
[max_freq, idx] = max(frequences);
mode_age = unique_valeur(idx);
ecart_type_age = stedev(age);
disp(Q1);
27
disp(Q2);
32
disp(Q3);
38
disp(IQR);
11
disp(min_age);
21
disp(max_age);
62
disp(mean_age);
33.622033
disp(median_age);
32
disp(mode_age);
26
disp(ecart_type_age);
7.6156456
data = csvRead("data.csv", ",", [], 'string');
age = strtod(data(:,2));
boxplot(age);
xtitle('Boite a moustache de l''age');
data = csvRead("data.csv", ",", [], 'string');
experience = strtod(data(:,6));
Q = perctl(experience, [25, 50, 75];
Q = perctl(experience, [25, 50, 75]);
Q1 = Q(1);
Q2 = Q(2);
Q3 = Q(3);
IQR = Q3 - Q1;
min_experience = min(experience);
max_experience = max(experience);
mean_experience = mean(experience);
median_experience = median(experience);
unique_valeur = unique(experience);
frequences = histc(experience, unique_valeur);
[max_freq, idx] = max(frequences);
mode_experience = unique_valeur(idx);
ecart_type_experience = stdev(experience);
disp(Q1);
3
disp(Q2);
7
disp(Q3);
12
disp(IQR);
9
disp(min_experience);
0
disp(max_experience);
34
disp(mean_experience);
8.0950142
disp(median_experience);
7
disp(mode_experience);
1.5
disp(ecart_type_experience);
6.0598534
data = csvRead("data.csv", ",", [], 'string');
experience = strtod(data(:,6));
boxplot(experience);
xtitle('Boite a moustache de l''expérience');
data = csvRead("data.csv", ",", [], 'string');
genre = data(:, 3);
salaires = strtod(data(:, 7));
Définition des catégories de genre :
categories_genre = ["Female", "Male", "Other"];
salaires_femmes = salaires(genre == "Female");
salaires_hommes = salaires(genre == "Male");
salaires_autres = salaires(genre == "Other");
bar([1, 2, 3], [mean(salaires_femmes), mean(salaires_hommes), mean(salaires_autres)]);
xlabel('Genre');
ylabel('Salaire moyen');
title('Distribution des salaires selon le genre');
data = csvRead("data.csv", ",", [], 'string');
niveau_etudes = strtod(data(:,4));
salaires = strtod(data(:,7));
salaire_hs = salaires(niveau_etudes == 0);
salaires = strtod(data(:,7));
salaire_hs = salaires(niveau_etudes == 0);
salaire_bachelor = salaires(niveau_etudes == 1);
salaire_master = salaires(niveau_etudes == 2);
salaire_phd = salaires(niveau_etudes == 3);
moyenne_hs = mean(salaire_hs);
moyenne_bachelor = mean(salaire_bachelor);
moyenne_master = mean(salaire_master);
moyenne_phd = mean(salaire_phd);
niveaux_etudes_labels = ["High School", "Bachelor", "Master", "PhD"];
niveaux_etudes_indices = 0:3;
bar(niveaux_etudes_indices, [moyenne_hs, moyenne_bachelor, moyenne_master, moyenne_phd]);
xlabel('Niveau d''études');
ylabel('Salaire moyen');
title('Histogramme des salaires moyens par niveau d''études');
salaires = strtod(data:(:,7));
salaires = strtod(data(:,7));
Q = perctl(salaires, [25, 50, 75]);
Q1 = Q(1);
Q2 = Q(2);
Q3 = Q(3);
IQR = Q3 - Q1;
min_salaire = min(salaires);
max_salaire = max(salaires);
mean_salaire = mean(salaires);
median_salaire = median(salaires);
ecart_type_salaire = stdev(salaires);
disp(Q1);
70000
disp(Q2);
115000
disp(Q3);
160000
disp(IQR);
90000
disp(min_salaire);
350
disp(max_salaire);
250000
disp(mean_salaire);
115326.96
disp(median_salaire);
115000
disp(ecart_type_salaire);
52786.184
boxplot(salaires);
xtitle("Boîte à moustaches des salaires');
data = csvRead("data.csv", ",", [], 'string');
genre = data(:, 3);
salaires = strtod(data(:, 7));
salaires_femmes = salaires(genre == "Female");
salaires_hommes = salaires(genre == "Male");
salaires_autres = salaires(genre == "Other");
Q_femmes = perctl(salaires_femmes, [25, 50, 75]);
Q1_femmes = Q_femmes(1);
Q2_femmes = Q_femmes(2);
Q3_femmes = Q_femmes(3);
min_femmes = min(salaires_femmes);
max_femmes = max(salaires_femmes);
mean_femmes = mean(salaires_femmes);
median_femmes = median(salaires_femmes);
ecart_type_femmes = stdev(salaires_femmes);
Q_hommes = perctl(salaires_hommes, [25, 50, 75]);
Q1_hommes = Q_hommes(1);
Q2_hommes = Q_hommes(2);
Q3_hommes = Q_hommes(3);
min_hommes = min(salaires_hommes);
max_hommes = max(salaires_hommes);
mean_hommes = mean(salaires_hommes);
median_hommes = median(salaires_hommes);
ecart_type_hommes = stdev(salaires_hommes);
Q_autres = perctl(salaires_autres, [25, 50, 75]);
Q1_autres = Q_autres(1);
Q2_autres = Q_autres(2);
Q3_autres = Q_autres(3);
min_autres = min(salaires_autres);
max_autres = max(salaires_autres);
mean_autres = mean(salaires_autres);
median_autres = median(salaires_autres);
ecart_type_autres = stdev(salaires_autres);
disp(Q1_femmes);
60000
disp(Q2_femmes);
105000
disp(Q3_femmes);
150000
disp(min_femmes);
500
disp(max_femmes);
220000
disp(mean_femmes);
107889.00
disp(median_femmes);
105000
disp(ecart_type_femmes);
52723.610
disp(Q1_hommes);
75000
disp(Q2_hommes);
120000
disp(Q3_hommes);
170000
disp(min_hommes);
350
disp(max_hommes);
250000
disp(mean_hommes);
121389.87
disp(median_hommes);
120000
disp(ecart_type_hommes);
52092.726
disp(Q1_autres);
69032
disp(Q2_autres);
158610
disp(Q3_autres);
161393
disp(min_autres);
62852
disp(max_autres);
166109
disp(mean_autres);
125869.86
disp(median_autres);
158610
disp(ecart_type_autres);
44242.383
data = csvRead("data.csv", ",", [], 'string');
age = strtod(data(:, 2));
salaire = strtod(data(:, 7));
coefficients = polyfit(age, salaire, 1);
a = coefficients(1);
b = coefficients(2);
scatter(age, salaire, 'filled');
x_fit = linspace(min(age), max(age), 100);
y_fit = a * x_fit + b;
plot(x_fit, y_fit, 'r-', 'LineWidth', 2);
xlabel('Âge');
ylabel('Salaire');
title('Nuage de points Âge vs Salaire avec droite de régression');
legend('Données', 'Droite de régression', 'Location', 'northwest');
r = corrcoef(age, salaire);
disp(r)
0.7280526
data = csvRead("data.csv", ",", [], 'string');
experience = strtod(data(:, 6));
salaire = strtod(data(:,7));
coefficients = polyfit(experience, salaire, 1);
a = coefficients(1);
b = coefficients(2);
scatter(experience, salaire);
x_fit = linspace(min(experience), max(experience), 100);
y_fit = a * x_fit + b;
plot(x_fit, y_fit, 'r-', 'LineWidth', 2);
xlabel('Expérience');
ylabel('Salaire');
title('Nuage de points Expérience vs Salaire avec droite de régression');
legend('Données', 'Droite de régression', 'Location', 'northwest');
r = corrcoef(experience, salaire);
disp(r);
0.8089689
data = csvRead("data.csv", ",", [], 'string');
salaire = strtod(data(:, 7));
experience = strtod(data(:, 6));
genre = data(:, 3);
salaire_hommes = salaire(genre =='Male');
experience_hommes = experience(genre == 'Male');
salaire_femmes = salaire(genre == 'Female');
experience_femmes = experience(genre == 'Female');
coefficients_hommes = polyfit(experience_hommes, salaire_hommes, 1);
coefficients_femmes = polyfit(experience_femmes, salaire_femmes, 1);
x_fit_hommes = linspace(min(experience_hommes), max(experience_hommes), 100);
y_fit_hommes = polyval(coefficients_hommes, x_fit_hommes);
x_fit_femmes = linspace(min(experience_femmes), max(experience_femmes), 100);
y_fit_femmes = polyval(coefficients_femmes, x_fit_femmes);
scatter(experience_hommes, salaire_hommes, 'b');
x_fit_hommes = linspace(min(experience_hommes), max(experience_hommes), 100);
y_fit_hommes = polyval(coefficients_hommes, x_fit_hommes);
plot(experience_hommes, salaire_hommes, 'b.');
plot(experience_femmes, salaire_femmes, 'r.');
plot(x_fit_hommes, y_fit_hommes, 'b-', 'LineWidth', 2);
plot(x_fit_femmes, y_fit_femmes, 'r-', 'LineWidth', 2);
xlabel('Experience');
ylabel('Salaire');
title("Nuage de points et droites de régression pour Hommes et Femmes");
legend(['Hommes', 'Femmes'], ['Régression Hommes', 'Régression Femmes']);
data = csvRead("data.csv", ",", [], 'string');
salaire = strtod(data(:, 7));
experience = strtod(data(:, 6));
niveau_etudes = strtod(data(:, 4));
salaire_hs = salaire(niveau_etudes == 0);
experience_hs = experience(niveau_etudes == 0);
salaire_bachelor = salaire(niveau_etudes == 1);
experience_bachelor = experience(niveau_etudes == 1);
salaire_master = salaire(niveau_etudes == 2);
experience_master = experience(niveau_etudes == 2);
salaire_phd = salaire(niveau_etudes == 3);
experience_phd = experience(niveau_etudes == 3);
coefficients_hs = polyfit(experience_hs, salaire_hs, 1);
coefficients_bachelor = polyfit(experience_bachelor, salaire_bachelor, 1);
coefficients_master = polyfit(experience_master, salaire_master, 1);
coefficients_phd = polyfit(experience_phd, salaire_phd, 1);
x_fit_hs = linspace(min(experience_hs), max(experience_hs), 100);
y_fit_hs = polyval(coefficients_hs, x_fit_hs);
x_fit_bachelor = linspace(min(experience_bachelor), max(experience_bachelor), 100);
y_fit_bachelor = polyval(coefficients_bachelor, x_fit_bachelor);
x_fit_master = linspace(min(experience_master), max(experience_master), 100);
y_fit_master = polyval(coefficients_master, x_fit_master);
x_fit_phd = linspace(min(experience_phd), max(experience_phd), 100);
y_fit_phd = polyval(coefficients_phd, x_fit_phd);
h1 = plot(experience_hs, salaire_hs, 'b.');
h2 = plot(experience_bachelor, salaire_bachelor, 'g.');
h3 = plot(experience_master, salaire_master, 'r.');
h4 = plot(experience_phd, salaire_phd, 'c.');
h5 = plot(x_fit_hs, y_fit_hs, 'b-', 'LineWidth', 2);
h6 = plot(x_fit_bachelor, y_fit_bachelor, 'g-', 'LineWidth', 2);
h7 = plot(x_fit_master, y_fit_master, 'r-', 'LineWidth', 2);
h8 = plot(x_fit_phd, y_fit_phd, 'c-', 'LineWidth', 2);
xlabel('Expérience');
ylabel('Salaire');
title('Nuage de points et droites de régression pour chaque niveau d''études');
legend([h1 h2 h3 h4 h5 h6 h7 h8], 'High School', 'Bachelor', 'Master', 'PhD',
'Régression High School', 'Régression Bachelor', 'Régression Master', 'Régression PhD', "location", "northwest");















