# "Manpower EDA Version: 2.0"
> "38 New Insights and Analysis based on Manpower Data Version: 1.0"

- toc: true
- comments: false
- categories: [Kuwait, Manpower, Analysis]
- image: /images/MACHINE%20THINKING.png
- hide: false
- search_exclude: true
- metadata_key1: version-02

##### Installing Libraries

In [None]:
#hide
!pip install pyreadstat
!pip install --upgrade plotly

Collecting pyreadstat
[?25l  Downloading https://files.pythonhosted.org/packages/10/15/9e24c4280d3fe1f18932bf1ef18ccaff7b95f1dc1f9085e08de4e1dade8e/pyreadstat-1.1.2-cp37-cp37m-manylinux2014_x86_64.whl (2.5MB)
[K     |████████████████████████████████| 2.5MB 12.9MB/s 
Installing collected packages: pyreadstat
Successfully installed pyreadstat-1.1.2
Collecting plotly
[?25l  Downloading https://files.pythonhosted.org/packages/1f/f6/bd3c17c8003b6641df1228e80e1acac97ed8402635e46c2571f8e1ef63af/plotly-4.14.3-py2.py3-none-any.whl (13.2MB)
[K     |████████████████████████████████| 13.2MB 275kB/s 
Installing collected packages: plotly
  Found existing installation: plotly 4.4.1
    Uninstalling plotly-4.4.1:
      Successfully uninstalled plotly-4.4.1
Successfully installed plotly-4.14.3


##### Importing Libraries and Dependencies

In [None]:
#hide
import pandas as pd
import numpy as np
import operator
from datetime import datetime, date

In [None]:
#hide
import warnings
warnings.filterwarnings('ignore')

In [None]:
#hide
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
%matplotlib inline

##### Importing Dataset

In [None]:
#hide

df = pd.read_spss('DataManPower.sav')

--2021-05-20 20:09:02--  https://haladrive.com/DataManPower.sav
Resolving haladrive.com (haladrive.com)... 52.60.239.45
Connecting to haladrive.com (haladrive.com)|52.60.239.45|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1342968378 (1.2G) [application/octet-stream]
Saving to: ‘DataManPower.sav’


2021-05-20 20:11:10 (10.0 MB/s) - ‘DataManPower.sav’ saved [1342968378/1342968378]



In [None]:
#hide
df.head()

Unnamed: 0,CIVIL_ID,BIRTH_DATE,COUNTRY_CODE,COUNTRY_DESC,GENDER_CODE,GENDER_DESC,RLGION_CODE,RLGION_DESC,JOB_CODE,JOB_DESC,SECTOR,ECONOMIC_ACT_CODE,ECONOMIC_ACT_DESC,EDUCATION_CODE,EDUCATION_DESC,MAJOR_CODE,SALARY,SALARY_TYPE,ONR_GVRN_CODE,GOVERNORATE_DESC,MARITAL_STATUS_CODE,MARITAL_STATUS_DESC,COMPANY_NAME,HIRE_DATE,ADDRESS_AUTO_NO,ONR_ID,جنسية
0,271121201014,1971,101.0,الكويت,2,انثى,,,43390,مسئول,PRIVATE,61244,التجارة العامة و المقاولات,,,,200,,5,محافظة الفروانية,2,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2020-02-18,13096531,271121200000.0,1.0
1,276032503881,1976,721.0,باكستان,1,ذكر,1.0,مسلم,83190,حداد,PRIVATE,61244,التجارة العامة و المقاولات,45.0,متوسط,453501.0,80,,5,محافظة الفروانية,2,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2008-04-15,13096531,271121200000.0,2.0
2,276121004718,1976,107.0,مصـــر,1,ذكر,1.0,مسلم,94985,نقاش,PRIVATE,61244,التجارة العامة و المقاولات,45.0,متوسط,453501.0,100,,5,محافظة الفروانية,1,أعزب,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2009-04-06,13096531,271121200000.0,2.0
3,270050801914,1970,107.0,مصـــر,1,ذكر,1.0,مسلم,94985,نقاش,PRIVATE,61244,التجارة العامة و المقاولات,45.0,متوسط,453501.0,300,,5,محافظة الفروانية,2,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2010-02-16,13096531,271121200000.0,2.0
4,294061303976,1994,107.0,مصـــر,1,ذكر,1.0,مسلم,3560,فنى كهربائي,PRIVATE,51204,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,45.0,متوسط,453501.0,150,,5,محافظة الفروانية,2,متزوج,شركة الفيالق الكويتية للتجارة العامة والمقاولات,2019-06-30,13094464,218654600000.0,2.0


##### Calculating Age

In [None]:
#hide
df['BIRTH_DATE'] = pd.to_datetime(df['BIRTH_DATE'], errors = 'coerce')
df['BIRTH_DATE']

0         1971-01-01
1         1976-01-01
2         1976-01-01
3         1970-01-01
4         1994-01-01
             ...    
1574035   1993-01-01
1574036   1991-01-01
1574037   1987-01-01
1574038   1999-01-01
1574039   1992-01-01
Name: BIRTH_DATE, Length: 1574040, dtype: datetime64[ns]

In [None]:
#hide
def from_dob_to_age(born):
    today = datetime.today()
    return (today - born).days / 365.25

In [None]:
#hide
df['Age'] = df['BIRTH_DATE'].apply(lambda x: from_dob_to_age(x))
df['Age'] 

0          50.381930
1          45.382615
2          45.382615
3          51.381246
4          27.381246
             ...    
1574035    28.380561
1574036    30.381930
1574037    34.381930
1574038    22.381930
1574039    29.382615
Name: Age, Length: 1574040, dtype: float64

In [None]:
df['Age'] = df['Age'].round(2)
df['Age']

0          50.38
1          45.38
2          45.38
3          51.38
4          27.38
           ...  
1574035    28.38
1574036    30.38
1574037    34.38
1574038    22.38
1574039    29.38
Name: Age, Length: 1574040, dtype: float64

##### Data Formatting

In [None]:
#hide
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1574040 entries, 0 to 1574039
Data columns (total 28 columns):
 #   Column               Non-Null Count    Dtype         
---  ------               --------------    -----         
 0   CIVIL_ID             1574040 non-null  object        
 1   BIRTH_DATE           1573540 non-null  datetime64[ns]
 2   COUNTRY_CODE         1574040 non-null  float64       
 3   COUNTRY_DESC         1574040 non-null  object        
 4   GENDER_CODE          1574040 non-null  object        
 5   GENDER_DESC          1574040 non-null  object        
 6   RLGION_CODE          1574040 non-null  object        
 7   RLGION_DESC          1574040 non-null  object        
 8   JOB_CODE             1574040 non-null  object        
 9   JOB_DESC             1574040 non-null  object        
 10  SECTOR               1574040 non-null  object        
 11  ECONOMIC_ACT_CODE    1574040 non-null  object        
 12  ECONOMIC_ACT_DESC    1574040 non-null  object        
 1

In [None]:
#hide
df['CIVIL_ID'] = pd.to_numeric(df['CIVIL_ID'])
df['COUNTRY_CODE'] = pd.to_numeric(df['COUNTRY_CODE'])
df['GENDER_CODE'] = pd.to_numeric(df['GENDER_CODE'])
df['COUNTRY_CODE'] = pd.to_numeric(df['COUNTRY_CODE'])
df['RLGION_CODE'] = pd.to_numeric(df['RLGION_CODE'])
df['JOB_CODE'] = pd.to_numeric(df['JOB_CODE'])
df['ECONOMIC_ACT_CODE'] = pd.to_numeric(df['ECONOMIC_ACT_CODE'])
df['EDUCATION_CODE'] = pd.to_numeric(df['EDUCATION_CODE'])
df['MAJOR_CODE'] = pd.to_numeric(df['MAJOR_CODE'])
df['SALARY'] = pd.to_numeric(df['SALARY'])
df['SALARY_TYPE'] = pd.to_numeric(df['SALARY_TYPE'])
df['ONR_GVRN_CODE'] = pd.to_numeric(df['ONR_GVRN_CODE'])
df['MARITAL_STATUS_CODE'] = pd.to_numeric(df['MARITAL_STATUS_CODE'])
df['ADDRESS_AUTO_NO'] = pd.to_numeric(df['ADDRESS_AUTO_NO'])
df['ONR_ID'] = pd.to_numeric(df['ONR_ID'])
df['جنسية'] = pd.to_numeric(df['جنسية'])

In [None]:
#hide
from datetime import datetime
df['HIRE_DATE'] = pd.to_datetime(df['HIRE_DATE'], errors = 'coerce')
df['BIRTH_DATE'] = pd.to_datetime(df['BIRTH_DATE'],errors = 'coerce')

In [None]:
#hide
df['COUNTRY_DESC'] = df['COUNTRY_DESC'].astype('str')
df['GENDER_DESC'] = df['GENDER_DESC'].astype('str')
df['RLGION_DESC'] = df['RLGION_DESC'].astype('str')
df['JOB_DESC'] = df['JOB_DESC'].astype('str')
df['SECTOR'] = df['SECTOR'].astype('str')
df['ECONOMIC_ACT_DESC'] = df['ECONOMIC_ACT_DESC'].astype('str')
df['EDUCATION_DESC'] = df['EDUCATION_DESC'].astype('str')
df['GOVERNORATE_DESC'] = df['GOVERNORATE_DESC'].astype('str')
df['MARITAL_STATUS_DESC'] = df['MARITAL_STATUS_DESC'].astype('str')
df['COMPANY_NAME'] = df['COMPANY_NAME'].astype('str')

In [None]:
#hide
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1574040 entries, 0 to 1574039
Data columns (total 28 columns):
 #   Column               Non-Null Count    Dtype         
---  ------               --------------    -----         
 0   CIVIL_ID             1574040 non-null  int64         
 1   BIRTH_DATE           1573540 non-null  datetime64[ns]
 2   COUNTRY_CODE         1574040 non-null  float64       
 3   COUNTRY_DESC         1574040 non-null  object        
 4   GENDER_CODE          1573962 non-null  float64       
 5   GENDER_DESC          1574040 non-null  object        
 6   RLGION_CODE          1502548 non-null  float64       
 7   RLGION_DESC          1574040 non-null  object        
 8   JOB_CODE             1574040 non-null  int64         
 9   JOB_DESC             1574040 non-null  object        
 10  SECTOR               1574040 non-null  object        
 11  ECONOMIC_ACT_CODE    1568276 non-null  float64       
 12  ECONOMIC_ACT_DESC    1574040 non-null  object        
 1

## Exploratory Data Analysis

In [None]:
#hide_input
df.columns

Index(['CIVIL_ID', 'BIRTH_DATE', 'COUNTRY_CODE', 'COUNTRY_DESC', 'GENDER_CODE',
       'GENDER_DESC', 'RLGION_CODE', 'RLGION_DESC', 'JOB_CODE', 'JOB_DESC',
       'SECTOR', 'ECONOMIC_ACT_CODE', 'ECONOMIC_ACT_DESC', 'EDUCATION_CODE',
       'EDUCATION_DESC', 'MAJOR_CODE', 'SALARY', 'SALARY_TYPE',
       'ONR_GVRN_CODE', 'GOVERNORATE_DESC', 'MARITAL_STATUS_CODE',
       'MARITAL_STATUS_DESC', 'COMPANY_NAME', 'HIRE_DATE', 'ADDRESS_AUTO_NO',
       'ONR_ID', 'جنسية', 'Age'],
      dtype='object')

In [None]:
#hide_input
df.describe()

Unnamed: 0,CIVIL_ID,COUNTRY_CODE,GENDER_CODE,RLGION_CODE,JOB_CODE,ECONOMIC_ACT_CODE,EDUCATION_CODE,MAJOR_CODE,SALARY,SALARY_TYPE,ONR_GVRN_CODE,MARITAL_STATUS_CODE,ADDRESS_AUTO_NO,ONR_ID,جنسية,Age
count,1574040.0,1574040.0,1573962.0,1502548.0,1574040.0,1568276.0,1485329.0,1485329.0,1574039.0,1.0,1574040.0,1574040.0,1219311.0,1574040.0,1574040.0,1573540.0
mean,280909300000.0,459.0476,1.106661,1.069316,66553.96,60537.9,180.4542,462556.1,316.2938,1.0,4.006389,1.836254,16104080.0,226328600000.0,1.954697,40.52874
std,10390150000.0,297.7552,0.3086816,0.6459896,33072.73,33119.91,15856.87,237409.3,446.9903,,2.315617,0.5376797,4275012.0,164013400000.0,0.2079669,10.38886
min,178020100000.0,0.0,1.0,0.0,0.0,8.0,-1.0,-1.0,1.425,1.0,1.0,1.0,0.0,18200000.0,1.0,-27.62
25%,274081900000.0,107.0,1.0,1.0,43333.0,51201.0,35.0,353002.0,100.0,1.0,2.0,2.0,13214880.0,127671500000.0,2.0,32.38
50%,282101000000.0,702.0,1.0,1.0,62450.0,61246.0,45.0,453501.0,180.0,1.0,4.0,2.0,16388360.0,213391300000.0,2.0,39.38
75%,289060600000.0,709.0,1.0,1.0,98515.0,71141.0,45.0,453501.0,350.0,1.0,6.0,2.0,18894780.0,280479000000.0,2.0,47.38
max,520040100000.0,883.0,2.0,4.0,3631153.0,3720003.0,9700800.0,9700800.0,26000.0,1.0,7.0,11.0,100000000.0,999779000000.0,2.0,143.38


In [None]:
#hide_input
df.dtypes

CIVIL_ID                        int64
BIRTH_DATE             datetime64[ns]
COUNTRY_CODE                  float64
COUNTRY_DESC                   object
GENDER_CODE                   float64
GENDER_DESC                    object
RLGION_CODE                   float64
RLGION_DESC                    object
JOB_CODE                        int64
JOB_DESC                       object
SECTOR                         object
ECONOMIC_ACT_CODE             float64
ECONOMIC_ACT_DESC              object
EDUCATION_CODE                float64
EDUCATION_DESC                 object
MAJOR_CODE                    float64
SALARY                        float64
SALARY_TYPE                   float64
ONR_GVRN_CODE                   int64
GOVERNORATE_DESC               object
MARITAL_STATUS_CODE             int64
MARITAL_STATUS_DESC            object
COMPANY_NAME                   object
HIRE_DATE              datetime64[ns]
ADDRESS_AUTO_NO               float64
ONR_ID                        float64
جنسية       

In [None]:
df.isnull().sum()

CIVIL_ID                     0
BIRTH_DATE                 500
COUNTRY_CODE                 0
COUNTRY_DESC                 0
GENDER_CODE                 78
GENDER_DESC                  0
RLGION_CODE              71492
RLGION_DESC                  0
JOB_CODE                     0
JOB_DESC                     0
SECTOR                       0
ECONOMIC_ACT_CODE         5764
ECONOMIC_ACT_DESC            0
EDUCATION_CODE           88711
EDUCATION_DESC               0
MAJOR_CODE               88711
SALARY                       1
SALARY_TYPE            1574039
ONR_GVRN_CODE                0
GOVERNORATE_DESC             0
MARITAL_STATUS_CODE          0
MARITAL_STATUS_DESC          0
COMPANY_NAME                 0
HIRE_DATE                   42
ADDRESS_AUTO_NO         354729
ONR_ID                       0
جنسية                        0
Age                        500
dtype: int64

In [None]:
#hide
data = df.drop(['COUNTRY_CODE', 'GENDER_CODE','RLGION_CODE', 'JOB_CODE', 'SECTOR','EDUCATION_CODE','ONR_GVRN_CODE',
'MAJOR_CODE','ECONOMIC_ACT_CODE', 'ADDRESS_AUTO_NO','ONR_ID', 'SALARY_TYPE','MARITAL_STATUS_CODE'],axis=1)

In [None]:
#hide_input
data.head()

Unnamed: 0,CIVIL_ID,BIRTH_DATE,COUNTRY_DESC,GENDER_DESC,RLGION_DESC,JOB_DESC,ECONOMIC_ACT_DESC,EDUCATION_DESC,SALARY,GOVERNORATE_DESC,MARITAL_STATUS_DESC,COMPANY_NAME,HIRE_DATE,جنسية,Age
0,271121201014,1971-01-01,الكويت,انثى,,مسئول,التجارة العامة و المقاولات,,200.0,محافظة الفروانية,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2020-02-18,1.0,50.38
1,276032503881,1976-01-01,باكستان,ذكر,مسلم,حداد,التجارة العامة و المقاولات,متوسط,80.0,محافظة الفروانية,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2008-04-15,2.0,45.38
2,276121004718,1976-01-01,مصـــر,ذكر,مسلم,نقاش,التجارة العامة و المقاولات,متوسط,100.0,محافظة الفروانية,أعزب,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2009-04-06,2.0,45.38
3,270050801914,1970-01-01,مصـــر,ذكر,مسلم,نقاش,التجارة العامة و المقاولات,متوسط,300.0,محافظة الفروانية,متزوج,مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات,2010-02-16,2.0,51.38
4,294061303976,1994-01-01,مصـــر,ذكر,مسلم,فنى كهربائي,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,متوسط,150.0,محافظة الفروانية,متزوج,شركة الفيالق الكويتية للتجارة العامة والمقاولات,2019-06-30,2.0,27.38


In [None]:
data.columns

Index(['CIVIL_ID', 'BIRTH_DATE', 'COUNTRY_DESC', 'GENDER_DESC', 'RLGION_DESC',
       'JOB_DESC', 'ECONOMIC_ACT_DESC', 'EDUCATION_DESC', 'SALARY',
       'GOVERNORATE_DESC', 'MARITAL_STATUS_DESC', 'COMPANY_NAME', 'HIRE_DATE',
       'جنسية', 'Age'],
      dtype='object')

In [None]:
data['COUNTRY_DESC'].unique()

array(['الكويت', 'باكستان', 'مصـــر', 'افغانستان', 'الهنــد', 'ســوريا',
       'الأردن', 'بنجلاديش', 'الفلبين', 'نيبال', 'سيلان ـ سيريلنكا',
       'اليمن', 'السودان', 'العراق', 'ايــران', 'لبنــان', 'المانيا',
       'اثيوبيا', 'البرتغال', 'المغـرب', 'ارمني', 'فلسطين', 'سيريلانكا',
       'البوسنه', 'الولايات المتحدة الأمريكية', 'كندا', 'الصين الشعبيه',
       'اندونسيا', 'تــونس', 'تركيا', 'مالــى', 'الصومال',
       'كوريا الجنوبية', 'فنزويل', 'غانا', 'السويد', 'كرواتيا', 'اوغندا',
       'نيجيريا', 'المملكه المتحده', 'هولندا', 'بولندا', 'فرنسا',
       'روسيا الإتحادية', 'استراليا', 'بلجيكا', 'نيوزيلندا',
       'جنوب افريقيا', 'اوكرانيا', 'كينيا', 'جورجيا', 'اسبانيا', 'بوتان',
       'ايطاليا', 'اليونان', 'رومانيا', 'كازاخستان', 'زيمبابوى',
       'طاجيكستان', 'المكسيك', 'ميانيمار', 'كونغو ديموقراطية',
       'الكاميرون', 'مقدونيا', 'قرغستان', 'غامبيا', 'سيراليون', 'تنزانيا',
       'بوركينا فاسو', 'أرتيريا', 'ماليزيا', 'جواتيمال', 'ساحـل العاج',
       'الجزائـر', 'ليبيــا', 'اذ

In [None]:
data['RLGION_DESC'].unique()

array(['', 'مسلم', 'ديانات أخري', 'مسيحي', 'هندوسي', 'بوذي'], dtype=object)

In [None]:
data['JOB_DESC'].value_counts()

عامل عادى خفيف                            164555
سائق مركبه خفيفه                          107114
بائع                                       99493
عامل نظافة                                 63878
عامل زراعى                                 39552
                                           ...  
اخصائى تطوير المنتجات                          1
مدير ادارة الوسطاء                             1
مساعد منسق سجلات طبيه                          1
مهندس اول انظمة الصحة والسلامة والبيئة         1
صفار                                           1
Name: JOB_DESC, Length: 2285, dtype: int64

In [None]:
data['EDUCATION_DESC'].unique()

array(['', 'متوسط', 'ثانوية', 'ابتدائي', 'جامعى', 'دبلوم',
       'دبلوم دراسات عليا سنة بعد الجامعى', 'جامعي', 'ماجستير',
       'خبرة وبدون مؤهل', 'دبلوم دراسات عليا سنتان بعد الجامعى',
       'دكتوراه'], dtype=object)

In [None]:
data['SALARY'].value_counts()

100.000     176864
250.000     128443
150.000     126880
75.000      113054
80.000       72402
             ...  
3113.000         1
714.060          1
3106.000         1
3102.000         1
771.575          1
Name: SALARY, Length: 7224, dtype: int64

In [None]:
data['GOVERNORATE_DESC'].unique()

array(['محافظة الفروانية', 'محافظة العاصمة', 'محافظة الجهراء',
       'محافظة الاحمدي', 'محافظة حولي', 'محافظة مبارك الكبير',
       'العقود الحكومية'], dtype=object)

In [None]:
data['MARITAL_STATUS_DESC'].unique()

array(['متزوج', 'أعزب', '', 'أرمل', 'مطلق', 'غير معرف'], dtype=object)

In [None]:
data['COMPANY_NAME'].unique()

array(['مؤسسة الرهيب الوطنية للتجارة العامة والمقاولات',
       'شركة الفيالق الكويتية للتجارة العامة والمقاولات',
       'مصنع نسيم الكويت لتصنيع الزجاج المشغول والمرايا المشغولة', ...,
       'شركه مطعم بومباي برياني', 'شركة الكناني استار للاثاث والمفروشات',
       'شركة لوفيت للسياحه والسفر'], dtype=object)

In [None]:
data['HIRE_DATE'].value_counts()

2020-12-01    3898
2020-11-01    3834
2020-09-01    3743
2020-10-01    3555
2020-04-01    3332
              ... 
2004-07-03       1
2003-10-04       1
1997-06-30       1
2002-09-29       1
2005-06-18       1
Name: HIRE_DATE, Length: 4826, dtype: int64

In [None]:
data['Age'].value_counts()

 33.38    65641
 34.38    59774
 30.38    58931
 36.38    58435
 35.38    58112
          ...  
-16.62        1
-23.62        1
 8.38         1
-15.62        1
-14.62        1
Name: Age, Length: 97, dtype: int64

In [None]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1574040 entries, 0 to 1574039
Data columns (total 15 columns):
 #   Column               Non-Null Count    Dtype         
---  ------               --------------    -----         
 0   CIVIL_ID             1574040 non-null  int64         
 1   BIRTH_DATE           1573540 non-null  datetime64[ns]
 2   COUNTRY_DESC         1574040 non-null  object        
 3   GENDER_DESC          1574040 non-null  object        
 4   RLGION_DESC          1574040 non-null  object        
 5   JOB_DESC             1574040 non-null  object        
 6   ECONOMIC_ACT_DESC    1574040 non-null  object        
 7   EDUCATION_DESC       1574040 non-null  object        
 8   SALARY               1574039 non-null  float64       
 9   GOVERNORATE_DESC     1574040 non-null  object        
 10  MARITAL_STATUS_DESC  1574040 non-null  object        
 11  COMPANY_NAME         1574040 non-null  object        
 12  HIRE_DATE            1573998 non-null  datetime64[ns]
 1

# VISUALIZATIONS

### Insight 1: Top 10 countries from which most of the people are Employeed

In [None]:
#hide_input
a = dict(data['COUNTRY_DESC'].value_counts())
insight1 = pd.DataFrame()
a = dict(sorted(a.items(), key=operator.itemgetter(1), reverse=True)[:10])
insight1['Country'] = a.keys()
insight1['Total'] = a.values()
insight1['Percentage'] = ((insight1['Total'] / 1574040)*100).round(2) 
insight1['Percentage'] = insight1['Percentage'].astype(str) + '%'
insight1

Unnamed: 0,Country,Total,Percentage
0,الهنــد,477043,30.31%
1,مصـــر,447370,28.42%
2,بنجلاديش,169610,10.78%
3,باكستان,72319,4.59%
4,الكويت,71308,4.53%
5,الفلبين,67942,4.32%
6,ســوريا,57882,3.68%
7,نيبال,47438,3.01%
8,الأردن,22864,1.45%
9,ايــران,20522,1.3%


In [None]:
#hide_input
fig = px.treemap(insight1, path=['Country', 'Total', 'Percentage'], values='Total',title="Top 10 Countries from which most of the people are Employeed")
fig.show()

### Insight 2 :  Religion of the Employees

In [None]:
#hide_input
b = dict(data['RLGION_DESC'].value_counts())
insight2 = pd.DataFrame()
b = dict(sorted(b.items(), key=operator.itemgetter(1), reverse=True)[:6])
insight2['Religion'] = b.keys()
insight2['Religion'] = insight2['Religion'].replace(r'^\s*$', "--", regex=True)
insight2['Total'] = b.values()
insight2['Percentage'] = ((insight2['Total'] / 1574040)*100).round(2)
insight2['Percentage'] = insight2['Percentage'].astype(str) + '%'
insight2

Unnamed: 0,Religion,Total,Percentage
0,مسلم,1005174,63.86%
1,مسيحي,235153,14.94%
2,ديانات أخري,218952,13.91%
3,--,71492,4.54%
4,هندوسي,41858,2.66%
5,بوذي,1411,0.09%


In [None]:
#hide_input
fig = px.bar(insight2,x="Religion",y="Total",color="Religion",text="Percentage",title = "Religion of the Employees")
fig.show()

### Insight 3: Top 10 Highlighted Jobs

In [None]:
#hide_input
c = dict(data['JOB_DESC'].value_counts())
insight3 = pd.DataFrame()
c = dict(sorted(c.items(), key=operator.itemgetter(1), reverse=True)[:10])
insight3['Jobs'] = c.keys()
insight3['Total'] = c.values()
insight3['Percentage'] = ((insight3['Total'] / 1574040)*100).round(2)
insight3['Percentage'] = insight3['Percentage'].astype(str) + '%'
insight3

Unnamed: 0,Jobs,Total,Percentage
0,عامل عادى خفيف,164555,10.45%
1,سائق مركبه خفيفه,107114,6.81%
2,بائع,99493,6.32%
3,عامل نظافة,63878,4.06%
4,عامل زراعى,39552,2.51%
5,عامل انتاج,32018,2.03%
6,عامل فنى,27331,1.74%
7,سائق معدات ثقيلة,27231,1.73%
8,سائق شاحنة,23128,1.47%
9,جارسون,20053,1.27%


In [None]:
#hide_input
fig = px.funnel(insight3, x='Jobs', y='Total',color="Jobs",text="Percentage", title = "Top 10 Highlighted Jobs")
fig.show()

### Insight 4 : Top 10 ECONOMIC ACTS

In [None]:
#hide_input
d = dict(data['ECONOMIC_ACT_DESC'].value_counts())
insight4 = pd.DataFrame()
d = dict(sorted(d.items(), key=operator.itemgetter(1), reverse=True)[:10])
insight4['Economic Act'] = d.keys()
insight4['Total'] = d.values()
insight4['Percentage'] = ((insight4['Total'] / 1574040)*100).round(2)
insight4['Percentage'] = insight4['Percentage'].astype(str) + '%'
insight4

Unnamed: 0,Economic Act,Total,Percentage
0,التجارة العامة و المقاولات,173082,11.0%
1,الادارة العامة ( ادارة الشركات ),82254,5.23%
2,المطاعم,64775,4.12%
3,التجارة العامة,58902,3.74%
4,المقاولات العامة للمباني,43664,2.77%
5,الاسواق المركزية,37392,2.38%
6,نقل البضائع داخل الكويت,36597,2.33%
7,مقاولات تنظيف المبانى و الشوارع,30410,1.93%
8,اعمال هندسية وتوريد وانشاءات,23693,1.51%
9,مقاولات انشاء ورصف الطرق والشوارع وغيرها,22449,1.43%


In [None]:
#hide_input
fig = px.scatter(insight4, x="Economic Act", y="Total",size="Total",color="Economic Act",text = "Percentage", title = "TOP 10 ECONOMIC ACTS")
fig.show()


### Insight 5: EDUCATIONAL LEVEL OF THE EMPLOYEES

In [None]:
#hide_input
e = dict(data['EDUCATION_DESC'].value_counts())
insight5 = pd.DataFrame()
e = dict(sorted(e.items(), key=operator.itemgetter(1), reverse=True)[:15])
insight5['Education'] = e.keys()
insight5['Education'] = insight5['Education'].replace(r'^\s*$', "--", regex=True)
insight5['Total'] = e.values()
insight5['Percentage'] = ((insight5['Total'] / 1574040)*100).round(2)
insight5['Percentage'] = insight5['Percentage'].astype(str) + '%'
insight5

Unnamed: 0,Education,Total,Percentage
0,متوسط,801314,50.91%
1,ثانوية,371240,23.59%
2,جامعى,144232,9.16%
3,ابتدائي,104106,6.61%
4,--,94649,6.01%
5,خبرة وبدون مؤهل,22210,1.41%
6,دبلوم,18131,1.15%
7,جامعي,12670,0.8%
8,دبلوم دراسات عليا سنة بعد الجامعى,2387,0.15%
9,ماجستير,1684,0.11%


In [None]:
#hide_input
fig = px.treemap(insight5, path=['Education', 'Total','Percentage'], values='Total',title = "EDUCATIONAL level of the Employees")
fig.show()

### Insight 6 : GOVERNORATE RANKING ON THE BASIS OF FREQUENCY FROM HIGHEST TO LEAST

In [None]:
#hide_input
f = dict(data['GOVERNORATE_DESC'].value_counts())
insight6 = pd.DataFrame()
f = dict(sorted(f.items(), key=operator.itemgetter(1), reverse=True)[:7])
insight6['Governorate'] = f.keys()
insight6['Total'] = f.values()
insight6['Ranking'] = insight6.index+1
insight6['Percentage'] = ((insight6['Total'] / 1574040)*100).round(2)
insight6['Percentage'] = insight6['Percentage'].astype(str) + '%'
insight6

Unnamed: 0,Governorate,Total,Ranking,Percentage
0,محافظة العاصمة,378777,1,24.06%
1,العقود الحكومية,354674,2,22.53%
2,محافظة الفروانية,221482,3,14.07%
3,محافظة مبارك الكبير,186621,4,11.86%
4,محافظة حولي,179403,5,11.4%
5,محافظة الاحمدي,153552,6,9.76%
6,محافظة الجهراء,99531,7,6.32%


In [None]:
#hide_input
fig = px.bar(insight6,x="Governorate",y="Total",color="Ranking",text="Percentage",title = "GOVERNORATE Ranking on the basis of Occurrence")
fig.show()

### Insight 7 : MARITAL STATUS OF THE EMPLOYEES

In [None]:
#hide_input
g = dict(data['MARITAL_STATUS_DESC'].value_counts())
insight7 = pd.DataFrame()
g = dict(sorted(g.items(), key=operator.itemgetter(1), reverse=True)[:6])
insight7['Marital Status'] = g.keys()
insight7['Marital Status'] = insight7['Marital Status'].replace(r'^\s*$', " -- ", regex=True)
insight7['Total'] = g.values()
insight7['Percentage'] = ((insight7['Total'] / 1574040)*100).round(2)
insight7['Percentage'] = insight7['Percentage'].astype(str) + '%'
insight7

Unnamed: 0,Marital Status,Total,Percentage
0,متزوج,1232659,78.31%
1,أعزب,319096,20.27%
2,--,15968,1.01%
3,غير معرف,3159,0.2%
4,مطلق,2394,0.15%
5,أرمل,764,0.05%


In [None]:
#hide_input
fig = px.bar(insight7,x="Marital Status",y="Total",color="Marital Status",text="Percentage",title = "MARITAL STATUS")
fig.show()

### Insight 8 : TOP 10 COMPANIES IN WHICH THE MAJOR PROPORTION OF PEOPLE IS EMPLOYEED

In [None]:
#hide_input
h = dict(data['COMPANY_NAME'].value_counts())
insight8 = pd.DataFrame()
h = dict(sorted(h.items(), key=operator.itemgetter(1), reverse=True)[:10])
insight8['Company'] = h.keys()
insight8['Total'] = h.values()
insight8['Ranking'] = insight8.index+1
insight8['Percentage'] = ((insight8['Total'] / 1574040)*100).round(2)
insight8['Percentage'] = insight8['Percentage'].astype(str) + '%'
insight8

Unnamed: 0,Company,Total,Ranking,Percentage
0,مبنى الركاب الجديد بمطار الكويت (المبنى 11),7109,1,0.45%
1,شركة محمد حمود الشايع,5525,2,0.35%
2,الشركة الاحمدية للمقاولات والتجارة,5292,3,0.34%
3,(10377) شركة مطاحن الدقيق والمخابز الكويتية,4613,4,0.29%
4,(ادارة العقودالحكوميه(اعادة قيد,3934,5,0.25%
5,مركز التجمع الجديد في جنوب وشرق الكويت GC-32,3756,6,0.24%
6,إنشاء وانجاز وصيانة مشروع معسكر الشيخ سالم الع...,3627,7,0.23%
7,شركة بدر الملا واخوانه,3616,8,0.23%
8,مشروع خط انابيب التغذية لشركة نفط الكويت للمصف...,3590,9,0.23%
9,الشركة الكويتية للاغذية ( الامريكانا ),3403,10,0.22%


In [None]:
#hide_input
fig = px.bar(insight8,x="Company",y="Total",color="Ranking",text="Percentage",title = "TOP 10 COMPANIES IN WHICH THE MAJOR PROPORTION OF PEOPLE IS EMPLOYEED")
fig.show()

### Insight 9 : TOP 5 HIRING MONTHS

In [None]:
#hide_input
top_5_HIRE_DATE = data['HIRE_DATE'].value_counts().head(5)
fig = px.bar(top_5_HIRE_DATE, title = 'TOP 5 HIRING MONTHS',color=top_5_HIRE_DATE)
fig.show()

### Insight 10 :  HIGHEST 10 SALARIES OFFERED BY COMPANIES

In [None]:
#hide_input
insight10 = pd.DataFrame()
insight10 = data.groupby("COMPANY_NAME")['SALARY'].mean()
insight10 = insight10.reset_index("COMPANY_NAME")
insight10 = insight10.nlargest(10,'SALARY')
insight10['Company'] = insight10['COMPANY_NAME']
insight10['Salary'] = insight10['SALARY']
insight10 = insight10.drop(['COMPANY_NAME','SALARY'],axis=1)
insight10

Unnamed: 0,Company,Salary
15534,الشركة المتحدة لصناعة الحديد,10900.0
3823,شركة التمدين الاستشارية,10000.0
53452,شركة اليسكو للمقاولات العامه للمباني,10000.0
47805,شركة السبعه لآلى القابضة,8925.0
53253,شركة الوسيلة لمشاريع التنمية العقارية,8535.0
52721,شركة النوادي القابضه,8000.0
59494,شركة جلوبال كليرينج هاوس سستمز,7000.0
62678,شركة رنفيكو جي تي ال للتجارة العامة والمقاولات,7000.0
70515,شركة كنسورتيوم التعليمية,6200.0
42025,شركة ارثر برازرز ليجاسي للتجارة العامة,6000.0


In [None]:
#hide_input
fig = px.sunburst(insight10, path=[insight10.index,'Company', 'Salary'], values='Salary')
fig.show()

### Insight 11 : COUNTRIES with 10 HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight11 = pd.DataFrame()
insight11 = data.groupby("COUNTRY_DESC")['SALARY'].mean().round(2)
insight11 = insight11.reset_index("COUNTRY_DESC")
insight11 = insight11.nlargest(10,'SALARY')
insight11['Country'] = insight11['COUNTRY_DESC']
insight11['Salary'] = insight11['SALARY']
insight11 = insight11.drop(['COUNTRY_DESC','SALARY'],axis=1)
insight11

Unnamed: 0,Country,Salary
3,أنتيغوا وباربودا,5325.0
120,غيانا الفرنسيه,3150.0
110,سويسرا,2464.68
53,ايرلندا,2181.8
63,بلجيكا,2155.06
94,دومينيكا,2077.14
38,المملكه المتحده,2015.31
124,فرنسا,1944.51
25,السلفادور,1942.0
57,باراجواى,1925.0


In [None]:
#hide_input
fig = px.pie(insight11, values='Salary', names='Country',title = "COUNTRIES WITH 10 HIGHEST MEAN SALARIES")
fig.update_traces(textposition='inside', textinfo='value')
fig.show()

###  Insight 12 : JOBS WITH 10 HIGHEST MEAN SALARY

In [None]:
#hide_input
insight12 = pd.DataFrame()
insight12 = data.groupby("JOB_DESC")['SALARY'].mean().round(2)
insight12 = insight12.reset_index("JOB_DESC")
insight12 = insight12.nlargest(10,'SALARY')
insight12['Job'] = insight12['JOB_DESC']
insight12['Salary'] = insight12['SALARY']
insight12 = insight12.drop(['JOB_DESC','SALARY'],axis=1)
insight12

Unnamed: 0,Job,Salary
326,رئيس مجموعة,10869.0
493,طبيب إستشارى نساء وولادة وعقم وأطفال أنابيب,10000.0
1288,مدير جامعة,9750.0
1600,مساعد عضو منتدب,9563.0
294,رئيس جامعة,9000.0
290,رئيس القطاع القانوني,8792.0
744,عضو منتدب,7463.86
181,الامين العام,7000.0
2236,نائب اول الرئيس التنفيذي,6785.0
288,رئيس ادارة,6196.0


In [None]:
#hide_input
fig = px.bar(insight12,x="Job",y="Salary",color="Job",text="Salary",title = "JOBS WITH 10 HIGHEST MEAN SALARIES")
fig.show()

### Insight 13 : 10 HIGHEST MEAN SALARIES ACCORDING TO  DIFFERENT EDUCATIONAL BACKGROUNDS

In [None]:
#hide_input
insight13 = pd.DataFrame()
insight13 = data.groupby("EDUCATION_DESC")['SALARY'].mean().round(2)
insight13 = insight13.reset_index("EDUCATION_DESC")
insight13 = insight13.nlargest(10,'SALARY')
insight13['Education'] = insight13['EDUCATION_DESC']
insight13['Salary'] = insight13['SALARY']
insight13 = insight13.drop(['EDUCATION_DESC','SALARY'],axis=1)
insight13['Education'] = insight13['Education'].replace(r'^\s*$', "--", regex=True)
insight13

Unnamed: 0,Education,Salary
9,دكتوراه,1437.19
10,ماجستير,1320.29
3,جامعى,852.71
4,جامعي,825.07
8,دبلوم دراسات عليا سنتان بعد الجامعى,767.83
0,--,581.84
7,دبلوم دراسات عليا سنة بعد الجامعى,527.28
2,ثانوية,287.74
6,دبلوم,233.91
11,متوسط,210.35


In [None]:
#hide_input
fig = px.bar(insight13,x="Education",y="Salary",color="Education",text="Salary",title = "HIGHEST MEAN SALARIES ACCORDING TO DIFFERENT EDUCATIONAL BACKGROUNDS")
fig.show()

### Insight 14 : GOVERNORATE ACCORDING TO HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight14 = pd.DataFrame()
insight14 = data.groupby("GOVERNORATE_DESC")['SALARY'].mean().round(2)
insight14 = insight14.reset_index("GOVERNORATE_DESC")
insight14 = insight14.nlargest(7,'SALARY')
insight14['Governorate'] = insight14['GOVERNORATE_DESC']
insight14['Salary'] = insight14['SALARY']
insight14 = insight14.drop(['GOVERNORATE_DESC','SALARY'],axis=1)
insight14

Unnamed: 0,Governorate,Salary
3,محافظة العاصمة,409.6
5,محافظة حولي,386.72
1,محافظة الاحمدي,305.14
4,محافظة الفروانية,283.83
2,محافظة الجهراء,274.8
0,العقود الحكومية,253.71
6,محافظة مبارك الكبير,247.98


In [None]:
#hide_input
fig = px.bar(insight14,x="Governorate",y="Salary",color="Governorate",text="Salary",title = "GOVERNORATE ACCORDING HIGHEST MEAN SALARIES")
fig.show()

### Insight 15 : COMPANIES ACCORDING TO COUNTRIES WITH 10 HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight15 = pd.DataFrame()
insight15 = data.groupby(["COUNTRY_DESC","COMPANY_NAME"])['SALARY'].mean()
insight15 = insight15.reset_index(["COUNTRY_DESC","COMPANY_NAME"])
insight15 = insight15.nlargest(10,'SALARY')
insight15['Country'] = insight15['COUNTRY_DESC']
insight15['Company'] = insight15['COMPANY_NAME']
insight15['Salary'] = insight15['SALARY']
insight15 = insight15.drop(['COUNTRY_DESC','COMPANY_NAME','SALARY'],axis=1)
insight15

Unnamed: 0,Country,Company,Salary
43797,الكويت,الشركة المتحدة لصناعة الحديد,20000.0
230618,لبنــان,شركة السبعه لآلى القابضة,15000.0
22462,السويد,شركة مؤسسة محمد ناصر الساير وأولاده,12000.0
53505,الكويت,شركة كردت ون كويت القابضة,12000.0
49859,الكويت,شركة باب المرقاب للتجارة العامة والمقاولات,11000.0
52597,الكويت,شركة صالون ومعهد مايلستونز لتجميل السيدات,11000.0
63879,المغـرب,بنك الكويت الدولى,10274.0
253,أنتيغوا وباربودا,سارة كولكشن للملابس الجاهزة والأحذية والحقائب ...,10000.0
41489,الكويت,شركة التمدين الاستشارية,10000.0
42063,الكويت,شركة اوكيانا العقارية,10000.0


In [None]:
#hide_input
fig = px.bar(insight15,x="Country",y="Salary",text="Salary",color = "Company",title = "COMPANIES ACCORDING TO COUNTRIES WITH HIGHEST MEAN SALARIES")
fig.show()

### Insight 16 : EDUCATIONAL LEVEL OF EMPLOYEES IN COMPANIES THAT ARE OFFERED WITH 10 HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight16 = pd.DataFrame()
insight16 = data.groupby(["COMPANY_NAME","EDUCATION_DESC"])['SALARY'].mean()
insight16 = insight16.reset_index(["COMPANY_NAME","EDUCATION_DESC"])
insight16 = insight16.nlargest(10,'SALARY')
insight16['Education'] = insight16['EDUCATION_DESC']
insight16['Company'] = insight16['COMPANY_NAME']
insight16['Salary'] = insight16['SALARY']
insight16 = insight16.drop(['EDUCATION_DESC','COMPANY_NAME','SALARY'],axis=1)
insight16['Education'] = insight16['Education'].replace(r'^\s*$', "--", regex=True)
insight16

Unnamed: 0,Education,Company,Salary
38188,--,الشركة المتحدة لصناعة الحديد,20000.0
152074,--,شركة كردت ون كويت القابضة,12000.0
118904,--,شركة باب المرقاب للتجارة العامة والمقاولات,11000.0
144100,--,شركة صالون ومعهد مايلستونز لتجميل السيدات,11000.0
9101,--,شركة التمدين الاستشارية,10000.0
16801,--,شركة اوكيانا العقارية,10000.0
86422,جامعى,شركة اربيان بورث ان للتجارة العامة,10000.0
107267,--,شركة الكويتية الاولى للخدمات التعليميه,10000.0
114154,جامعى,شركة اليسكو للمقاولات العامه للمباني,10000.0
114388,دكتوراه,شركة ام ام اى مونتريال ميديكال انترناشيونال لت...,10000.0


In [None]:
#hide_input
fig = px.bar(insight16,x="Company",y="Salary",text="Salary",color = "Education",title ="EDUCATIONAL LEVEL OF EMPLOYEES IN COMPANIES THAT ARE OFFERED WITH 10 HIGHEST MEAN SALARIES")
fig.show()

### Insight 17 : COMPANIES IN GOVERNORATE WITH 10 HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight17 = pd.DataFrame()
insight17 = data.groupby(["COMPANY_NAME","GOVERNORATE_DESC"])['SALARY'].mean()
insight17 = insight17.reset_index(["COMPANY_NAME","GOVERNORATE_DESC"])
insight17 = insight17.nlargest(10,'SALARY')
insight17['Governorate'] = insight17['GOVERNORATE_DESC']
insight17['Company'] = insight17['COMPANY_NAME']
insight17['Salary'] = insight17['SALARY']
insight17 = insight17.drop(['GOVERNORATE_DESC','COMPANY_NAME','SALARY'],axis=1)
insight17

Unnamed: 0,Governorate,Company,Salary
15534,محافظة العاصمة,الشركة المتحدة لصناعة الحديد,10900.0
3823,محافظة حولي,شركة التمدين الاستشارية,10000.0
53460,محافظة العاصمة,شركة اليسكو للمقاولات العامه للمباني,10000.0
47812,محافظة حولي,شركة السبعه لآلى القابضة,8925.0
53261,محافظة العاصمة,شركة الوسيلة لمشاريع التنمية العقارية,8535.0
52729,محافظة حولي,شركة النوادي القابضه,8000.0
59502,محافظة الجهراء,شركة جلوبال كليرينج هاوس سستمز,7000.0
62686,محافظة العاصمة,شركة رنفيكو جي تي ال للتجارة العامة والمقاولات,7000.0
70527,محافظة حولي,شركة كنسورتيوم التعليمية,6200.0
42031,محافظة حولي,شركة ارثر برازرز ليجاسي للتجارة العامة,6000.0


In [None]:
#hide_input
fig = px.bar(insight17,x="Company",y="Salary",text="Salary",color = "Governorate",title = "COMPANIES IN GOVERNORATE WITH 10 HIGHEST MEAN SALARIES")
fig.show()

### Insight 18 : Top 10 COMPANIES OFFERING MAXIMUM SALARY

In [None]:
#hide_input
insight18 = pd.DataFrame()
insight18 = data.groupby("COMPANY_NAME")['SALARY'].max()
insight18 = insight18.reset_index("COMPANY_NAME")
insight18 = insight18.nlargest(10,'SALARY')
insight18['Company'] = insight18['COMPANY_NAME']
insight18['Salary'] = insight18['SALARY'].round(2)
insight18 = insight18.drop(['COMPANY_NAME','SALARY'],axis=1)
insight18

Unnamed: 0,Company,Salary
20573,بنك وربه / مساهمة العامة,26000.0
20563,بنك الكويت الدولى,25000.0
44546,شركة البترول الوطنية الكويتية,24003.48
10976,10808 شركة ايكويت للبتروكيم...,22861.0
15534,الشركة المتحدة لصناعة الحديد,20000.0
53293,شركة الوطني للاستثمار,17500.0
104151,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,15366.0
9575,(10348) شركة التبريد والاكسجين المحدودة,15100.0
5430,الشركة الوطنية العقارية,15000.0
9689,(11084) الشركه المتحده لصناعه ا...,15000.0


In [None]:
#hide_input
fig = px.bar(insight18,x="Company",y="Salary",text="Salary",color = "Company",title = "Top 10 COMPANIES OFFERING MAXIMUM SALARY")
fig.show()

### INSIGHT 19

**Top 10 Companies :**

-- offering max salary 

-- country of that company

-- gender of that employee

In [None]:
#hide_input
insight19 = pd.DataFrame()
insight19 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"])['SALARY'].max()
insight19 = insight19.reset_index(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"])
insight19 = insight19.nlargest(10,'SALARY')
insight19['Company'] = insight19['COMPANY_NAME']
insight19['Country'] = insight19['COUNTRY_DESC']
insight19['Gender'] = insight19['GENDER_DESC']
insight19['Salary'] = insight19['SALARY'].round(2)
insight19 = insight19.drop(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"],axis=1)
insight19

Unnamed: 0,SALARY,Company,Country,Gender,Salary
67432,26000.0,بنك وربه / مساهمة العامة,الكويت,ذكر,26000.0
67214,25000.0,بنك الكويت الدولى,الكويت,ذكر,25000.0
123033,24003.485,شركة البترول الوطنية الكويتية,الهنــد,ذكر,24003.48
38103,22861.0,10808 شركة ايكويت للبتروكيم...,الكويت,ذكر,22861.0
53851,20000.0,الشركة المتحدة لصناعة الحديد,الكويت,ذكر,20000.0
149840,17500.0,شركة الوطني للاستثمار,الكويت,ذكر,17500.0
283183,15366.0,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,الأردن,ذكر,15366.0
32895,15100.0,(10348) شركة التبريد والاكسجين المحدودة,الكويت,ذكر,15100.0
18348,15000.0,الشركة الوطنية العقارية,الكويت,ذكر,15000.0
33927,15000.0,(11084) الشركه المتحده لصناعه ا...,الكويت,ذكر,15000.0


In [None]:
#hide_input
fig = px.sunburst(insight19, path=[insight19.index, 'Company','Country','Gender','Salary'], values='Salary',color='Salary', 
    hover_data=['Company','Country','Gender','Salary'],color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()


### INSIGHT 20

**Last 10 companies:**

-- offering min salary

-- country

-- gender of that employee

In [None]:
#hide_input
insight20 = pd.DataFrame()
insight20 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"])['SALARY'].min()
insight20 = insight20.reset_index(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"])
insight20 = insight20.nsmallest(10,'SALARY')
insight20['Company'] = insight20['COMPANY_NAME']
insight20['Country'] = insight20['COUNTRY_DESC']
insight20['Gender'] = insight20['GENDER_DESC']
insight20['Salary'] = insight20['SALARY'].round(2)
insight20 = insight20.drop(["COMPANY_NAME","COUNTRY_DESC","GENDER_DESC"],axis=1)
insight20

Unnamed: 0,SALARY,Company,Country,Gender,Salary
86249,1.425,توفير الدعم لأعمال السكرتارية والأعمال الإداري...,لبنــان,انثى,1.42
83255,2.0,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,الهنــد,ذكر,2.0
83266,2.0,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,نيبال,ذكر,2.0
307811,2.0,مشروع الوقود البئيى بمصفاة ميناء عبدالله,الهنــد,ذكر,2.0
307828,2.0,مشروع الوقود البئيى بمصفاة ميناء عبدالله,نيبال,ذكر,2.0
37898,2.3,(ادارة العقودالحكوميه(اعادة قيد,نيبال,ذكر,2.3
37868,2.34,(ادارة العقودالحكوميه(اعادة قيد,الهنــد,ذكر,2.34
83265,2.34,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,مصـــر,ذكر,2.34
40707,2.36,إنشاء حزمة رقم(6B) أعمال مواقف السيارات العلوي...,الهنــد,ذكر,2.36
40709,2.36,إنشاء حزمة رقم(6B) أعمال مواقف السيارات العلوي...,نيبال,ذكر,2.36


In [None]:
#hide_input
fig = px.sunburst(insight20, path=[insight20.index, 'Company','Country','Gender','Salary'], values='SALARY',
                  color='SALARY', hover_data=['Company','Country','Gender','Salary'],
                  color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()

### INSIGHT 21

**Top 10 companies:**

-- offering max salary

-- country situated

-- Governorate

-- educational level of that employee 


In [None]:
#hide_input
insight21 = pd.DataFrame()
insight21 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"])['SALARY'].max()
insight21 = insight21.reset_index(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"])
insight21 = insight21.nlargest(10,'SALARY')
insight21['Company'] = insight21['COMPANY_NAME']
insight21['Country'] = insight21['COUNTRY_DESC']
insight21['Governorate'] = insight21['GOVERNORATE_DESC']
insight21['Education'] = insight21['EDUCATION_DESC']
insight21['Salary'] = insight21['SALARY'].round(2)
insight21 = insight21.drop(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"],axis=1)
insight21['Education'] = insight21['Education'].replace(r'^\s*$', "--", regex=True)
insight21

Unnamed: 0,SALARY,Company,Country,Governorate,Education,Salary
96599,26000.0,بنك وربه / مساهمة العامة,الكويت,محافظة العاصمة,--,26000.0
96308,25000.0,بنك الكويت الدولى,الكويت,محافظة الجهراء,--,25000.0
171334,24003.485,شركة البترول الوطنية الكويتية,الهنــد,محافظة الاحمدي,جامعى,24003.48
53943,22861.0,10808 شركة ايكويت للبتروكيم...,الكويت,محافظة الاحمدي,--,22861.0
77732,20000.0,الشركة المتحدة لصناعة الحديد,الكويت,محافظة العاصمة,--,20000.0
209821,17500.0,شركة الوطني للاستثمار,الكويت,محافظة العاصمة,--,17500.0
385604,15366.0,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,الأردن,محافظة العاصمة,جامعى,15366.0
46204,15100.0,(10348) شركة التبريد والاكسجين المحدودة,الكويت,محافظة العاصمة,--,15100.0
25415,15000.0,الشركة الوطنية العقارية,الكويت,محافظة العاصمة,--,15000.0
48025,15000.0,(11084) الشركه المتحده لصناعه ا...,الكويت,محافظة العاصمة,--,15000.0


In [None]:
#hide_input
fig = px.sunburst(insight21, path=[insight21.index, "Company","Country","Governorate","Education"], values='SALARY',
                  color='SALARY',
                  color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()

### INSIGHT 22

**Last 10 companies :**

-- offering min salary

-- country situated

-- Governorate

-- educational level of that employee 


In [None]:
#hide_input
insight22 = pd.DataFrame()
insight22 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"])['SALARY'].min()
insight22 = insight22.reset_index(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"])
insight22 = insight22.nsmallest(10,'SALARY')
insight22['Company'] = insight22['COMPANY_NAME']
insight22['Country'] = insight22['COUNTRY_DESC']
insight22['Governorate'] = insight22['GOVERNORATE_DESC']
insight22['Education'] = insight22['EDUCATION_DESC']
insight22['Salary'] = insight22['SALARY'].round(2)
insight22 = insight22.drop(["COMPANY_NAME","COUNTRY_DESC","GOVERNORATE_DESC","EDUCATION_DESC"],axis=1)
insight22['Education'] = insight22['Education'].replace(r'^\s*$', "--", regex=True)
insight22

Unnamed: 0,SALARY,Company,Country,Governorate,Education,Salary
120891,1.425,توفير الدعم لأعمال السكرتارية والأعمال الإداري...,لبنــان,العقود الحكومية,ثانوية,1.42
115621,2.0,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,الهنــد,العقود الحكومية,متوسط,2.0
115641,2.0,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,نيبال,العقود الحكومية,متوسط,2.0
417894,2.0,مشروع الوقود البئيى بمصفاة ميناء عبدالله,الهنــد,العقود الحكومية,متوسط,2.0
417927,2.0,مشروع الوقود البئيى بمصفاة ميناء عبدالله,نيبال,العقود الحكومية,متوسط,2.0
115620,2.267,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,الهنــد,العقود الحكومية,ثانوية,2.27
417889,2.267,مشروع الوقود البئيى بمصفاة ميناء عبدالله,الهنــد,العقود الحكومية,ثانوية,2.27
53675,2.3,(ادارة العقودالحكوميه(اعادة قيد,نيبال,العقود الحكومية,ابتدائي,2.3
53604,2.34,(ادارة العقودالحكوميه(اعادة قيد,الهنــد,العقود الحكومية,متوسط,2.34
115640,2.34,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,مصـــر,العقود الحكومية,متوسط,2.34


In [None]:
#hide_input
fig = px.sunburst(insight22, path=[insight22.index, "Company","Country","Governorate","Education"], values='Salary',color='Salary',
                  color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()

## INSIGHT 23

**Top 10 companies:**

-- offering max salary

-- Governorate

-- Age

-- HIRE Date

In [None]:
#hide_input
insight23 = pd.DataFrame()
insight23 = data.groupby(["COMPANY_NAME","GOVERNORATE_DESC","Age","HIRE_DATE"])['SALARY'].max()
insight23 = insight23.reset_index(["COMPANY_NAME","GOVERNORATE_DESC","Age","HIRE_DATE"])
insight23 = insight23.nlargest(10,'SALARY')
insight23['Company'] = insight23['COMPANY_NAME']
insight23['Governorate'] = insight23['GOVERNORATE_DESC']
insight23['Hire Date'] = insight23['HIRE_DATE']
insight23['Salary'] = insight23['SALARY'].round(2)
insight23 = insight23.drop(["COMPANY_NAME","GOVERNORATE_DESC","HIRE_DATE","SALARY"],axis=1)
insight23

Unnamed: 0,Age,Company,Governorate,Hire Date,Salary
404546,53.38,بنك وربه / مساهمة العامة,محافظة العاصمة,2019-06-30,26000.0
401539,44.38,بنك الكويت الدولى,محافظة الجهراء,2020-10-01,25000.0
680830,57.38,شركة البترول الوطنية الكويتية,محافظة الاحمدي,2008-08-12,24003.48
181762,48.38,10808 شركة ايكويت للبتروكيم...,محافظة الاحمدي,2020-04-01,22861.0
328414,70.38,الشركة المتحدة لصناعة الحديد,محافظة العاصمة,2019-08-08,20000.0
404529,46.38,بنك وربه / مساهمة العامة,محافظة العاصمة,2020-10-04,17500.0
805399,43.38,شركة الوطني للاستثمار,محافظة العاصمة,2019-04-16,17500.0
1264786,75.38,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,محافظة العاصمة,2010-02-07,15366.0
145822,58.38,(10348) شركة التبريد والاكسجين المحدودة,محافظة العاصمة,2020-09-01,15100.0
74941,40.38,الشركة الوطنية العقارية,محافظة العاصمة,2020-05-01,15000.0


In [None]:
#hide_input
fig = px.treemap(insight23, path=[insight23.index,"Company","Governorate","Age","Hire Date"], values='Salary')
fig.show()

## INSIGHT 24

**Last 10 companies:**

-- offering min salary

-- Governorate

-- Age

-- HIRE Date

In [None]:
#hide_input
insight24 = pd.DataFrame()
insight24 = data.groupby(["COMPANY_NAME","GOVERNORATE_DESC","Age","HIRE_DATE"])['SALARY'].min()
insight24 = insight24.reset_index(["COMPANY_NAME","GOVERNORATE_DESC","Age","HIRE_DATE"])
insight24 = insight24.nsmallest(10,'SALARY')
insight24['Company'] = insight24['COMPANY_NAME']
insight24['Governorate'] = insight24['GOVERNORATE_DESC']
insight24['Hire Date'] = insight24['HIRE_DATE']
insight24['Salary'] = insight24['SALARY'].round(2)
insight24 = insight24.drop(["COMPANY_NAME","GOVERNORATE_DESC","HIRE_DATE","SALARY"],axis=1)
insight24

Unnamed: 0,Age,Company,Governorate,Hire Date,Salary
515848,62.38,توفير الدعم لأعمال السكرتارية والأعمال الإداري...,العقود الحكومية,2010-03-08,1.42
467053,27.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2017-04-12,2.0
467054,27.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2017-05-04,2.0
467057,27.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2018-01-09,2.0
467058,27.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2018-11-18,2.0
467062,28.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2018-10-30,2.0
467064,29.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2016-02-22,2.0
467066,29.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2016-06-16,2.0
467067,29.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2016-12-24,2.0
467070,29.38,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,2017-04-12,2.0


In [None]:
#hide_input
fig = px.treemap(insight24, path=[insight23.index,"Company","Governorate","Age","Hire Date"], values='Salary')
fig.show()

## Insight 25 : Age of 10 Most Aged Employees

In [None]:
#hide_input
i= dict(data['Age'].value_counts())
insight25 = pd.DataFrame()
i = dict(sorted(i.items(), key=operator.itemgetter(1), reverse=True)[:10])
insight25['Age'] = i.keys()
insight25['Total'] = i.values()
insight25

Unnamed: 0,Age,Total
0,33.38,65641
1,34.38,59774
2,30.38,58931
3,36.38,58435
4,35.38,58112
5,37.38,57373
6,31.38,57270
7,39.38,56847
8,29.38,56816
9,38.38,56737


In [None]:
#hide_input
fig = px.funnel(insight25, x='Age', y='Total',color="Age",title = "Age of 10 Most Aged Employee")
fig.show()

## Insight 26 : 10 MAX SALARY ACCORDING TO AGE

In [None]:
#hide_input
insight26 = pd.DataFrame()
insight26 = data.groupby("Age")['SALARY'].max().round(2)
insight26 = insight26.reset_index("Age")
insight26 = insight26.nlargest(10,'SALARY')
insight26['Salary'] = insight26['SALARY'].round(2)
insight26 = insight26.drop(["SALARY"],axis=1)
insight26

Unnamed: 0,Age,Salary
48,53.38,26000.0
39,44.38,25000.0
52,57.38,24003.48
43,48.38,22861.0
65,70.38,20000.0
38,43.38,17500.0
41,46.38,17500.0
70,75.38,15366.0
53,58.38,15100.0
31,36.38,15000.0


In [None]:
#hide_input
fig = px.bar(insight26,x="Age",y="Salary",text="Salary",color = "Age",title ="10 MAX SALARY ACCORDING TO AGE")
fig.show()

### INSIGHT 27

**Top 15 Companies :**

-- Country wise

-- age of the employee offered with max salary

In [None]:
#hide_input
insight27 = pd.DataFrame()
insight27 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","Age"])['SALARY'].max()
insight27 = insight27.reset_index(["COMPANY_NAME","COUNTRY_DESC","Age"])
insight27 = insight27.nlargest(15,'SALARY')
insight27['Company'] = insight27['COMPANY_NAME']
insight27['Country'] = insight27['COUNTRY_DESC']
insight27['Salary'] = insight27['SALARY'].round(2)
insight27 = insight27.drop(["COMPANY_NAME","COUNTRY_DESC","SALARY"],axis=1)
insight27

Unnamed: 0,Age,Company,Country,Salary
221195,53.38,بنك وربه / مساهمة العامة,الكويت,26000.0
220240,44.38,بنك الكويت الدولى,الكويت,25000.0
377313,57.38,شركة البترول الوطنية الكويتية,الهنــد,24003.48
116874,48.38,10808 شركة ايكويت للبتروكيم...,الكويت,22861.0
179948,70.38,الشركة المتحدة لصناعة الحديد,الكويت,20000.0
221192,46.38,بنك وربه / مساهمة العامة,الكويت,17500.0
461122,43.38,شركة الوطني للاستثمار,الكويت,17500.0
802555,75.38,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,الأردن,15366.0
97782,58.38,(10348) شركة التبريد والاكسجين المحدودة,الكويت,15100.0
52248,40.38,الشركة الوطنية العقارية,الكويت,15000.0


In [None]:
#hide_input
fig = px.treemap(insight27, path=[insight27.index,"Company","Country","Age"], values='Salary')

fig.update_layout(margin=dict(t=10, b=10, r=10, l=10))
fig.show()

### Insight 28 : Country Wise Top 10 Mean Age

In [None]:
insight28 = pd.DataFrame()
insight28 = data.groupby("COUNTRY_DESC")['Age'].mean().round(2)
insight28 = insight28.reset_index("COUNTRY_DESC")
insight28 = insight28.nlargest(10,'Age')
insight28['Country'] = insight28['COUNTRY_DESC']
insight28 = insight28.drop(["COUNTRY_DESC"],axis=1)
insight28['Country'] = insight28['Country'].replace(r'^\s*$', "--", regex=True)
insight28

Unnamed: 0,Age,Country
144,83.38,لوكسمبرج
157,73.38,ملاوى
57,62.38,باراجواى
72,60.38,بورونى
0,57.05,--
60,57.05,باليز
94,54.81,دومينيكا
40,52.91,النمسـا
3,52.88,أنتيغوا وباربودا
110,52.85,سويسرا


In [None]:
fig = px.pie(insight28, values='Age', names='Country',title = "Country Wise Top 10 Mean Age", hole=.3)
fig.update_traces(textposition='inside', textinfo='value')
fig.show()

### Insight 29 : EDUCATION WISE TOP 10 MEAN AGE OF EMPLOYEES

In [None]:
insight29 = pd.DataFrame()
insight29  = data.groupby("EDUCATION_DESC")['Age'].mean().round(2)
insight29  = insight29.reset_index("EDUCATION_DESC")
insight29  = insight29.nlargest(10,'Age')
insight29['Education'] = insight29['EDUCATION_DESC']
insight29 = insight29.drop(["EDUCATION_DESC"],axis=1)
insight29['Education'] = insight29['Education'].replace(r'^\s*$', "--", regex=True)
insight29 

Unnamed: 0,Age,Education
4,49.41,جامعي
1,46.7,ابتدائي
7,46.03,دبلوم دراسات عليا سنة بعد الجامعى
9,42.72,دكتوراه
10,41.12,ماجستير
3,40.75,جامعى
11,40.34,متوسط
2,39.69,ثانوية
0,39.14,--
8,38.38,دبلوم دراسات عليا سنتان بعد الجامعى


In [None]:
#hide_input
fig = px.scatter(insight29, x="Education", y="Age",size="Age",color="Education",text = "Age", title = " EDUCATION WISE TOP 10 MEAN AGE OF EMPLOYEES")
fig.show()

### Insight 30 : GOVERNORATE WISE MEAN AGE OF EMPLOYEES

In [None]:
insight30 = pd.DataFrame()
insight30  = data.groupby("GOVERNORATE_DESC")['Age'].mean().round(2)
insight30  = insight30.reset_index("GOVERNORATE_DESC")
insight30  = insight30.nlargest(10,'Age')
insight30['Governorate'] = insight30['GOVERNORATE_DESC']
insight30 = insight30.drop(["GOVERNORATE_DESC"],axis=1)
insight30 

Unnamed: 0,Age,Governorate
3,42.39,محافظة العاصمة
5,42.23,محافظة حولي
1,41.87,محافظة الاحمدي
4,41.85,محافظة الفروانية
2,40.51,محافظة الجهراء
0,38.35,العقود الحكومية
6,36.6,محافظة مبارك الكبير


In [None]:
#hide_input
fig = px.sunburst(insight30, path=['Governorate', 'Age'], values='Age')
fig.show()

### Insight 31 : ECONOMIC ACT WISE 10 HIGHEST MEAN SALARIES

In [None]:
#hide_input
insight31 = pd.DataFrame()
insight31 = data.groupby("ECONOMIC_ACT_DESC")['SALARY'].mean().round(2)
insight31 = insight31.reset_index("ECONOMIC_ACT_DESC")
insight31 = insight31.nlargest(10,'SALARY')
insight31['Economic Act'] = insight31['ECONOMIC_ACT_DESC']
insight31['Salary'] = insight31['SALARY']
insight31 = insight31.drop(['ECONOMIC_ACT_DESC','SALARY'],axis=1)
insight31

Unnamed: 0,Economic Act,Salary
560,تقديم خدمات مشغل شبكة الاتصالات المتنقلة الافت...,2750.0
730,صناعة المواد الكيميائية البترولية,2374.41
593,خدمات استشارات لحقول النفط والمصافي,2177.4
592,خدمات ادارة وتنفيذ المشاريع والاستشارات,2119.2
831,محطات وشبكات المجارى ونقل فضلات المجارى بالتنا...,2106.25
440,تجارة الكيماويات الصناعية الاحماض والقلويات,2028.16
35,استخراج البترول الخام والغاز الطبيعي,1800.18
827,مؤسسات وشركات التمويل والاستثمار,1570.96
600,خدمات الخطوط واشتراكات الهواتف النقالة,1510.93
109,البنوك المركزية,1474.41


In [None]:
#hide_input
fig = px.funnel(insight31, x='Economic Act', y='Salary',color="Economic Act", title = "ECONOMIC ACT WISE 10 HIGHEST MEAN SALARIES")
fig.show()

### Insight 32 : ECONOMIC ACT WISE TOP 10 MOST AGED EMPLOYEES

In [None]:
#hide_input
insight32 = pd.DataFrame()
insight32 = data.groupby("ECONOMIC_ACT_DESC")['Age'].mean().round(2)
insight32 = insight32.reset_index("ECONOMIC_ACT_DESC")
insight32 = insight32.nlargest(10,'Age')
insight32['Economic Act'] = insight32['ECONOMIC_ACT_DESC']
insight32 = insight32.drop(['ECONOMIC_ACT_DESC'],axis=1)
insight32

Unnamed: 0,Age,Economic Act
19,78.38,ادارة أعمال الوكالة التجارية
701,61.63,صناعة الروب (الزبادى)
246,60.18,انشطة اخرى خاصة باصلاح الساعات والمجوهرات
209,57.88,الوزارات والادارات وما في حكمها وفروعها (النشا...
438,53.81,تجارة الفحومات واخشاب الحريق
745,52.98,صناعة معدات مهنية وعلمية وقياس وتحكم
963,52.94,نقل ركاب خارجى
255,52.38,انشطة اخرى خاصة بالخدمات الدينية
843,52.38,مخمن تأمين ماعدا السيارات
285,52.13,انشطة اخرى خاصة بصناعة السيارات


In [None]:
fig = px.pie(insight32, values='Age', names='Economic Act',title = "ECONOMIC ACT WISE TOP 10 MOST AGED EMPLOYEES", hole=.3)
fig.update_traces(textposition='inside', textinfo='value')
fig.show()

### Insight 33 : COMPANIES ACCORDING TO ECONOMIC ACT WITH 10 HIGHEST MEAN SALARIES

In [None]:

insight33 = pd.DataFrame()
insight33 = data.groupby(["ECONOMIC_ACT_DESC","COMPANY_NAME"])['SALARY'].mean()
insight33 = insight33.reset_index(["ECONOMIC_ACT_DESC","COMPANY_NAME"])
insight33 = insight33.nlargest(10,'SALARY')
insight33['Economic Act'] = insight33['ECONOMIC_ACT_DESC']
insight33['Company'] = insight33['COMPANY_NAME']
insight33['Salary'] = insight33['SALARY']
insight33 = insight33.drop(['ECONOMIC_ACT_DESC','COMPANY_NAME','SALARY'],axis=1)
insight33

Unnamed: 0,Economic Act,Company,Salary
8368,الادارة العامة ( ادارة الشركات ),الشركة المتحدة لصناعة الحديد,10900.0
41970,المقاولات العامة للمباني,شركة اليسكو للمقاولات العامه للمباني,10000.0
109593,مؤسسات تقديم الاستشارات والابحاث المالية,شركة التمدين الاستشارية,10000.0
8669,الادارة العامة ( ادارة الشركات ),شركة السبعه لآلى القابضة,8925.0
8795,الادارة العامة ( ادارة الشركات ),شركة الوسيلة لمشاريع التنمية العقارية,8535.0
8784,الادارة العامة ( ادارة الشركات ),شركة النوادي القابضه,8000.0
8930,الادارة العامة ( ادارة الشركات ),شركة جلوبال كليرينج هاوس سستمز,7000.0
24667,التجارة العامة و المقاولات,شركة رنفيكو جي تي ال للتجارة العامة والمقاولات,7000.0
107363,فتح وانشاء مدارس عربيه اهليه و مدارس اجنبيه خاصه,شركة كنسورتيوم التعليمية,6200.0
1448,ادارة وتأجير العقارات,شركة الطور العقاريه,6000.0


In [None]:
#hide_input
fig = px.bar(insight33,x="Economic Act",y="Salary",text="Salary",color = "Company",title = "COMPANIES ACCORDING TO ECONOMIC ACT WITH 10 HIGHEST MEAN SALARIES")
fig.show()

### INSIGHT 34

**Top 10 Companies :**

-- offering max salary 

-- country of that company

-- Economic Act

In [None]:
#hide_input
insight34 = pd.DataFrame()
insight34 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","ECONOMIC_ACT_DESC"])['SALARY'].max()
insight34 = insight34.reset_index(["COMPANY_NAME","COUNTRY_DESC","ECONOMIC_ACT_DESC"])
insight34 = insight34.nlargest(10,'SALARY')
insight34['Company'] = insight34['COMPANY_NAME']
insight34['Country'] = insight34['COUNTRY_DESC']
insight34['Economic Act'] = insight34['ECONOMIC_ACT_DESC']
insight34['Salary'] = insight34['SALARY'].round(2)
insight34 = insight34.drop(["COMPANY_NAME","COUNTRY_DESC","SALARY","ECONOMIC_ACT_DESC"],axis=1)
insight34

Unnamed: 0,Company,Country,Economic Act,Salary
62560,بنك وربه / مساهمة العامة,الكويت,البنوك التجارية,26000.0
62379,بنك الكويت الدولى,الكويت,البنوك التجارية,25000.0
116496,شركة البترول الوطنية الكويتية,الهنــد,الادارة العامة ( ادارة الشركات ),24003.48
35084,10808 شركة ايكويت للبتروكيم...,الكويت,تجارة الكيماويات الصناعية الاحماض والقلويات,22861.0
49740,الشركة المتحدة لصناعة الحديد,الكويت,الادارة العامة ( ادارة الشركات ),20000.0
142290,شركة الوطني للاستثمار,الكويت,مؤسسات وشركات التمويل والاستثمار,17500.0
268873,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,الأردن,الادارة العامة ( ادارة الشركات ),15366.0
30499,(10348) شركة التبريد والاكسجين المحدودة,الكويت,صناعة الغازات الكيماوية,15100.0
16880,الشركة الوطنية العقارية,الكويت,الادارة العامة ( ادارة الشركات ),15000.0
31361,(11084) الشركه المتحده لصناعه ا...,الكويت,الصناعات الحديدية الخفيفة,15000.0


In [None]:
#hide_input
fig = px.sunburst(insight34, path=[insight34.index, 'Company','Country','Economic Act','Salary'], values='Salary',color='Salary', 
    hover_data=['Company','Country','Economic Act','Salary'],color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()

### INSIGHT 35

**Last 10 Companies :**

-- offering min salary 

-- country of that company

-- Economic Act

In [None]:
#hide_input
insight35 = pd.DataFrame()
insight35 = data.groupby(["COMPANY_NAME","COUNTRY_DESC","ECONOMIC_ACT_DESC"])['SALARY'].min()
insight35 = insight35.reset_index(["COMPANY_NAME","COUNTRY_DESC","ECONOMIC_ACT_DESC"])
insight35 = insight35.nsmallest(10,'SALARY')
insight35['Company'] = insight35['COMPANY_NAME']
insight35['Country'] = insight35['COUNTRY_DESC']
insight35['Economic Act'] = insight35['ECONOMIC_ACT_DESC']
insight35['Salary'] = insight35['SALARY'].round(2)
insight35 = insight35.drop(["COMPANY_NAME","COUNTRY_DESC","SALARY","ECONOMIC_ACT_DESC"],axis=1)
insight35

Unnamed: 0,Company,Country,Economic Act,Salary
80698,توفير الدعم لأعمال السكرتارية والأعمال الإداري...,لبنــان,حراسة المنشآت بواسطة الأفراد,1.42
78127,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,الهنــد,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,2.0
78138,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,نيبال,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,2.0
291877,مشروع الوقود البئيى بمصفاة ميناء عبدالله,الهنــد,مقاولات انشاء خطوط انابيب البترول والغاز الطبيعي,2.0
291917,مشروع الوقود البئيى بمصفاة ميناء عبدالله,نيبال,مقاولات انشاء خطوط انابيب البترول والغاز الطبيعي,2.0
34893,(ادارة العقودالحكوميه(اعادة قيد,نيبال,,2.3
34864,(ادارة العقودالحكوميه(اعادة قيد,الهنــد,,2.34
78137,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,مصـــر,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,2.34
37523,إنشاء حزمة رقم(6B) أعمال مواقف السيارات العلوي...,الهنــد,مقاولات المبانى التقليدية ( مقاولات انشائية ),2.36
37525,إنشاء حزمة رقم(6B) أعمال مواقف السيارات العلوي...,نيبال,مقاولات المبانى التقليدية ( مقاولات انشائية ),2.36


In [None]:
#hide_input
fig = px.sunburst(insight35, path=[insight35.index, 'Company','Country','Economic Act'], values='Salary',color='Salary', 
    hover_data=['Company','Country','Economic Act','Salary'],color_continuous_scale='RdBu')

fig.update_layout(margin = dict(t=0, l=0, r=0, b=0))
fig.show()

### INSIGHT 36

**Top 10 companies:**

-- offering max salary

-- Governorate

-- Economic Act

In [None]:
#hide_input
insight36 = pd.DataFrame()
insight36 = data.groupby(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC"])['SALARY'].max()
insight36 = insight36.reset_index(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC"])
insight36 = insight36.nlargest(10,'SALARY')
insight36['Company'] = insight36['COMPANY_NAME']
insight36['Governorate'] = insight36['GOVERNORATE_DESC']
insight36['Economic Act'] = insight36['ECONOMIC_ACT_DESC']
insight36['Salary'] = insight36['SALARY'].round(2)
insight36 = insight36.drop(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC","SALARY"],axis=1)
insight36

Unnamed: 0,Company,Governorate,Economic Act,Salary
21610,بنك وربه / مساهمة العامة,محافظة العاصمة,البنوك التجارية,26000.0
21595,بنك الكويت الدولى,محافظة الجهراء,البنوك التجارية,25000.0
46857,شركة البترول الوطنية الكويتية,محافظة الاحمدي,الادارة العامة ( ادارة الشركات ),24003.48
11597,10808 شركة ايكويت للبتروكيم...,محافظة الاحمدي,تجارة الكيماويات الصناعية الاحماض والقلويات,22861.0
16362,الشركة المتحدة لصناعة الحديد,محافظة العاصمة,الادارة العامة ( ادارة الشركات ),20000.0
56389,شركة الوطني للاستثمار,محافظة العاصمة,مؤسسات وشركات التمويل والاستثمار,17500.0
109346,مجموعة الصناعات الوطنيةالقابضة /مساهمةعامة,محافظة العاصمة,الادارة العامة ( ادارة الشركات ),15366.0
10192,(10348) شركة التبريد والاكسجين المحدودة,محافظة العاصمة,صناعة الغازات الكيماوية,15100.0
5664,الشركة الوطنية العقارية,محافظة العاصمة,الادارة العامة ( ادارة الشركات ),15000.0
10307,(11084) الشركه المتحده لصناعه ا...,محافظة العاصمة,الصناعات الحديدية الخفيفة,15000.0


In [None]:
#hide_input
fig = px.treemap(insight36, path=[insight36.index,"Company","Governorate","Economic Act","Salary"], values='Salary')

fig.update_layout(margin=dict(t=10, b=10, r=10, l=10))
fig.show()

### INSIGHT 37

**Last 10 companies:**

-- offering min salary

-- Governorate

-- Economic Act

In [None]:
#hide_input
insight37 = pd.DataFrame()
insight37 = data.groupby(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC"])['SALARY'].min()
insight37 = insight37.reset_index(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC"])
insight37 = insight37.nsmallest(10,'SALARY')
insight37['Company'] = insight37['COMPANY_NAME']
insight37['Governorate'] = insight37['GOVERNORATE_DESC']
insight37['Economic Act'] = insight37['ECONOMIC_ACT_DESC']
insight37['Salary'] = insight37['SALARY'].round(2)
insight37 = insight37.drop(["COMPANY_NAME","GOVERNORATE_DESC","ECONOMIC_ACT_DESC","SALARY"],axis=1)
insight37

Unnamed: 0,Company,Governorate,Economic Act,Salary
33044,توفير الدعم لأعمال السكرتارية والأعمال الإداري...,العقود الحكومية,حراسة المنشآت بواسطة الأفراد,1.42
32564,تطوير طبقة فارس السفلية للنفط الثقيل ( المرحلة...,العقود الحكومية,مقاولات انشاءات كهربائية وميكانيكية مثل محطات ...,2.0
117506,مشروع الوقود البئيى بمصفاة ميناء عبدالله,العقود الحكومية,مقاولات انشاء خطوط انابيب البترول والغاز الطبيعي,2.0
11510,(ادارة العقودالحكوميه(اعادة قيد,العقود الحكومية,,2.3
12426,إنشاء حزمة رقم(6B) أعمال مواقف السيارات العلوي...,العقود الحكومية,مقاولات المبانى التقليدية ( مقاولات انشائية ),2.36
12441,إنشاء وإنجاز وصيانة شارع الغوص من ضاحية صباح ا...,العقود الحكومية,مقاولات انشاء ورصف الطرق والشوارع وغيرها,2.36
1042,شركة الالبان الكويتية الدانمركية,محافظة مبارك الكبير,الادارة العامة ( ادارة الشركات ),2.5
1043,شركة الالبان الكويتية الدانمركية,محافظة مبارك الكبير,صناعة المثلجات (الايس كريم) بأنواعه,2.5
4111,شركة الالبان الكويتية الدانماركية,محافظة مبارك الكبير,معارض لعرض و بيع منتجات الشركات,2.5
10181,(10321) شركة الالبان الكويتية الدانماركية,محافظة مبارك الكبير,صناعات اخرى خاصة بالالبان ومنتجاتها,2.5


In [None]:
#hide_input
fig = px.treemap(insight37, path=[insight37.index,"Company","Governorate","Economic Act"], values='Salary')

fig.update_layout(margin=dict(t=10, b=10, r=10, l=10))
fig.show()