## Import Necessary Libraries

In [1]:
import pandas as pd
import numpy as np
from collections import Counter
import cufflinks as cf
import plotly.express as px
import plotly.graph_objects as go
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)
cf.go_offline()
%matplotlib inline

### Reading & Overview Datasset

In [2]:
df = pd.read_csv('jobs.csv')

In [3]:
df.columns

Index(['title', 'salary', 'hinhthuc', 'capbac', 'gender', 'ex', 'add',
       'keyword', 'link'],
      dtype='object')

In [4]:
# Rename columns
df.rename(columns={"hinhthuc": "employment_type", "capbac": "level", "ex":"experience_level", "add":"location"}, inplace=True)

In [5]:
df.head()

Unnamed: 0,title,salary,employment_type,level,gender,experience_level,location,keyword,link
0,,"Tới 2,500 USD",Toàn thời gian,Nhân viên,Không yêu cầu,5 năm,Hà Nội,,
1,Tuyển Trưởng Phòng Nhân Sự - Thu Nhập Từ 30 Đế...,30-40 triệu,Toàn thời gian,Trưởng/Phó phòng,Không yêu cầu,4 năm,Hồ Chí Minh,"Nhân sự,Biên / Phiên dịch,Quản lý điều hành",https://www.topcv.vn/viec-lam/truong-phong-nha...
2,Tuyển Nhân Viên SEO Content Writer - Làm Việc ...,7-11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Dưới 1 năm,Hà Nội,"Marketing / Truyền thông / Quảng cáo,Báo chí /...",https://www.topcv.vn/viec-lam/nhan-vien-seo-co...
3,Tuyển Chuyên Viên Nhân Sự Chuyên Đánh Giá Năng...,Trên 11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,2 năm,Hồ Chí Minh,"Nhân sự,Quản lý điều hành",https://www.topcv.vn/viec-lam/chuyen-vien-nhan...
4,Tuyển Nhân Viên Tư Vấn CSKH Tại Văn Phòng - Lư...,8-10 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Không yêu cầu kinh nghiệm,Hồ Chí Minh,"Tư vấn,Kinh doanh / Bán hàng,Bất động sản",https://www.topcv.vn/viec-lam/nhan-vien-tu-van...


In [6]:
df.dtypes

title               object
salary              object
employment_type     object
level               object
gender              object
experience_level    object
location            object
keyword             object
link                object
dtype: object

In [7]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9943 entries, 0 to 9942
Data columns (total 9 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   title             9203 non-null   object
 1   salary            9943 non-null   object
 2   employment_type   9943 non-null   object
 3   level             9943 non-null   object
 4   gender            9943 non-null   object
 5   experience_level  9943 non-null   object
 6   location          9943 non-null   object
 7   keyword           9203 non-null   object
 8   link              9203 non-null   object
dtypes: object(9)
memory usage: 699.2+ KB


## Processing Data

### Convert column 'Salary' to VND

In [8]:
df['salary'].value_counts()

Thoả thuận        2336
10-15 triệu        368
Trên 10 triệu      336
Trên 8 triệu       286
Trên 15 triệu      262
                  ... 
8.6-10.1 triệu       1
9.9-10.4 triệu       1
500-1,000 USD        1
Tới 1,700 USD        1
5.5-30 triệu         1
Name: salary, Length: 557, dtype: int64

In [9]:
df

Unnamed: 0,title,salary,employment_type,level,gender,experience_level,location,keyword,link
0,,"Tới 2,500 USD",Toàn thời gian,Nhân viên,Không yêu cầu,5 năm,Hà Nội,,
1,Tuyển Trưởng Phòng Nhân Sự - Thu Nhập Từ 30 Đế...,30-40 triệu,Toàn thời gian,Trưởng/Phó phòng,Không yêu cầu,4 năm,Hồ Chí Minh,"Nhân sự,Biên / Phiên dịch,Quản lý điều hành",https://www.topcv.vn/viec-lam/truong-phong-nha...
2,Tuyển Nhân Viên SEO Content Writer - Làm Việc ...,7-11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Dưới 1 năm,Hà Nội,"Marketing / Truyền thông / Quảng cáo,Báo chí /...",https://www.topcv.vn/viec-lam/nhan-vien-seo-co...
3,Tuyển Chuyên Viên Nhân Sự Chuyên Đánh Giá Năng...,Trên 11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,2 năm,Hồ Chí Minh,"Nhân sự,Quản lý điều hành",https://www.topcv.vn/viec-lam/chuyen-vien-nhan...
4,Tuyển Nhân Viên Tư Vấn CSKH Tại Văn Phòng - Lư...,8-10 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Không yêu cầu kinh nghiệm,Hồ Chí Minh,"Tư vấn,Kinh doanh / Bán hàng,Bất động sản",https://www.topcv.vn/viec-lam/nhan-vien-tu-van...
...,...,...,...,...,...,...,...,...,...
9938,Tuyển Nhân Viên Content Marketing - Truyền Thô...,8-12 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Dưới 1 năm,Hà Nội,"Marketing / Truyền thông / Quảng cáo,Kinh doan...",https://www.topcv.vn/viec-lam/nhan-vien-conten...
9939,Tuyển Quản Lý Bán Hàng (Ngành Dược Phẩm) - Thu...,15-35 triệu,Toàn thời gian,Nhân viên,Nam,1 năm,Hà Nội,"Y tế / Dược,Kinh doanh / Bán hàng,Quản lý điều...",https://www.topcv.vn/viec-lam/quan-ly-ban-hang...
9940,Tuyển Nhân Viên Kinh Doanh - Thu Nhập 20 Triệu...,10-20 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,1 năm,Hà Nội,"Biên / Phiên dịch,Kinh doanh / Bán hàng,Bán hà...",https://www.topcv.vn/viec-lam/nhan-vien-kinh-d...
9941,Tuyển Kiến Trúc Sư Tại Hà Nội (Thu Nhập Cao),Thoả thuận,Toàn thời gian,Nhân viên,Không yêu cầu,Không yêu cầu kinh nghiệm,Hà Nội,"Kiến trúc,Xây dựng,Thiết kế nội thất",https://www.topcv.vn/viec-lam/kien-truc-su-tai...


In [10]:
# Replace "Thảo Thuận" to NaN value
import numpy as np
df['salary'] = df['salary'].replace('Thoả thuận', np.nan)
df['salary'].isna().sum()

2336

In [11]:
# Drop NaN values in "salary"
df2 = df.dropna(subset='salary')

In [12]:
# Create new column "currency"
df2['currency'] = df2['salary'].apply(lambda x : x.split(' ')[-1])
df2.head()

Unnamed: 0,title,salary,employment_type,level,gender,experience_level,location,keyword,link,currency
0,,"Tới 2,500 USD",Toàn thời gian,Nhân viên,Không yêu cầu,5 năm,Hà Nội,,,USD
1,Tuyển Trưởng Phòng Nhân Sự - Thu Nhập Từ 30 Đế...,30-40 triệu,Toàn thời gian,Trưởng/Phó phòng,Không yêu cầu,4 năm,Hồ Chí Minh,"Nhân sự,Biên / Phiên dịch,Quản lý điều hành",https://www.topcv.vn/viec-lam/truong-phong-nha...,triệu
2,Tuyển Nhân Viên SEO Content Writer - Làm Việc ...,7-11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Dưới 1 năm,Hà Nội,"Marketing / Truyền thông / Quảng cáo,Báo chí /...",https://www.topcv.vn/viec-lam/nhan-vien-seo-co...,triệu
3,Tuyển Chuyên Viên Nhân Sự Chuyên Đánh Giá Năng...,Trên 11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,2 năm,Hồ Chí Minh,"Nhân sự,Quản lý điều hành",https://www.topcv.vn/viec-lam/chuyen-vien-nhan...,triệu
4,Tuyển Nhân Viên Tư Vấn CSKH Tại Văn Phòng - Lư...,8-10 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Không yêu cầu kinh nghiệm,Hồ Chí Minh,"Tư vấn,Kinh doanh / Bán hàng,Bất động sản",https://www.topcv.vn/viec-lam/nhan-vien-tu-van...,triệu


In [13]:
# Create new function for extract number from column "salary"
def extract_salary_number(column):
    """This function extract number form column salary"""
    salary_number =[]
    for row in column:
        if len(row.split(' ')) == 3:
            salary_number.append(row.split(' ')[1])
        else:
            salary_number.append(row.split(' ')[0])
    return salary_number
# Create function to convert salary to float
def new_salary(column):
    """This function convert number of salary to float"""
    salary_number = []
    for row in column:
        if '-' in row:
            numbs = []
            for num in row.split('-'):
                if ',' in num:
                    numbs.append(float(num.replace(',', '')))
                else:
                    numbs.append(float(num))
            salary_number.append(np.array(numbs).mean())
        elif ',' in row:
            salary_number.append(float(row.replace(',', '')))
        else:
            salary_number.append(float(row))
    return salary_number

In [14]:
extract_number = extract_salary_number(df2['salary'])
df2['salary_number'] = new_salary(extract_number)

In [15]:
df2.head()

Unnamed: 0,title,salary,employment_type,level,gender,experience_level,location,keyword,link,currency,salary_number
0,,"Tới 2,500 USD",Toàn thời gian,Nhân viên,Không yêu cầu,5 năm,Hà Nội,,,USD,2500.0
1,Tuyển Trưởng Phòng Nhân Sự - Thu Nhập Từ 30 Đế...,30-40 triệu,Toàn thời gian,Trưởng/Phó phòng,Không yêu cầu,4 năm,Hồ Chí Minh,"Nhân sự,Biên / Phiên dịch,Quản lý điều hành",https://www.topcv.vn/viec-lam/truong-phong-nha...,triệu,35.0
2,Tuyển Nhân Viên SEO Content Writer - Làm Việc ...,7-11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Dưới 1 năm,Hà Nội,"Marketing / Truyền thông / Quảng cáo,Báo chí /...",https://www.topcv.vn/viec-lam/nhan-vien-seo-co...,triệu,9.0
3,Tuyển Chuyên Viên Nhân Sự Chuyên Đánh Giá Năng...,Trên 11 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,2 năm,Hồ Chí Minh,"Nhân sự,Quản lý điều hành",https://www.topcv.vn/viec-lam/chuyen-vien-nhan...,triệu,11.0
4,Tuyển Nhân Viên Tư Vấn CSKH Tại Văn Phòng - Lư...,8-10 triệu,Toàn thời gian,Nhân viên,Không yêu cầu,Không yêu cầu kinh nghiệm,Hồ Chí Minh,"Tư vấn,Kinh doanh / Bán hàng,Bất động sản",https://www.topcv.vn/viec-lam/nhan-vien-tu-van...,triệu,9.0


In [16]:
# Create new column 'salary_in_vnd'
df2['salary_in_vnd'] = np.where(df2['currency'] == 'USD', 23000, 1000000) * df2['salary_number']

### Cleaning column "location"

In [17]:
# Checking columns 'add'
df2['location'].unique()

array(['Hà Nội', 'Hồ Chí Minh', 'Nghệ An', 'Lâm Đồng', 'Vũng Tàu',
       'Đồng Nai', 'Thái Bình', 'Thanh Hoá', 'Tây Ninh', 'Bắc Ninh',
       'Vĩnh Phúc', 'Toàn Quốc', 'Bình Dương', 'Hải Phòng', 'Quảng Ninh',
       'Đà Nẵng', 'Hưng Yên', 'Vĩnh Long', 'Nam Định', 'Hải Dương',
       'Hà Nam', 'Long An', 'Miền Nam', 'Bắc Giang', 'Miền Bắc',
       'Tiền Giang', 'Thái Nguyên', 'Khánh Hoà', 'Kon Tum', 'Hà Giang',
       'Tuyên Quang', 'Lào Cai', 'An Giang', 'Đắk Lắk', 'Bến Tre',
       'Cần Thơ', 'Bạc Liêu', 'Hậu Giang', 'Hà Tĩnh', 'Kiên Giang',
       'Quảng Nam', 'Bình Định', 'Quảng Ngãi', 'Quảng Trị', 'Bình Phước',
       'Phú Yên', 'Bình Thuận', 'Sơn La', 'Đồng Tháp', 'Phú Thọ',
       'Ninh Bình',
       '565A Nơ Trang Long, Phường 13, Quận Bình Thạnh, Hồ Chí Minh',
       'Gia Lai', 'Cà Mau', 'Lạng Sơn', 'Hoà Bình',
       'icon4, 243 A Đê La Thành, Quận Đống Đa, Cầu Giấy, Hà Nội',
       'Trà Vinh', 'Thừa Thiên Huế', 'Quảng Bình', 'Ninh Thuận',
       'Sóc Trăng', '148 Lê Lai, Phư

In [18]:
# some location including street and district, We just need the city name
df2['city'] = df2['location'].apply(lambda x: x.split(',')[-1].strip() if ',' in x else x)

## Explore every feature in the dataset

In [19]:
# Create a function  
def get_info(column):
    """
    This function return infos of column:
    - unique values in column
    - Numbers of each unique values
    - Mean salary of each unique values
    """
    df_agg = df2.groupby([column])['salary_in_vnd'].\
    agg(['count', 'mean']).\
    sort_values(by='mean')
    df_agg_name = df_agg.index
    df_agg_count = df_agg['count']
    df_agg_mean = df_agg['mean']
    return df_agg_name, df_agg_count, df_agg_mean
    

### Employment type

In [20]:
employment_type_names, employment_type_counts, mean_salary_employment_type = get_info("employment_type")

In [21]:
fig = go.Figure(go.Pie(labels=employment_type_names, values=employment_type_counts))
fig.update_layout(title="Số lượng tin tuyển dụng theo hình thức làm việc trong tháng 9/2022",
                 legend_title='Employment type')
fig.show()

In [22]:
fig = go.Figure(go.Bar(x=employment_type_names,\
                      y=mean_salary_employment_type))
fig.update_layout(
    title="Mức lương trung bình theo Hình thức làm việc trong tháng 9/2022",
    xaxis_title="Hình thức tuyển dụng",
    yaxis_title="Mức lương trung bình VND"
    )
fig.show()

### Level

In [23]:
level_name, level_counts, mean_salary_level = get_info('level')

In [24]:
# Số lượng tuyển dụng cho các cấp bậc trong tháng 9/2022
fig = go.Figure(data=[go.Pie(labels=level_name, values=level_counts)])
fig.show()

In [25]:
# Mức lương trung bình cho các cấp bậc tuyển dụng trong tháng 9/2022
fig = go.Figure(go.Bar(x = mean_salary_level,\
                      y = level_name,
                      orientation='h'))
fig.update_layout(
    title="Mức lương trung bình theo cấp bậc tuyển dụng trong tháng 9/2022",
    xaxis_title="Mức lương trung bình VND",
    yaxis_title="Cấp bậc")
fig.show()

### Gender

In [26]:
gender, gender_counts, gender_mean_salary = get_info('gender')

In [27]:
# Phân bổ giới tính trong tuyển dụng tháng 9/2022
fig = go.Figure(go.Pie(labels=gender, values=gender_counts))
fig.update_layout(
    title="Số lượng tuyển dụng theo giới tính trong tháng 9/2022",\
    legend_title="Gender"
    )
fig.show()

In [28]:
# Mức lương trung bình theo giới tính trong tháng 9/2022
fig = go.Figure(go.Bar(x=gender,\
                      y=gender_mean_salary))
fig.update_layout(
    title="Mức lương trung bình theo giới tính trong tháng 9/2022",
    xaxis_title="gender",
    yaxis_title="Mức lương trung bình VND"
    )
fig.show()

### Experience
- Số lượng các job tuyển dụng theo số năm yêu cầu kinh nghiệm
- Mức lương bình quân theo năm kinh nghiệm

In [29]:
experience_name, experience_counts, mean_salary_experience = get_info('experience_level')

In [30]:
# Số lượng các job tuyển dụng theo số năm yêu cầu kinh nghiệm
fig = go.Figure(go.Pie(labels=experience_name, values=experience_counts))
fig.update_layout(title="Số lượng các job theo số năm kinh nghiệm trong tháng 9/2022",
                 legend_title='Experience')
fig.show()

In [31]:
# Mức lương trung bình theo số năm kinh nghiệm trong tháng 9/2022
fig = go.Figure(go.Bar(x=experience_name,\
                      y=mean_salary_experience))
fig.update_layout(
    title="Mức lương trung bình theo số năm kinh nghiệm trong tháng 9/2022",
    xaxis_title="gender",
    yaxis_title="Mức lương trung bình VND"
    )
fig.show()

### Location
- Số lượng tuyển dụng theo địa điểm làm việc
- Mức lương trung bình tại các Tỉnh/Thành Phố

In [32]:
# Top 5 Tỉnh/Thành Phố có nhiều tin tuyển dụng nhiều nhất
cities = df2.groupby(['city'])['salary_in_vnd']\
                .agg(['count', 'mean'])\
                .sort_values(by='count',ascending=False)[:5]
cities

Unnamed: 0_level_0,count,mean
city,Unnamed: 1_level_1,Unnamed: 2_level_1
Hà Nội,4027,15371570.0
Hồ Chí Minh,2575,14051770.0
Đà Nẵng,145,16346900.0
Bình Dương,97,13566490.0
Hải Phòng,72,12009720.0


In [33]:
fig = go.Figure(go.Pie(labels=cities.index, values=cities['count']))
fig.update_layout(title="Top 5 Tỉnh/Thành Phố có số lượng tuyển dụng nhiều nhất tháng 9/2022",\
                 legend_title='Tỉnh/Thành Phố')
fig.show()

In [34]:
# Mức lương trung bình của 5 Thành phố có số lượng tin tuyển dụng nhiều nhất
fig = go.Figure(go.Bar(x=cities.index, y=cities['mean']))
fig.update_layout(title="Mức lương trung bình của 5 Thành Phố có số lượng tin tuyển dụng cao nhất tháng 9/2022",\
                 xaxis_title='Thành Phố',
                 yaxis_title='Mức lương trung bình')
fig.show()


Trong tháng 9/2022: Thành phố có mức lương tuyển dụng trung bình cao nhất là Đà Nẵng, thấp nhất là Hải Phòng

### Keyword
- 6.1 Những ngành nghề có số lượng tuyển dụng nhiều nhất
- 6.2 Những ngành nghề có mức lương trung bình cao nhất
- 6.3 Kiểm tra sự khác biệt về nhóm ngành nghề giữa Nam và Nữ


In [35]:
# tạo function để đếm các từ khóa trong column 'keyword'
def job_counts(jobs):
    """Function này để đếm các ngành nghề  
    trong column keyword"""
    job_counters = Counter()
    for job in jobs:
        job_counters.update(job.split(','))
    return job_counters.most_common(15)
# Taoj function để convert counter object sang 2 list 
def job_counter_convert(counter):
    """Function này để convert Counter object sang 2 list
    1 list là tên các ngành nghề
    1 list là số lần xuất hiện của ngành nghề tương ứng"""
    job_name = []
    numb_of_job = []
    for item in counter:
        job_name.append(item[0])
        numb_of_job.append(item[1])
    return job_name, numb_of_job

In [36]:
def plot_bar(x,y,title):
    """Plot bar chart """
    fig = go.Figure(go.Bar(x=x, y=y))
    fig.update_layout(title=title,\
                     xaxis_title="Ngành nghề",\
                     yaxis_title="Số lượng")
    fig.show()

#### Những ngành nghề có số lượng tuyển dụng nhiều nhất trong tháng 9/2022

In [37]:
jobs = df2['keyword'].dropna()
job_counter = job_counts(jobs)
job_name, numb_of_job = job_counter_convert(job_counter)

In [38]:
fig = go.Figure(go.Bar(x=job_name, y=numb_of_job))
fig.update_layout(title="Top 10 ngành nghề có số lượng tuyển dụng cao nhất",\
           xaxis_title="Ngành nghề",\
          yaxis_title="Số lượng")
fig.show()

Xu hướng tuyển dụng trong tháng 9/2022 có nhóm ngành nghề có số lượng tuyển dụng cao nhất là :
- Kinh doanh: (Kinh doanh/ Bán hàng, Bán lẻ/ bán sỉ)
- Dịch vụ : (Tư vấn, Dịch vụ khách hàng)
- Công nghệ thông tin : ( Việc làm IT, IT phần mềm, Công nghệ thông tin)
- Marketing : (Marketing/ Truyền thông/Quảng cáo, Báo chí/truyền hình)
- Tài chính ( Kế toán/ Kiểm toán, Ngân hàng/ Tài chính)
- Hành chính : (Hành chính/ văn phòng, Nhân sự)

#### Ngành nghề có mức lương tuyển dụng trung bình cao nhất trong tháng 9/2022

In [39]:
# Ngành nghề có mức lương cao nhất
# Top 50 nhóm ngành nghề có mức lương trung bình cao nhất trong tháng 9/2022
top50_salary = df2.groupby(['keyword'])['salary_in_vnd'].mean().sort_values(ascending=False)[:50].index
# Trong top 50 nhóm ngành nghề có mức lương trung bình cao nhất. Chúng ta tìm ra những ngàng nghề xuất hiện nhiều nhất
top_jobs = Counter()
for job in top50_salary:
    top_jobs.update(job.split(','))
top_jobs = top_jobs.most_common(10)

In [40]:
top_job_name, numbs_of_top_jobs = job_counter_convert(top_jobs)

In [41]:
fig = go.Figure(go.Bar(x=top_job_name, y=numbs_of_top_jobs))
fig.update_layout(title="Top những ngành nghề xuất hiện nhiều nhất trong top 50 nhóm ngành nghề có mức lương trung bình cao nhất",\
                 xaxis_title="Ngành nghề",\
                 yaxis_title="Số lượng")
fig.show()

Top những ngành nghề có mức lương tuyển dụng trung bình cao nhất tháng 9/2022:
- Công nghệ thông tin : (IT phần mềm, Việc làm IT, Công nghệ thông tin)
- Kinh doanh/ Bán hàng
- Tài chính : (Ngân hàng/ Tài chính, Tài chính/ Đầu tư)
- Quản lý điều hành
- Bất động sản

#### Xu hướng ngành nghề tuyển dụng gữa Nam và Nữ

In [42]:
female_jobs = df2[df2['gender'] == 'Nữ']['keyword'].dropna()
top_jobs_female = job_counts(female_jobs)
female_job_names, numb_of_female_job = job_counter_convert(top_jobs_female)
plot_bar(female_job_names, numb_of_female_job, 'Top 10 ngành nghề có yêu cầu giới tính là Nữ')

In [43]:
male_jobs = df2[df2['gender'] == 'Nam']['keyword'].dropna()
top_jobs_male = job_counts(male_jobs)
male_job_names, numb_of_male_job = job_counter_convert(top_jobs_male)
plot_bar(male_job_names, numb_of_male_job, 'Top 10 ngành nghề có yêu cầu giới tính là Nam')

Qua biểu đồ nghề nghiệp của Nam va Nữ, chúng ta có thể nhận xét như sau:
- Đứng đầu của cả Nam va Nữ là ngành nghề Kinh doanh va Bán hàng. Giống với Xu hướng tuyển dụng chung của cả thị trường trong tháng 9
- Các vị trí tiếp theo thể hiện sự khác biệt rõ giữa Nam va Nữ:
    - Nam : Các ngành nghề thiên về CNTT và các ngành kỹ thuật, Bảo trì, sửa chữa
    - Nữ: Các ngành nghề thiền về Hành chính nhân sự, Dịch vụ khách hàng, Trợ lý

## Thị trường tuyển dụng tại Hà Nội và Tp Hồ Chí Minh
- 7.1 Mức lương trung bình
- 7.2 Nghề nghiệp tuyển dụng

In [44]:
# Lọc các thông tin tuyển dụng tại 2 thành phố là Hà Nội và Hồ Chí Minh
hn_sg = ["Hà Nội", "Hồ Chí Minh"]
df_hn_sg = df2[df2['location'].isin(hn_sg)]


#### Mức lương tuyển dụng trung bình

In [45]:
# Tính mức lương tuyển dụng trung bình của 2 thành phố
mean_salary_hn_sg = df_hn_sg.groupby(['location'])['salary_in_vnd'].mean()
# tạo biểu đồ thể hiện mức lương trung bình
fig = go.Figure(go.Bar(x=mean_salary_hn_sg.index,\
                      y=mean_salary_hn_sg.values))
fig.update_layout(title="Mức lương tuyển dụng trung bình tại Hà Nội và Tp Hồ Chí Minh",\
                 xaxis_title="Thành Phố",\
                 yaxis_title="Mức lương tuyển dụng trung bình")
fig.show()

Trong tháng 9/2022, Mức lương tuyển dụng trung bình tại Hà Nội cao hơn so với Tp Hồ Chí Minh

#### Xu hướng ngành nghề tuyển dụng

In [46]:
# Lọc thông tin tuyển dụng tại Tp Hà Nội
df_hn = df_hn_sg.loc[df_hn_sg['location'] == "Hà Nội"]['keyword'].dropna()
# Top ngành nghề được tuyển dụng nhiều tại Hà Nội
top_jobs_hn = job_counts(df_hn)
top_job_hn_names, numb_of_job_hn = job_counter_convert(top_jobs_hn)
# Tạo biểu đồ top 10 ngành nghề được tuyển dụng nhiều nhất trong tháng 9/2022
plot_bar(top_job_hn_names, numb_of_job_hn, "Top 10 ngành nghề được tuyển dụng nhiều nhất tại HN")

In [47]:
# Lọc thông tin tuyển dụng tại Tp Hồ Chí Minh
df_hcm = df_hn_sg.loc[df_hn_sg['location'] == "Hồ Chí Minh"]['keyword'].dropna()
# Top ngành nghề được tuyển dụng nhiều tại Hồ Chí Minh
top_jobs_hcm = job_counts(df_hcm)
top_job_hcm_names, numb_of_job_hcm = job_counter_convert(top_jobs_hcm)
# Tạo biểu đồ top 10 ngành nghề được tuyển dụng nhiều nhất trong tháng 9/2022
plot_bar(top_job_hcm_names, numb_of_job_hcm, "Top 10 ngành nghề được tuyển dụng nhiều nhất tại Tp HCM")

Xu hướng tuyển dụng ngành nghề được tuyển dụng tại 2 Tp Hà Nội và Hồ Chí Minh trong tháng 9/2022:
- Điểm chung:
    - Ngành nghề Kinh doanh/ Bán hàng vẫn đứng đầu tại 2 Tp, giống như xu hướng tuyển dụng chung của toàn thị trường tuyển dụng trong tháng 9/2022
- Điểm khác biệt:
    - Hà Nội: CNTT, Marketing, Hành chính/ Văn phòng là những ngành nghề được tuyển dụng nhiều
    - HCM: Dịch vụ (Dịch vụ/ KH, Tư vấn), Marketing và Hành chính là những nghề được tuyển dụng nhiều