# **ASEAN Statistical Figures In Dashboard**

This dashboard shows development status of ASEAN, from regional and national perspective, in a visually appealing format. It includes economic, social and demographic indicators, as well as some indicators related to environment and connectivity. With an improved data visualisation and concise narrative, users will find it easier to digest the wealth of information on statistical indicators presented and discussed in this publication. The statistics presented in this publication focus on annual data and are based on the information available in the ASEANstats database as of 31 October 2023.

## **Mô tả dữ liệu**

Dữ liệu này bao gồm các chỉ số khác nhau liên quan đến các quốc gia ASEAN trong các năm khác nhau. Các cột dữ liệu bao gồm:

| Cột                                     | Mô tả                                                |
|-----------------------------------------|------------------------------------------------------|
| **Country**                             | Tên quốc gia                                         |
| **Population (in Thousand)**            | Dân số (tính bằng nghìn người)                       |
| **Population Growth (%)**               | Tỉ lệ tăng trưởng dân số (%)                         |
| **Population Density (per sq.km)**      | Mật độ dân số (người trên mỗi km²)                   |
| **Net Enrolment Ratio in Primary School (%)** | Tỉ lệ nhập học thực tế ở trường tiểu học (%)   |
| **Pupil-Teacher Ratio in Primary School** | Tỉ lệ học sinh/giáo viên ở trường tiểu học       |
| **Total Fertility Rate (TFR)**          | Tổng tỉ suất sinh                                    |
| **Infant Mortality Rate (IMR)**         | Tỉ lệ tử vong ở trẻ sơ sinh                          |
| **Under Five Mortality Rate**           | Tỉ lệ tử vong ở trẻ dưới 5 tuổi                      |
| **Immunisation Against Measles (%)**    | Tỉ lệ tiêm phòng sởi (%)                             |
| **Unemployment Rate (%)**               | Tỉ lệ thất nghiệp (%)                                |
| **Road Length**                         | Chiều dài đường bộ                                   |
| **International Air Passenger Traffic** | Lưu lượng hành khách hàng không quốc tế              |
| **Domestic Air Passenger Traffic**      | Lưu lượng hành khách hàng không nội địa              |
| **Number of Visitor Arrivals**          | Số lượng khách du lịch đến                           |
| **Extra-ASEAN Visitor Arrivals**        | Số lượng khách du lịch ngoài khối ASEAN đến          |
| **Internet Services**                   | Các dịch vụ Internet                                 |
| **Year**                                | Năm thu thập dữ liệu                                 |

Mỗi hàng trong dữ liệu đại diện cho các chỉ số của một quốc gia cụ thể trong một năm cụ thể.


## **Population and Welfare**

Basic population and demographic indicators for ASEAN and its individual member states.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from plotly.offline import iplot, plot
from plotly.subplots import make_subplots
import plotly.graph_objects as go

In [2]:
# Đọc file Excel
file_path = '/content/drive/MyDrive/PHÂN TÍCH VÀ TRỰC QUAN HÓA DỮ LIỆU/Thi cuối kỳ/ASEAN data.xlsx'
df = pd.read_excel(file_path)

# Get random sample
df.sample(5)

Unnamed: 0,Country,Population (in Thousand),Population Growth (%),Population Density (per sq.km),Net Elrolment Ratio in Primary School (%),Pupil-Teacher Ratio in Primary School,Total Fertility Rate (TFR),Infant Mortality Rate (IMR),Under Five Mortality Rate,Immunisation Against Measles (%),Unemployment Rate (%),Road Length,International Air Passenger Traffic,Domestic Air Passenger Traffic,Number of visitor arrivals,Extra-ASEAN Visitor Arrivals,Internet Services,Year
19,Viet Nam,91203.761,1.122437,275.25375,96.8,19.237458,2.091738,14.94,22.442609,97.4,1.869147,357222.0,15660.478,17523.7015,7874.312,6379.182,48.3,2014
94,Malaysia,32698.1,0.373891,98.961779,97.12,12.26,0.0,0.0,0.0,96.3,3.9,281301.655,16532.52,38203.566,10070.964,1932.146,97.4,2022
8,Thailand,66754.59107,0.395323,134.205224,0.0,0.0,1.5,6.4,8.7,0.0,0.728607,232195.616,54448.911,42585.909,26546.725,19136.284,28.9,2013
61,Cambodia,16078.666,0.606115,88.815235,91.012462,45.052166,2.5,18.0,28.0,100.0,2.4,63432.42,10326.0,699.0,6610.592,4382.407,78.3,2019
97,Singapore,5637.022,3.36332,7688.246045,0.0,0.0,1.04,1.8,2.2,96.0,2.9,3546.0,31902.0,0.0,6305.744,3515.56,96.0,2022


In [14]:
# Tính tổng Population (in Thousand) theo từng năm
df_sum_population = df.groupby('Year')['Population (in Thousand)'].sum().reset_index()

# Tính trung bình Population Growth (%) theo từng năm
df_avg_growth = df.groupby('Year')['Population Growth (%)'].mean().reset_index()

# Tạo figure
fig = go.Figure()

# Thêm cột Population (in Thousand) vào biểu đồ
fig.add_trace(go.Bar(
    x=df_sum_population['Year'],
    y=df_sum_population['Population (in Thousand)'],
    name='Population (in Thousand)',
    yaxis='y1'
))

# Thêm đường Population Growth (%) vào biểu đồ
fig.add_trace(go.Scatter(
    x=df_avg_growth['Year'],
    y=df_avg_growth['Population Growth (%)'],
    name='Population Growth (%)',
    yaxis='y2',
    mode='lines+markers',
    line=dict(color='red')
))

# Cập nhật layout để thêm các trục y phụ
fig.update_layout(
    title='Population size and Growth rate, ASEAN Total',
    xaxis=dict(title='Year'),
    yaxis=dict(
        title='Population (in Thousand)',
        titlefont=dict(color='#1f77b4'),
        tickfont=dict(color='#1f77b4')
    ),
    yaxis2=dict(
        title='Population Growth (%)',
        titlefont=dict(color='red'),
        tickfont=dict(color='red'),
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.1,
        y=1.1,
        orientation='h'
    ),
    height=600,
    width=1000
)

# Hiển thị biểu đồ
fig.show()

In [28]:
# Lọc dữ liệu cho các năm 2013, 2017 và 2022
years = [2013, 2017, 2022]
df_filtered = df[df['Year'].isin(years)]

# Tạo figure và subplot cho biểu đồ
fig = go.Figure()

# Tạo các trace cho từng năm
for year in years:
    df_year = df_filtered[df_filtered['Year'] == year]
    fig.add_trace(go.Bar(
        y=df_year['Country'],
        x=df_year['Total Fertility Rate (TFR)'],
        name=str(year),
        orientation='h',
        text=df_year['Immunisation Against Measles (%)'].round(1),  # Làm tròn giá trị dữ liệu
        texttemplate='%{text}%',  # Định dạng nhãn của cột
        textposition='outside',  # Vị trí hiển thị nhãn
    ))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Total Fertility Rate (TFR) by ASEAN Member States',
    xaxis_title='Total Fertility Rate (TFR) by ASEAN Member States (%)',
    yaxis_title='Country',
    barmode='group',
    height=600,
    width=1200,
)

# Hiển thị biểu đồ tương tác
fig.show()

In [26]:
# Calculate average Under Five Mortality Rate per year and round to two decimal places
df_avg = df.groupby('Year')['Under Five Mortality Rate'].mean().reset_index()
df_avg['Under Five Mortality Rate'] = df_avg['Under Five Mortality Rate'].round(2)

# Create figure and subplot for the chart
fig = go.Figure()

# Draw line with markers and text labels
fig.add_trace(go.Scatter(
    x=df_avg['Year'],
    y=df_avg['Under Five Mortality Rate'],
    mode='lines+markers+text',  # Include text labels
    name='Under Five Mortality Rate',
    text=df_avg['Under Five Mortality Rate'],  # Text to display on each point
    textposition='top center',  # Position of the text
    marker=dict(color='red', size=10),
    line=dict(color='red', width=2),
))
# Vẽ shade area
fig.add_trace(go.Scatter(
    x=df_avg['Year'],
    y=df_avg['Under Five Mortality Rate'],
    mode='lines+markers',
    name='Under Five Mortality Rate',
    fill='tozeroy',
    fillcolor='rgba(255, 0, 0, 0.1)',  # Màu đỏ với độ mờ 0.1
    line=dict(color='rgba(255, 0, 0, 0)'),  # Ẩn đường viền của shade area
))
# Adjust layout of the chart
fig.update_layout(
    title='Average Under Five Mortality Rate',
    xaxis_title='Year',
    yaxis_title='per 1,000 live births',
    height=600,
    width=1000,
)

# Show interactive chart
fig.show()

In [5]:
# Lọc dữ liệu theo các năm 2013, 2017, 2022
years = [2013, 2017, 2022]
df_filtered = df[df['Year'].isin(years)]

# Tạo figure và subplot cho biểu đồ
fig = go.Figure()

# Tạo các cột dọc cho từng năm
for year in years:
    df_year = df_filtered[df_filtered['Year'] == year]
    fig.add_trace(go.Bar(
        x=df_year['Country'],
        y=df_year['Immunisation Against Measles (%)'],
        name=str(year),
        text=df_year['Immunisation Against Measles (%)'].round(1),  # Làm tròn giá trị dữ liệu
        texttemplate='%{text}%',  # Định dạng nhãn của cột
        textposition='outside',  # Vị trí hiển thị nhãn
    ))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Immunisation Against Measles (%) by Country',
    xaxis_title='Country',
    yaxis_title='Immunisation Against Measles (%)',
    barmode='group',
    height=800,
    width=1300,
)

# Hiển thị biểu đồ
fig.show()

In [6]:
# Tính toán percent of grand total cho Unemployment Rate cho từng năm
years = [2013, 2017, 2022]
for year in years:
    df_year = df[df['Year'] == year]
    df.loc[df['Year'] == year, 'Unemployment Rate (%) of Total'] = (df_year['Unemployment Rate (%)'] / df_year['Unemployment Rate (%)'].sum()) * 100

# Tạo figure và subplot cho biểu đồ
fig = go.Figure()

# Tạo các cột dọc cho từng năm
for year in years:
    df_year = df[df['Year'] == year]
    fig.add_trace(go.Bar(
        x=df_year['Country'],
        y=df_year['Unemployment Rate (%) of Total'],
        name=str(year),
        text=df_year['Unemployment Rate (%)'].round(1),  # Nhãn dữ liệu làm tròn Unemployment Rate
        texttemplate='%{text}%',  # Định dạng nhãn của cột
        textposition='outside',  # Vị trí hiển thị nhãn
    ))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Unemployment Rate (%) by Country (Percent of Grand Total) - 2013, 2017, 2022',
    xaxis_title='Country',
    yaxis_title='Unemployment Rate (%) of Total',
    barmode='group',
    height=800,
    width=1300,
)

# Hiển thị biểu đồ
fig.show()

In [7]:
# Lọc dữ liệu cho năm 2020
df_2020 = df[df['Year'] == 2020]

# Sắp xếp và chọn top 5 quốc gia có tỷ lệ Pupil-Teacher Ratio cao nhất
df_top5 = df_2020.nlargest(5, 'Pupil-Teacher Ratio in Primary School ')

# Tạo figure cho biểu đồ bánh donut
fig = go.Figure()

# Tạo biểu đồ bánh donut tương tác cho top 5 quốc gia
fig.add_trace(go.Pie(
    labels=df_top5['Country'],
    values=df_top5['Pupil-Teacher Ratio in Primary School '],
    textinfo='label+percent',
    insidetextorientation='radial',
    hoverinfo='label+value+percent',
    hole=0.4,  # Kích thước lỗ trong biểu đồ bánh donut
    textfont_color='white',  # Đổi màu chữ thành màu trắng
))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Top 5 Pupil-Teacher Ratio in Primary School by ASEAN Member States (2020)',
    height=600,
    width=800,
)

# Hiển thị biểu đồ
fig.show()

## **CONNECTIVITY**

A selection of connectivity indicators, including transports, visitor arrivals and internet services.

In [17]:
# Tính tổng International Air Passenger Traffic theo từng năm
df_sum_international = df.groupby('Year')['International Air Passenger Traffic'].sum().reset_index()

# Tính tổng Domestic Air Passenger Traffic theo từng năm
df_sum_domestic = df.groupby('Year')['Domestic Air Passenger Traffic'].sum().reset_index()

# Tạo figure
fig = go.Figure()

# Thêm cột International Air Passenger Traffic vào biểu đồ
fig.add_trace(go.Bar(
    x=df_sum_international['Year'],
    y=df_sum_international['International Air Passenger Traffic'],
    name='International Air Passenger Traffic',
    yaxis='y1'
))

# Thêm đường Domestic Air Passenger Traffic vào biểu đồ
fig.add_trace(go.Scatter(
    x=df_sum_domestic['Year'],
    y=df_sum_domestic['Domestic Air Passenger Traffic'],
    name='Domestic Air Passenger Traffic',
    yaxis='y2',
    mode='lines+markers',
    line=dict(color='red')
))

# Cập nhật layout để thêm các trục y phụ
fig.update_layout(
    title='Number of international and domestic air passengers by ASEAN Member States',
    xaxis=dict(title='Year'),
    yaxis=dict(
        title='International Air Passenger Traffic (persons)',
        titlefont=dict(color='#1f77b4'),
        tickfont=dict(color='#1f77b4')
    ),
    yaxis2=dict(
        title='Domestic Air Passenger Traffic (persons)',
        titlefont=dict(color='red'),
        tickfont=dict(color='red'),
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.1,
        y=1.1,
        orientation='h'
    ),
    height=600,
    width=1000
)

# Hiển thị biểu đồ
fig.show()

In [8]:
# Lọc dữ liệu theo các năm 2013, 2017, 2022
years = [2013, 2017, 2022]
df_filtered = df[df['Year'].isin(years)]

# Tạo figure cho biểu đồ
fig = go.Figure()

# Tạo các cột dọc cho từng năm
for year in years:
    df_year = df_filtered[df_filtered['Year'] == year]
    fig.add_trace(go.Bar(
        x=df_year['Country'],
        y=df_year['Internet Services'],
        name=str(year),
        text=df_year['Internet Services'],  # Hiển thị giá trị Internet Services trên biểu đồ
        textposition='outside',  # Vị trí hiển thị nhãn dữ liệu
    ))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Internet Services (%) by ASEAN Member States',
    xaxis_title='Country',
    yaxis_title='Internet Services (%)',
    barmode='group',
    height=800,
    width=1300,
)

# Hiển thị biểu đồ
fig.show()

In [9]:
pip install dash

Collecting dash
  Downloading dash-2.17.1-py3-none-any.whl (7.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.5/7.5 MB[0m [31m49.4 MB/s[0m eta [36m0:00:00[0m
Collecting dash-html-components==2.0.0 (from dash)
  Downloading dash_html_components-2.0.0-py3-none-any.whl (4.1 kB)
Collecting dash-core-components==2.0.0 (from dash)
  Downloading dash_core_components-2.0.0-py3-none-any.whl (3.8 kB)
Collecting dash-table==5.0.0 (from dash)
  Downloading dash_table-5.0.0-py3-none-any.whl (3.9 kB)
Collecting retrying (from dash)
  Downloading retrying-1.3.4-py3-none-any.whl (11 kB)
Installing collected packages: dash-table, dash-html-components, dash-core-components, retrying, dash
Successfully installed dash-2.17.1 dash-core-components-2.0.0 dash-html-components-2.0.0 dash-table-5.0.0 retrying-1.3.4


In [10]:
import dash
from dash import dcc, html
from dash.dependencies import Input, Output
# Tạo ứng dụng Dash
app = dash.Dash(__name__)

# Tạo bộ lọc cho năm
year_options = [{'label': str(year), 'value': year} for year in df['Year'].unique()]

# Thiết lập layout của ứng dụng
app.layout = html.Div([
    html.H1("Road Length by Country"),
    dcc.Dropdown(
        id='year-dropdown',
        options=year_options,
        value=df['Year'].min(),  # Chọn năm đầu tiên làm giá trị mặc định
        style={'width': '50%'}
    ),
    dcc.Graph(id='road-length-bar-chart')
])

# Định nghĩa callback để cập nhật biểu đồ khi thay đổi năm
@app.callback(
    Output('road-length-bar-chart', 'figure'),
    [Input('year-dropdown', 'value')]
)
def update_bar_chart(selected_year):
    df_filtered = df[df['Year'] == selected_year]
    fig = go.Figure()
    fig.add_trace(go.Bar(
        x=df_filtered['Country'],
        y=df_filtered['Road Length'],
        name=str(selected_year),
        text=df_filtered['Road Length'],  # Hiển thị giá trị Road Length trên biểu đồ
        textposition='outside',  # Vị trí hiển thị nhãn dữ liệu
    ))
    fig.update_layout(
        title=f'Road Length by ASEAN Member States ({selected_year})',
        xaxis_title='Country',
        yaxis_title='Road Length (kilometers)',
        barmode='group',
        height=800,
        width=1300,
    )
    return fig

# Chạy ứng dụng Dash
if __name__ == '__main__':
    app.run_server(debug=True)

<IPython.core.display.Javascript object>

In [11]:
# Tính tổng theo từng năm
df_sum = df.groupby('Year').sum().reset_index()

# Tạo biểu đồ đường tương tác
fig = go.Figure()

# Vẽ đường cho từng cột
fig.add_trace(go.Scatter(
    x=df_sum['Year'],
    y=df_sum['Number of visitor arrivals'],
    mode='lines+markers',
    name='Number of visitor arrivals',
))

fig.add_trace(go.Scatter(
    x=df_sum['Year'],
    y=df_sum['Extra-ASEAN Visitor Arrivals'],
    mode='lines+markers',
    name='Extra-ASEAN Visitor Arrivals',
))

# Điều chỉnh layout của biểu đồ
fig.update_layout(
    title='Non-ASEAN Visitor Arrivals and Number of visitor arrivals',
    xaxis_title='Year',
    yaxis_title='persons',
    height=600,
    width=1000,
)

# Hiển thị biểu đồ
fig.show()

In [23]:
# Tính tổng Number of visitor arrivals theo từng quốc gia
df_sum_visitors = df.groupby('Country')['Number of visitor arrivals'].sum().reset_index()

# Tạo biểu đồ map
fig = px.choropleth(df_sum_visitors,
                    locations='Country',
                    locationmode='country names',
                    color='Number of visitor arrivals',
                    hover_name='Country',
                    color_continuous_scale=px.colors.sequential.Greens,
                    title='Number of Visitor Arrivals by Country')

# Hiển thị biểu đồ
fig.show()