In [None]:
import numpy as np
import pandas as pd
from datetime import datetime
import plotly.express as px

In [9]:
# Load Gapminder dataset
gapminder = px.data.gapminder()

# Display the first 5 rows of the DataFrame to check the data
gapminder.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [None]:
# Select most recent year data
max_year= gapminder['year'].max()

df_latest = gapminder[gapminder['year'] == max_year]
df_latest

In [None]:
# Calculate the total population for each continent in the last year in the dataset
df_continent=df_latest.groupby(['continent','year']).sum().reset_index()
df_continent.head()

### Plotly express vs Plotly graph object

In [None]:
import plotly.express as px

# Draw bar chart
fig = px.bar(data_frame=df_continent,
x='continent',
y='pop',
title='Population of continents - ' + str(max_year),
labels={'pop':'Population', 'continent':'Continent'})

# Show chart
fig.show()

In [None]:
import plotly.graph_objects as go

In [None]:
# Create trace
trace = go.Bar(
x=df_continent['continent'],
y=df_continent['pop'],
marker=dict(color='royalblue')
)
# Create layout
layout = go.Layout(
title='Population of continents - ' + str(max_year) ,
xaxis=dict(title='Continent'),
yaxis=dict(title='Population')
)
# Create figure and add trace
fig = go.Figure(data=[trace], layout=layout)

# Show chart
fig.show()

In [None]:
from plotly.subplots import make_subplots

In [None]:
fig = make_subplots(rows=1, cols=2)

fig.add_trace(
    go.Scatter(x=[1, 2, 3], y=[4, 5, 6]),
    row=1, col=1
)

fig.add_trace(
    go.Scatter(x=[20, 30, 40], y=[50, 60, 70]),
    row=1, col=2
)

fig.update_layout(height=600, width=800, title_text="Side By Side Subplots")
fig.show()

In [None]:
fig = px.histogram(data_frame=gapminder,x='lifeExp',facet_col='continent',facet_col_wrap=3)
fig.show()

### Visualization with Plotly

### Scatter 

In [None]:
#  scatter
fig = px.scatter(data_frame=df_latest, 
                 x="gdpPercap", 
                 y="lifeExp", 
                 color='continent',
                 hover_name='country',
                 size='pop',title='GPD vs LifeExp',
                 size_max=50
                 )
# Display
fig.show()


### Box plot

In [None]:
fig_box = px.box(df_latest,
                 y='lifeExp',
                 title='Phân bố tuổi thọ trung bình của các châu lục')
fig_box.show()

In [None]:

fig_box = px.box(df_latest,
                 x='continent', y='lifeExp',
                 hover_name='country',
                 title='Phân bố tuổi thọ trung bình của các châu lục')
fig_box.show()

In [None]:

fig_box = px.box(df_latest,
                 x='continent', y='lifeExp',
                 title='Phân bố tuổi thọ trung bình của các châu lục')

global_life_expectancy_avg = df_latest['lifeExp'].mean()

# Add a horizontal line for global life expectancy average
fig_box.add_trace(
    go.Scatter(
        x=df_latest['continent'].unique(),  # Trục x, bao gồm tất cả các châu lục
        y=[global_life_expectancy_avg]*5,  # Trục y là giá trị trung bình tuổi thọ, lặp lại cho mỗi châu lục
        mode='lines',  # Đặt chế độ vẽ là 'lines'
        name='Trung bình tuổi thọ toàn cầu',  # Tên của đường trung bình
        line=dict(color='red', dash='dash')  # Định dạng đường là nét đứt màu đỏ
    )
)
fig_box.show()

### Histogram

In [None]:

fig_hist = px.histogram(df_latest,
                        x='lifeExp',
                        color='continent',
                        title='Phân bố tuổi thọ trung bình của các nước',
                        color_discrete_sequence=px.colors.sequential.Bluyl,
                        nbins=25)
fig_hist.show()

### Treemap

In [None]:
df_latest.groupby(['continent','country'],as_index=False)['pop'].sum()

In [None]:
fig = px.treemap(data_frame=df_latest, path=['continent','country'], values='pop',
                  color='lifeExp', hover_data=['gdpPercap','iso_alpha'],
                 hover_name='country',
                  #color_continuous_scale='RdBu',
                  title='Treemap của Dân số và Tuổi thọ theo Quốc gia và Châu lục')

fig.update_layout(
    width=1000,  # Chiều rộng của biểu đồ bằng pixel
    height=500,   # Chiều cao của biểu đồ bằng pixel
    margin = dict(t=40, l=0, r=0, b=0))
fig.show()


### Pie chart

In [None]:
# Pie chart
fig = px.pie(
    df_continent,
    values='pop',
    names='continent',
    title='Tỷ lệ dân số các châu lục',
    color_discrete_sequence=px.colors.qualitative.D3
)
fig.update_traces(
                  textposition="outside")
fig.update_layout(
    width=600,  # Chiều rộng của biểu đồ bằng pixel
    height=350,   # Chiều cao của biểu đồ bằng pixel
    margin = dict(t=40, l=50, r=25, b=25),
    showlegend=True)
# Display chart
fig.show()


### Bar chart

In [None]:
df_continent

In [None]:
df_latest.continent.value_counts()

In [None]:
# Draw a bar chart showing the population of each continent
fig_bar = px.bar(df_continent,
                 x='continent', y='pop',
                 color='lifeExp',
                 title='Dân số của các châu lục')
fig_bar.show()

In [None]:
df_latest.head()

In [None]:
# Draw a stack bar chart showing the population of each country in a continent
fig_bar = px.bar(df_latest,x='continent', y='pop',color='lifeExp',title='Population of each continent',hover_data=['country','iso_alpha'],
hover_name='country')
fig_bar.show()