# 0. Import Library

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns   
import warnings
import plotly.express as px
import plotly.graph_objects as go

sns.set_theme(style="darkgrid")
warnings.filterwarnings('ignore')

In [None]:
df = pd.read_csv('data/FT1000_v1.csv')
df.head()

# 4. Data Analyzing
## 4.1. Câu hỏi 1 
**Câu hỏi:** Lĩnh vực có tốc độ tăng trưởng nhanh nhất ở các nước

**Ý nghĩa:** Biết được lĩnh vực có tốc độ tăng trưởng nhanh ở từng nước, các stakeholder (có thể là chính phủ các nước, EU,...) sẽ có chính sách phù hợp để phân bổ nhân lực, vật lực phù hợp để tiếp tục đẩy mạnh phát triển lĩnh vực đó

In [None]:
data = df[['Country', 'Sector', 'CAGR']].groupby(['Country', 'Sector']).sum().reset_index().sort_values(by=['CAGR'], ascending=False)
data.drop_duplicates(subset = ['Country'], keep = 'first', inplace = True)

In [None]:
fig = px.choropleth(
    data_frame = data, locations = 'Country', locationmode = 'country names', color = 'Sector', 
    color_discrete_sequence=px.colors.qualitative.Bold, width = 800, height = 600)
    
fig.update_layout(
    title = 'Sector with highest CAGR sum by Country',
    title_x = 0.5,
    legend = dict(
        # orientation = 'h', x = 1, y = 1, xanchor = 'right', yanchor = 'top',
    ), 
    margin = {'t': 30, 'b': 0, 'l': 0, 'r': 0},
    geo = go.layout.Geo(
        projection = go.layout.geo.Projection(scale = 1.5),
        scope = 'europe',
    )
)
fig.show()

Đa số các nước có tổng CAGR cao nhất ở lĩnh vực Technology (Công nghệ), một số lĩnh vực khác chiếm lĩnh vị trí CAGR cao nhất ở một vài nước là Energy (Năng lượng), Health (Sức khỏe). 

## 4.2. Câu hỏi 2
**Câu hỏi**: Quốc gia nào có tốc độ tăng trưởng cao ở nhiều lĩnh vực

In [None]:
data = df[['Country', 'Sector']].value_counts().reset_index()[['Country', 'Sector']].groupby('Country').count().reset_index()

fig = px.choropleth(
    data_frame = data, locations = 'Country', locationmode = 'country names', color = 'Sector', 
    color_discrete_sequence=px.colors.qualitative.Bold, width = 800, height = 600)
    
fig.update_layout(
    title = 'Sector count by Country',
    title_x = 0.5,
    legend = dict(
        # orientation = 'h', x = 1, y = 1, xanchor = 'right', yanchor = 'top',
    ), 
    margin = {'t': 30, 'b': 0, 'l': 0, 'r': 0},
    geo = go.layout.Geo(
        projection = go.layout.geo.Projection(scale = 1.5),
        scope = 'europe',
    )
)
fig.show()