Wyjściowy wykres nie jest najgorszy, aczkolwiek niepotrzebnie skomplikowany. Przy niewielkich zmianach na przełomie 2015 i 2017 trudno jest odczytać zmianę na podstawie nachylenia odcinków, co dodatkowo utrudniają nakładające się kropki w niektórych miejscach. Ponadto zawiera on niepotrzebnie dużo pustej przestrzeni. Postanowiłem więc zaprezentować dane w bardziej przyjaznej dla użytkownika formie interaktywnego wykresu słupkowego. Pozwala on wybrać za pomocą rozwijanej listy uporządkowanie zestawienia, wybrać interesujące nas stany za pomocą suwaka oraz, dzięki współdzielonej osi y, łatwo porównać wartości wybranych stanów z wynikiem krajowym, który zawsze znajduje się po prawej stronie. Ponadto wszystkie interesujące nas wartości można odczytać najeżdżając na poszczególne słupki, a jeżeli któreś nas nie interesują, to możemy je usunąć odznaczając je w legendzie.

Źródło: https://getdolphins.com/blog/the-worst-graphs-of-2017/

In [15]:
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots

In [16]:
df = pd.DataFrame({
    'state': ["Hawaii", "N.Y.", "Ore", "Mass", "Nev", "Calif", "Wash", "Alaska", "Vt", "Colo", "Maine", "Fla"],
    "2015": [53.3, 44.7, 32.3, 31.0, 29.7, 29.5, 26.6, 26.4, 24.4, 18.0, 17.8, 17.4],
    "2017": [50.5, 45.3, 34.1, 25.8, 26.6, 34.2, 29.0, 24.9, 19.6, 19.7, 17.1, 15.6]
})

df['difference'] = df['2017'] - df['2015']

df.head()

Unnamed: 0,state,2015,2017,difference
0,Hawaii,53.3,50.5,-2.8
1,N.Y.,44.7,45.3,0.6
2,Ore,32.3,34.1,1.8
3,Mass,31.0,25.8,-5.2
4,Nev,29.7,26.6,-3.1


In [17]:
fig = make_subplots(rows=1, cols=2, shared_yaxes=True,
                    column_widths=[0.9, 0.1], 
                    subplot_titles=("States", "US"))

fig.add_trace(go.Bar(x=df['state'], y=df['2015'], name='2015'), row=1, col=1)
fig.add_trace(go.Bar(x=df['state'], y=df['2017'], name='2017'), row=1, col=1)
fig.add_trace(go.Bar(x=df['state'], y=df['difference'], name='Difference'), row=1, col=1)

fig.add_trace(go.Bar(x=["US"], y=[17.3], name='2015'), row=1, col=2)
fig.add_trace(go.Bar(x=["US"], y=[17.0], name='2017'), row=1, col=2)
fig.add_trace(go.Bar(x=["US"], y=[-0.3], name='Difference'), row=1, col=2)

fig.update_layout(hovermode='x unified')

fig.update_xaxes(
    rangeslider_visible=True,
    rangeselector=dict(
        buttons=list([
            dict(count=1, label="1y", step="year", stepmode="backward"),
            dict(count=2, label="2y", step="year", stepmode="backward"),
            dict(count=3, label="3y", step="year", stepmode="backward"),
            dict(count=4, label="4y", step="year", stepmode="backward"),
            dict(count=5, label="5y", step="year", stepmode="backward"),
            dict(step="all")
        ])
    )
)

fig.update_layout(
    updatemenus=[
        dict(
            buttons=list([
                dict(label="Sort by 2017 Ascending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('2017', ascending=True)['state'].tolist()}]),
                dict(label="Sort by 2017 Descending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('2017', ascending=False)['state'].tolist()}]),
                dict(label="Sort by 2015 Ascending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('2015', ascending=True)['state'].tolist()}]),
                dict(label="Sort by 2015 Descending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('2015', ascending=False)['state'].tolist()}]),
                dict(label="Sort by Difference Ascending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('difference', ascending=True)['state'].tolist()}]),
                dict(label="Sort by Difference Descending",
                     method="relayout",
                     args=[{"xaxis.type": "category",
                            "xaxis.categoryorder": "array",
                            "xaxis.categoryarray": df.sort_values('difference', ascending=False)['state'].tolist()}]),
            ]),
            direction="down",
            pad={"r": 10, "t": 10},
            showactive=True,
            x=0.6,
            xanchor="left",
            y=1.4,
            yanchor="top"
        ),
    ])

fig.update_layout(title_text="Comparison of top ten states with the highest rate of homelessness in 2015 and 2017", 
                  xaxis_title="State", 
                  yaxis_title="Homelessness rate")

fig.write_html("./hw4.html")
fig.show()