<a href="https://colab.research.google.com/github/Muhammadridho100902/google_collab/blob/main/Supply_Chain_Analysis_Fix.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Data Dictionary

1. **Product type**: Kolom ini menunjukkan jenis produk, misalnya "haircare" atau "skincare." Ini mengidentifikasi kategori atau jenis produk.

2. **SKU**: SKU adalah singkatan dari "Stock Keeping Unit." Ini adalah kode unik yang digunakan untuk mengidentifikasi dan melacak produk tertentu dalam stok atau inventaris.

3. **Price**: Ini adalah harga produk dalam mata uang tertentu, yang mungkin digunakan untuk menghitung pendapatan dari penjualan.

4. **Availability**: Ini mungkin mengacu pada ketersediaan stok produk dalam jumlah tertentu. Jumlah ini mungkin berhubungan dengan stok yang tersedia untuk dijual.

5. **Number of products sold**: Ini adalah jumlah produk yang telah terjual dalam periode waktu tertentu.

6. **Revenue generated**: Ini adalah pendapatan yang dihasilkan dari penjualan produk tertentu, dihitung sebagai harga produk dikalikan dengan jumlah yang terjual.

7. **Customer demographics**: Ini mencakup informasi tentang demografi pelanggan yang membeli produk tersebut, misalnya, jenis kelamin atau kategori pelanggan.

8. **Stock levels**: Ini mengacu pada tingkat stok yang tersedia untuk produk tersebut, yang dapat memengaruhi ketersediaan produk.

9. **Lead times**: Ini mungkin merujuk pada waktu yang dibutuhkan untuk mendapatkan produk atau bahan dari supplier tertentu.

10. **Order quantities**: Ini mungkin adalah jumlah produk yang dipesan atau dibeli dalam satu pesanan.

11. **Shipping times**: Ini mengacu pada waktu yang diperlukan untuk mengirim produk kepada pelanggan.

12. **Shipping carriers**: Ini adalah nama perusahaan pengangkutan yang digunakan untuk mengirim produk.

13. **Shipping costs**: Ini adalah biaya yang dikeluarkan untuk mengirim produk kepada pelanggan.

14. **Supplier name**: Ini adalah nama pemasok atau supplier produk.

15. **Location**: Ini mengacu pada lokasi fisik atau kota di mana produk atau supplier berada.

16. **Lead time**: Ini mungkin merujuk pada waktu yang diperlukan untuk menerima pesanan atau produk tertentu.

17. **Production volumes**: Ini mungkin adalah jumlah produk yang diproduksi atau dihasilkan.

18. **Manufacturing lead time**: Ini mungkin merujuk pada waktu yang dibutuhkan untuk memproduksi produk.

19. **Manufacturing costs**: Ini adalah biaya yang terkait dengan proses produksi barang.

20. **Inspection results**: Ini mungkin mencakup hasil inspeksi produk, misalnya, "Pending" atau "Fail."

21. **Defect rates**: Ini adalah tingkat kecacatan produk, yang dapat mengukur seberapa sering produk tidak memenuhi standar kualitas.

22. **Transportation modes**: Ini adalah mode transportasi yang digunakan untuk mengirim produk, seperti "Road," "Air," atau "Rail."

23. **Routes**: Ini adalah rute atau jalur yang digunakan dalam pengiriman produk.

24. **Costs**: Ini mungkin mencakup biaya-biaya yang terkait dengan pengiriman produk atau biaya lain yang relevan.

In [3]:
import pandas as pd
import numpy as np
import plotly.express as px

pd.set_option("display.max_columns", None)

In [4]:
df = pd.read_csv('/content/supply_chain_data.csv')

In [5]:
total = df['Stock levels'].sum()
calcu = round((95 / total) * 100, 2)
calcu
# total

1.99

In [6]:
df.head()

Unnamed: 0,Product type,SKU,Price,Availability,Number of products sold,Revenue generated,Customer demographics,Stock levels,Lead times,Order quantities,Shipping times,Shipping carriers,Shipping costs,Supplier name,Location,Lead time,Production volumes,Manufacturing lead time,Manufacturing costs,Inspection results,Defect rates,Transportation modes,Routes,Costs
0,haircare,SKU0,69.808006,55,802,8661.996792,Non-binary,58,7,96,4,Carrier B,2.956572,Supplier 3,Mumbai,29,215,29,46.279879,Pending,0.22641,Road,Route B,187.752075
1,skincare,SKU1,14.843523,95,736,7460.900065,Female,53,30,37,2,Carrier A,9.716575,Supplier 3,Mumbai,23,517,30,33.616769,Pending,4.854068,Road,Route B,503.065579
2,haircare,SKU2,11.319683,34,8,9577.749626,Unknown,1,10,88,2,Carrier B,8.054479,Supplier 1,Mumbai,12,971,27,30.688019,Pending,4.580593,Air,Route C,141.920282
3,skincare,SKU3,61.163343,68,83,7766.836426,Non-binary,23,13,59,6,Carrier C,1.729569,Supplier 5,Kolkata,24,937,18,35.624741,Fail,4.746649,Rail,Route A,254.776159
4,skincare,SKU4,4.805496,26,871,2686.505152,Non-binary,5,3,56,8,Carrier A,3.890548,Supplier 1,Delhi,5,414,3,92.065161,Fail,3.14558,Air,Route A,923.440632


In [7]:
df = df.drop(columns=['Revenue generated', 'Costs'], axis=1)

In [8]:
df['Revenue'] = round(df['Price'] * df['Number of products sold'], 2)
df['Costs'] = round(df['Shipping costs'] + df['Manufacturing costs'], 2)
df['Profits'] = round(df['Revenue'] - df['Costs'], 2)
df['Total times'] = df['Lead times'] + df['Shipping times'] + df['Lead time'] + df['Manufacturing lead time']

In [9]:
df.groupby('Location')['Profits'].sum().sort_values(ascending=False)

Location
Kolkata      661374.82
Chennai      566491.58
Mumbai       454587.51
Delhi        374223.29
Bangalore    223591.35
Name: Profits, dtype: float64

# Task for tomorrow:
1. Analisis Upstream = Suppliers
2. Analisis Internal = Manufacturing
3. Analisis Downstream = Shipping

# Function Plot

In [10]:
def onebar(column, target, agg):
  if agg == 'mean':
      if 'time' in target:
        grouped = df.groupby(column)[target].mean().round(0).sort_values(ascending=False)
        fig = px.bar(x=grouped.index,
                    y=grouped.values,
                    text=grouped.values,
                    labels= {'x' : column, 'y' : target},
                    title=f'Average {target} by {column}',
                    template='plotly_dark',
                    )
        fig.update_traces(marker_color='white',
                          textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
        fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
        fig.show()
      else:
        grouped = df.groupby(column)[target].mean().round(1).sort_values(ascending=False)
        fig = px.bar(x=grouped.index,
                    y=grouped.values,
                     text=grouped.values,
                    labels= {'x' : column, 'y' : target},
                    title=f'Average {target} by {column}',
                    template='plotly_dark')
        fig.update_traces(marker_color='white',
                          textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
        fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )

        fig.show()
  else:
    grouped = df.groupby(column)[target].sum().round(0).sort_values(ascending=False)
    fig = px.bar(x=grouped.index,
                 y=grouped.values,
                 text=grouped.values,
                 labels= {'x' : column, 'y' : target},
                 title=f'Total {target} by {column}',
                 template='plotly_dark')
    fig.update_traces(marker_color='white',
                          textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
    fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
    fig.show()

In [11]:
def countonebar(column):
  df_new = df[column].value_counts().sort_values(ascending=False)
  fig = px.bar(x=df_new.index,
               y=df_new.values,
               text=df_new.values,
                 labels= {'x' : column, 'y' : 'counts'},
                 barmode = 'group',
                 title=f'Count by {column}',
                 template='plotly_dark')
  fig.update_traces(marker_color='white',
                          textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
  fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
  fig.show()

In [12]:
def piechart(column, target, agg):
  if agg == 'mean':
    grouped = df.groupby(column)[target].mean().round(2).sort_values(ascending=False)
    fig = px.pie(names=grouped.index,
                values=grouped.values,
                title=f'Differents {target} Against The {column}',
                template='plotly_dark')
    fig.update_traces(textinfo='percent+label',
                          textfont=dict(color='white',
                                        family='Arial',
                                        size=26))
    fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
    fig.show()
  elif agg == 'sum':
    grouped = df.groupby(column)[target].sum().sort_values(ascending=False)
    fig = px.pie(names=grouped.index,
                values=grouped.values,
                title=f'Differents Total {target} Against The {column}',
                 template='plotly_dark')
    fig.update_traces(textinfo='percent+label',
                          textfont=dict(color='white',
                                        family='Arial',
                                        size=26))
    fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
    fig.show()
  else:
    grouped = df.groupby(column)[target].count().round(2).sort_values(ascending=False)
    fig = px.pie(names=grouped.index,
                values=grouped.values,
                title=f'Differents Counts on {target}',
                template='plotly_dark')
    fig.update_traces(textinfo='percent+label',
                          textfont=dict(color='white',
                                        family='Arial',
                                        size=26))
    fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1
        )
    fig.show()

In [13]:
def countbar(column,colors):
  fig = px.bar(df,
                 x=column,
                 color = colors,
                 labels= {'x' : column, 'y' : 'Counts'},
                 barmode = 'group',
                 title=f'Count {colors} by {column}',
                 template='plotly_dark')
  fig.update_traces(textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
  fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1,
        )
  fig.show()

# 1. Analisis Upstream Supply Chain

## Analisis Product

In [14]:
onebar('Product type', 'Price', 'mean')

In [15]:
double_df = df.groupby(['Product type'])['Availability', 'Stock levels'].sum().reset_index()
fig = px.bar(double_df,
             x='Product type',
             y=['Availability', 'Stock levels'],
             barmode='group',
             title = 'Total Availability & Stock levels',
             template='plotly_dark')
fig.update_traces(marker_color='white',
                          textfont_size=20,
                          textfont=dict(color='black',
                                        family='Arial',
                                        size=26))
fig.update_layout(
            height=600,
            title_font=dict(size=26), bargap=0.1,
        )


Indexing with multiple keys (implicitly converted to a tuple of keys) will be deprecated, use a list instead.



In [16]:
piechart('Product type', 'Number of products sold', 'sum')

In [17]:
onebar('Product type', 'Order quantities', 'mean')

In [18]:
onebar('Product type', 'Total times', 'mean')

In [19]:
onebar('Product type', 'Costs', 'mean')

In [71]:
onebar('Product type', 'Profits', 'sum')

## Analisis Supplier

In [21]:
countonebar('Supplier name')

In [22]:
# df.groupby(['Supplier name', 'Product type'])['Supplier name'].count()

countbar('Supplier name', 'Product type')

In [23]:
onebar('Supplier name', 'Profits', 'sum')

In [24]:
onebar('Supplier name', 'Lead time', 'mean')

In [25]:
countbar('Supplier name', 'Inspection results')

In [26]:
onebar('Supplier name', 'Defect rates', 'mean')

# 2. Analisis Internal Supply Chain

## Analisis Product type terhadap Manufacturing

In [27]:
onebar('Product type', 'Manufacturing lead time', 'mean')

In [28]:
onebar('Product type', 'Manufacturing costs', 'mean')

In [29]:
onebar('Product type', 'Defect rates', 'mean')

# 3. Analisis Downstream Supply Chain

## Analisis Shipping

In [30]:
piechart('Shipping carriers', 'Shipping carriers', 'count')

In [31]:
onebar('Shipping carriers', 'Number of products sold', 'sum')

In [32]:
onebar('Shipping carriers', 'Shipping times', 'mean')

In [33]:
onebar('Shipping carriers', 'Shipping costs', 'mean')

In [34]:
onebar('Shipping carriers', 'Total times', 'mean')

In [35]:
onebar('Shipping carriers', 'Defect rates', 'mean')

In [36]:
onebar('Shipping carriers', 'Costs', 'mean')

# Hypothesis Testing

In [43]:
df.shape

(100, 26)

In [72]:
cosmetics_profits = df[df['Product type'] == 'cosmetics']
skincare_profits = df[df['Product type'] == 'skincare']
haircare_profits = df[df['Product type'] == 'haircare']

print(f'Cosmetics Shape: {cosmetics_profits.shape}, Skincare Shape: {skincare_profits.shape}, Haircare Shape: {haircare_profits.shape}')

Cosmetics Shape: (26, 26), Skincare Shape: (40, 26), Haircare Shape: (34, 26)


In [73]:
cosmetics_pfs = cosmetics_profits['Profits']
skincare_pfs = skincare_profits['Profits']
haircare_pfs = haircare_profits['Profits']

In [76]:
cosmetics_avg_pfs = cosmetics_pfs.mean().round(2)
skincare_avg_pfs = skincare_pfs.mean().round(2)
haircare_avg_pfs = haircare_pfs.mean().round(2)

print(f'Cosmetics mean: {cosmetics_avg_pfs}, Skincare mean: {skincare_avg_pfs}, Haircare mean: {haircare_avg_pfs}')

Cosmetics mean: 23050.14, Skincare mean: 26247.93, Haircare mean: 18560.23


In [81]:
from scipy import stats
import statistics

# a = [1500, 700, 100, 200, 300, 400, 500, 1000, 800, 600]
# b = [15000, 7000, 1000, 2000, 3000, 4000, 5000, 10000, 8000, 6000]
# statistics.mean(b)

tstat, pval = stats.ttest_ind(cosmetics_pfs, haircare_pfs)

if pval <= 0.05:
  print(f'HO is rejected, The conclusion is the average value from a and b is statistically significantly different : {pval}')
else:
  print(f'Failed to reject H0 (there is no significant diffrents the average from a and b), the pval is: {pval}')

Failed to reject H0 (there is no significant diffrents the average from a and b), the pval is: 0.3660441230184609


https://serupa.id/supply-chain-management-pengertian-siklus-komponen-dsb/