In [None]:
# IDCデータで抽出したデータ(Excel)に対し全需/シェア分析のために情報を自動付加する。

# 1. IDC Excelのピボットで分析したいデータを表示
# 使用するフィールド: Brand, Model_name, Product:Laser, Segment1:Office, Segument3:A3MFP Mono, Format, Tone:Mono, 
#                    A4_Mono_Speed:50-80の数値, A4_Color_Speed, Country, REGION, FX_Year:表示したい年, Units
# フィルター: Country, Product:Laser, Format, Tone:Mono, Segument1:Office
# 行: Segument3: A3MFR Mono, REGION:JP, AP, CHN, Brand, Model_Name, A4_Mono_Speed, A4_Color_Speed, FY_Year, 集計

# 2. このスクリプトを起動して実行すると、IDC Excelを自動的に読み込み、情報を付加したうえで日付+全需&シェア動向_D-Mono.xlsxのデータシートに反映してデスクトップに保存される。
# 途中、メーカー名略称、商品名略称をそれぞれメーカー辞書.xlsx, 商品名辞書.xlsxを参照するが、登録がない場合、修正するように指示されるので修正して再実行する。

# 3. 全需&シェア動向.xlsxを開き、Excelピボットを更新する。フィルタボタンが消えてしまっている場合は、ピボットUIからボタンを表示指定して表示する。
# ※ピボットテーブル分析>データソースの変更>データソースの変更>新しいデータの範囲を指定


In [1]:
import pandas as pd
import datetime

thisyear=datetime.date.today ().year
df = pd.read_excel("20240521_IDC_Tracker_FY09Q4-23Q4.xlsx", sheet_name="Pivot", 
                   keep_default_na=False, na_values=[''], 
                   skiprows=[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16],
                   header=0)

In [2]:
# テーブルの整形
# 1. 最終行に"総計"が入ってしまった場合は最終行を削除
if df['Segment3'].iloc[-1]=='総計':df = df.drop(df.index[-1])  

In [3]:
# 2. NaNを埋める
df[['Segment3','REGION','Brand','Model_Name','A4_Mono_Speed','A4_Color_Speed']]=df[['Segment3','REGION','Brand','Model_Name','A4_Mono_Speed','A4_Color_Speed']].ffill()

In [4]:
# 3. Brand(メーカー名)略称列を作成
company_df = pd.read_excel('メーカー辞書.xlsx')
company_dic=dict(zip(company_df['Brand'],company_df['Brand略称']))
  # 'メーカー辞書.xlsx'に登録されていないものがないかをチェック、ある場合は修正用メーカー辞書.xlsxを出力
if False in [brand in company_dic.keys() for brand in list(set(df['Brand']))]:
    print('メーカー辞書.xlsxに未登録のメーカーがあります。')
    for item in list(set(df['Brand'])):
        if item not in company_dic.keys():
            company_df=pd.concat([company_df,pd.DataFrame([{"Brand":item,"Brand略称":"<登録してください>"}])],ignore_index=True)
    company_df.to_excel("メーカー辞書(修正用).xlsx",index=False)
    exit("終了します。メーカー辞書(修正用).xlsxを修正し、ファイル名を変更して再実行してください")
else:
    df['Brand略称']=[company_dic[val] for val in df['Brand']]

In [5]:
# 4. Model(商品)略称列を作成
product_df = pd.read_excel('商品辞書.xlsx')
product_dic=dict(zip(product_df['Model_Name'],product_df['Model_Name略称']))

  # '商品辞書.xlsx'に登録されていないものがないかをチェック、ある場合は修正用商品辞書.xlsxを出力
if False in [product in product_dic.keys() for product in list(set(df['Model_Name']))]:
    print('商品辞書.xlsxに未登録の商品があります。')
    for item in list(set(df['Model_Name'])):
        if item not in product_dic.keys():
            product_df=pd.concat([product_df,pd.DataFrame([{"Model_Name":item,"Model_Name略称":"<登録してください>"}])],ignore_index=True)
    product_df.to_excel("商品辞書(修正用).xlsx",index=False)
    exit("終了します。商品辞書(修正用).xlsxを修正し、ファイル名を変更して再実行してください")
else:
    df['Model_Name略称']=[product_dic[val] for val in df['Model_Name']]

In [6]:
# 5. A4 Mono Speed層列を作成
df['Speed層']=[int(val/10)*10 for val in df['A4_Mono_Speed']]

In [7]:
# 6. Year列を生成
df['Year']=[int('20'+str(val)[-2:]) for val in df['FY_Year']] 

In [8]:
# 7. JP, AP, CHN, NAを抽出
df=pd.concat([df.loc[df['REGION']=='JP'],df.loc[df['REGION']=='AP'],df.loc[df['REGION']=='CHN'],df.loc[df['REGION']=='NA']])

In [13]:
def save_excel(df, output_path, excel_template_dir):
    import pandas as pd
    import openpyxl
    from openpyxl.styles import Font
    from openpyxl.styles import PatternFill
    import datetime
    import os


    excel_output_filename = (
        datetime.datetime.now().strftime("%Y%m%d") + "_全需&シェア動向_D-Mono.xlsx"
    )
    excel_output_path = output_path + "\\" + excel_output_filename
    
    excel_template_name = "全需&シェア動向_Form.xlsx"
    wb = openpyxl.load_workbook(excel_template_name)

    strong_font = Font(name="ＭＳ Ｐ明朝", size=16, bold=True, color="000000ff")
    cell_color = PatternFill(patternType="solid", fgColor="00CCFFFF")

    excelRow=1
    sheet = wb["データ"]
    for i in range(len(df)):
        data = df.loc[i]
        excelRow=excelRow+1
        sheet.cell(row=excelRow, column=1).value = excelRow-1
        sheet.cell(row=excelRow, column=2).value = data["Segment3"]
        sheet.cell(row=excelRow, column=3).value = data["REGION"]
        sheet.cell(row=excelRow, column=4).value = data["Brand"]
        sheet.cell(row=excelRow, column=5).value = data["Brand略称"]
        sheet.cell(row=excelRow, column=6).value = data["Model_Name"]
        sheet.cell(row=excelRow, column=7).value = data["Model_Name略称"]
#        sheet.cell(row=excelRow, column=7).font = strong_font
#        sheet.cell(row=excelRow, column=7).fill = cell_color
        sheet.cell(row=excelRow, column=8).value = data["Speed層"]
        sheet.cell(row=excelRow, column=9).value = data["A4_Mono_Speed"]
        sheet.cell(row=excelRow, column=10).value = data["A4_Color_Speed"]
        sheet.cell(row=excelRow, column=11).value = data["FY_Year"]
        sheet.cell(row=excelRow, column=12).value = data["Year"]
        sheet.cell(row=excelRow, column=13).value = data["集計"]
    remove_if_file_exist(excel_output_path)
    wb.save(excel_output_path)
    # wb.save(excel_output_path)
    print("全需&シェア動向 Excel Fileが完成しました")
    return excel_output_path

# 同じファイル名のファイルが存在する場合は削除する
def remove_if_file_exist(path):
    import os

    if os.path.exists(path) == True:
        print("古いファイルがあったので削除します({})".format(os.path.basename(path)))
        os.remove(path)
    return

In [14]:
# Excelに保存
df=df.reindex(columns=['Segment3','REGION','Brand','Brand略称','Model_Name','Model_Name略称','Speed層','A4_Mono_Speed','A4_Color_Speed','FY_Year','Year','集計'])
# df.to_excel(datetime.date.today().strftime("%Y%m%d")+"D-Mono_Analyze.xlsx")

import os

excel_template_dir = "."
output_path = os.getenv("HOMEDRIVE") + os.getenv("HOMEPATH") + "\\Desktop"
save_excel(df, output_path, excel_template_dir)



古いファイルがあったので削除します(20240531_全需&シェア動向_D-Mono.xlsx)
全需&シェア動向 Excel Fileが完成しました


'C:\\Users\\fx22228.DC00\\Desktop\\20240531_全需&シェア動向_D-Mono.xlsx'

In [11]:
df

Unnamed: 0,Segment3,REGION,Brand,Model_Name,A4_Mono_Speed,A4_Color_Speed,FY_Year,集計,Brand略称,Model_Name略称,Speed層,Year
0,A3MFP Mono,JP,Canon,imageRUNNER ADVANCE 6065-R,65.0,0.0,FY20,37,Canon,対象外,60,2020
1,A3MFP Mono,JP,Canon,imageRUNNER ADVANCE 6265-R,65.0,0.0,FY20,112,Canon,対象外,60,2020
2,A3MFP Mono,JP,Canon,imageRUNNER ADVANCE 6265-R,65.0,0.0,FY21,30,Canon,対象外,60,2021
3,A3MFP Mono,JP,Canon,imageRUNNER ADVANCE 6265-R,65.0,0.0,FY22,1,Canon,対象外,60,2022
4,A3MFP Mono,JP,Canon,imageRUNNER ADVANCE 6560 III,60.0,0.0,FY20,155,Canon,iRA(C),60,2020
...,...,...,...,...,...,...,...,...,...,...,...,...
898,A3MFP Mono,CHN,Toshiba,e-STUDIO 8618A,85.0,0.0,FY21,83,東芝,e-STUDIO(D),80,2021
899,A3MFP Mono,CHN,Toshiba,e-STUDIO 8618A,85.0,0.0,FY22,52,東芝,e-STUDIO(D),80,2022
900,A3MFP Mono,CHN,Toshiba,e-STUDIO 8618A,85.0,0.0,FY23,14,東芝,e-STUDIO(D),80,2023
901,A3MFP Mono,CHN,Great Wall,GBD-B601,60.0,0.0,FY23,23,カウント対象外,対象外,60,2023
