## 台灣原住民族 領域資料之專用資料(通用資料): 編列代碼
1. 身分別(台灣原住民)
2. 族別((台灣原住民族名稱)
3. 部落別(部落名稱、部落名稱_名族名稱)

### 讀取台灣原住民族相關資料內容
1. 原民身分
2. 核定台灣原住民族
3. 核定部落、區域及居民所屬族別)
4. 核定台灣原住民族各族語言及方言(根據原住民族語言能力認證測驗之分類)

In [1]:
import pandas as pd

fileName = r'專用資料_代碼_20220321.xlsx'
with pd.ExcelFile(fileName) as xlsxFile:
    df_id = pd.read_excel(xlsxFile, sheet_name='身分別_代碼', header=0)
    df_tip = pd.read_excel(xlsxFile, sheet_name='族別_代碼', header=0)
    df_tribe = pd.read_excel(xlsxFile, sheet_name='部落別_代碼', header=0)

#### 1. 編列原住民族身分別代碼 (1~ 2)

In [2]:
df_id['身分別_代碼'] = '0'
df_id.dropna(inplace=True)
df_id

Unnamed: 0,編號,身分,代碼,身分別_代碼
0,1,非原住民,1,0
1,2,山地原住,2,0
2,3,平地原住民,3,0


In [3]:
for i in range(df_id.shape[0]):
    df_id['身分別_代碼'].iloc[i] = format(df_id['編號'].iloc[i].astype(int), '01d')
df_id

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._setitem_single_block(indexer, value, name)


Unnamed: 0,編號,身分,代碼,身分別_代碼
0,1,非原住民,1,1
1,2,山地原住,2,2
2,3,平地原住民,3,3


#### 2. 編列原住民族 核定民族別 代碼 (01~16)

In [4]:
df_tip['族別_代碼'] = '0'
df_tip.dropna(inplace=True)
df_tip

Unnamed: 0,編號,族別,代碼,族別_代碼
0,1,阿美族,1,0
1,2,泰雅族,2,0
2,3,排灣族,3,0
3,4,布農族,4,0
4,5,卑南族,5,0
5,6,魯凱族,6,0
6,7,鄒族,7,0
7,8,賽夏族,8,0
8,9,雅美族,9,0
9,10,邵族,10,0


#### * 建立　族名:代碼　字典

In [5]:
dict_tip = dict() # create the dictionary for the key-value pair of the 'tip'-'tip_id'
for i in range(df_tip.shape[0]):
    df_tip['族別_代碼'].iloc[i] = format(df_tip['編號'].iloc[i].astype(int), '02d')
    dict_tip[df_tip['族別'].iloc[i].strip()] = df_tip['族別_代碼'].iloc[i]
df_tip
dict_tip

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._setitem_single_block(indexer, value, name)


{'阿美族': '01',
 '泰雅族': '02',
 '排灣族': '03',
 '布農族': '04',
 '卑南族': '05',
 '魯凱族': '06',
 '鄒族': '07',
 '賽夏族': '08',
 '雅美族': '09',
 '邵族': '10',
 '噶瑪蘭族': '11',
 '太魯閣族': '12',
 '撒奇萊雅族': '13',
 '賽德克族': '14',
 '拉阿魯哇族': '15',
 '卡那卡那富族': '16'}

#### 3. 編列原住民族 核定部落代碼(0001 ~ 0735)、核定部落+族別代碼('0001 ~ 0375' + 族別1 '01 ~ 16' + 族別2 '01 ~ 16' + 族別3 '01 ~ 16' +...)

In [6]:
_tribe = df_tribe[['編號', '部落名稱', '族別']]
_tribe['部落別_代碼'] = '0'
_tribe.dropna(inplace=True)
_tribe

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  _tribe['部落別_代碼'] = '0'
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  return func(*args, **kwargs)


Unnamed: 0,編號,部落名稱,族別,部落別_代碼
0,1.0,桶壁部落,泰雅族,0
1,2.0,烏來部落,泰雅族,0
2,3.0,哪哮部落,泰雅族,0
3,4.0,德拉楠部落,泰雅族,0
4,5.0,比雅山(角板山)部落,泰雅族,0
...,...,...,...,...
731,731.0,中心崙部落,排灣族,0
732,732.0,內獅部落,排灣族,0
733,733.0,里德部落,排灣族,0
734,734.0,分水嶺部落,排灣族,0


In [7]:
for i in range(_tribe.shape[0]):
    _tribe['部落別_代碼'].iloc[i] = format(_tribe['編號'].iloc[i].astype(int), '04d')
_tribe

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._setitem_single_block(indexer, value, name)


Unnamed: 0,編號,部落名稱,族別,部落別_代碼
0,1.0,桶壁部落,泰雅族,0001
1,2.0,烏來部落,泰雅族,0002
2,3.0,哪哮部落,泰雅族,0003
3,4.0,德拉楠部落,泰雅族,0004
4,5.0,比雅山(角板山)部落,泰雅族,0005
...,...,...,...,...
731,731.0,中心崙部落,排灣族,0731
732,732.0,內獅部落,排灣族,0732
733,733.0,里德部落,排灣族,0733
734,734.0,分水嶺部落,排灣族,0734


#### * 查族名：代碼 字典，提供編列 部落別-族別_代碼

In [8]:
_tribe['部落別-族別_代碼'] = '0'
_tribe.dropna(inplace=True)
for i in range(_tribe.shape[0]):
    resident_tribe = _tribe['族別'].iloc[i]
    # 調整輸入'族名'內容
    resident_tribe.strip() # 族名前後有空白
    resident_tribe.replace(' ', '') # 族名字間有空白
    resident = resident_tribe.split('、') # 不同族名間用'、'區隔
    print(resident_tribe, '#', resident)
    _code = list()
    for j in range(len(resident)):
        _resident = resident[j].strip()
        print(_resident, '*', dict_tip[_resident])
        _code.append(dict_tip[_resident])
    code = "".join(_code) # 依序組合(cascade)所有族名代碼
    print(code)
    _tribe['部落別-族別_代碼'].iloc[i] = code # 放入代碼欄
_tribe

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  _tribe['部落別-族別_代碼'] = '0'
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  return func(*args, **kwargs)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._setitem_single_block(indexer, value, name)


泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族']
泰雅族 * 02
02
泰雅族 # ['泰雅族'

阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
噶瑪蘭族 # ['噶瑪蘭族']
噶瑪蘭族 * 11
11
撒奇萊雅族 # ['撒奇萊雅族']
撒奇萊雅族 * 13
13
布農族 # ['布農族']
布農族 * 04
04
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
撒奇萊雅族 # ['撒奇萊雅族']
撒奇萊雅族 * 13
13
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01
01
阿美族 # ['阿美族']
阿美族 * 01


排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族  # ['排灣族 ']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03
排灣族 # ['排灣族']
排灣族 * 03
03


Unnamed: 0,編號,部落名稱,族別,部落別_代碼,部落別-族別_代碼
0,1.0,桶壁部落,泰雅族,0001,02
1,2.0,烏來部落,泰雅族,0002,02
2,3.0,哪哮部落,泰雅族,0003,02
3,4.0,德拉楠部落,泰雅族,0004,02
4,5.0,比雅山(角板山)部落,泰雅族,0005,02
...,...,...,...,...,...
731,731.0,中心崙部落,排灣族,0731,03
732,732.0,內獅部落,排灣族,0732,03
733,733.0,里德部落,排灣族,0733,03
734,734.0,分水嶺部落,排灣族,0734,03


#### 4. 編列族語及方言代碼( tribal language、dialect)
1. 目前族語別、各族語別所屬的方言，原始資料結構已經手動編列代碼了
2. 先暫時不用程式編列

#### 5. 最後將所有編列的代碼，寫到 '專用資料_代表' 表內
1. 原住民身分別代碼 工作表
2. 原住民族族別代碼 工作表
3. 原住民族核定部落(含族別)代碼 工作表

In [9]:
writer = pd.ExcelWriter('專用資料_代碼.xlsx')
df_id.to_excel(writer, sheet_name='身分別_代碼', index=False)
df_tip.to_excel(writer, sheet_name='族別_代碼', index=False)
_tribe.to_excel(writer, sheet_name='部落+族別_代碼', index=False)
writer.save()