In [1]:
import pandas as pd

df = pd.DataFrame({'month': [1, 4, 7, 10],
                   'year': [2012, 2014, 2013, 2014],
                   'sale': [55, 40, 84, 31]})

In [2]:
df

Unnamed: 0,month,year,sale
0,1,2012,55
1,4,2014,40
2,7,2013,84
3,10,2014,31


In [3]:
df2 = df.set_index(['year', 'month'])

In [4]:
df2

Unnamed: 0_level_0,Unnamed: 1_level_0,sale
year,month,Unnamed: 2_level_1
2012,1,55
2014,4,40
2013,7,84
2014,10,31


In [5]:
df2.reset_index(level=['month', 'year'])

Unnamed: 0,year,month,sale
0,2012,1,55
1,2014,4,40
2,2013,7,84
3,2014,10,31


In [6]:
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two',
                            'two'],
                    'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
                    'baz': [1, 2, 3, 4, 5, 6],
                    'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

In [8]:
df

Unnamed: 0,foo,bar,baz,zoo
0,one,A,1,x
1,one,B,2,y
2,one,C,3,z
3,two,A,4,q
4,two,B,5,w
5,two,C,6,t


In [7]:
df.pivot(index='foo', columns='bar')

Unnamed: 0_level_0,baz,baz,baz,zoo,zoo,zoo
bar,A,B,C,A,B,C
foo,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
one,1,2,3,x,y,z
two,4,5,6,q,w,t


In [9]:
df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo",
                          "bar", "bar", "bar", "bar"],
                    "B": ["one", "one", "one", "two", "two",
                          "one", "one", "two", "two"],
                    "C": ["small", "large", "large", "small",
                          "small", "large", "small", "small",
                          "large"],
                    "D": [1, 2, 2, 3, 3, 4, 5, 6, 7]})

In [10]:
df

Unnamed: 0,A,B,C,D
0,foo,one,small,1
1,foo,one,large,2
2,foo,one,large,2
3,foo,two,small,3
4,foo,two,small,3
5,bar,one,large,4
6,bar,one,small,5
7,bar,two,small,6
8,bar,two,large,7


In [11]:
from collections import defaultdict

df['E'] = df[['C', 'D']].apply(lambda x: {x[0]:[x[1]]}, axis=1)

In [12]:
df

Unnamed: 0,A,B,C,D,E
0,foo,one,small,1,{'small': [1]}
1,foo,one,large,2,{'large': [2]}
2,foo,one,large,2,{'large': [2]}
3,foo,two,small,3,{'small': [3]}
4,foo,two,small,3,{'small': [3]}
5,bar,one,large,4,{'large': [4]}
6,bar,one,small,5,{'small': [5]}
7,bar,two,small,6,{'small': [6]}
8,bar,two,large,7,{'large': [7]}


In [13]:
sectors = df.groupby(['A', 'B'])

In [14]:
sectors.groups.keys()

dict_keys([('bar', 'one'), ('bar', 'two'), ('foo', 'one'), ('foo', 'two')])

In [15]:
sectors.get_group(('bar', 'one'))

Unnamed: 0,A,B,C,D,E
5,bar,one,large,4,{'large': [4]}
6,bar,one,small,5,{'small': [5]}


In [17]:
from functools import reduce

def merge(x, y):
    print(x)
    print(y)
    if isinstance(x, dict):
        for key in y.keys():
            if key in x.keys():
                x.update({key:x[key] + y[key]})
            else:
                x.update({key:y[key]})
    return x
    
    

pd.pivot_table(df, index=['A', 'B'], values=['E'], aggfunc=lambda x: reduce(merge, x))

{'large': [4]}
{'small': [5]}
{'small': [6]}
{'large': [7]}
{'small': [1]}
{'large': [2]}
{'small': [1], 'large': [2]}
{'large': [2]}
{'small': [3]}
{'small': [3]}


Unnamed: 0_level_0,Unnamed: 1_level_0,E
A,B,Unnamed: 2_level_1
bar,one,"{'large': [4], 'small': [5]}"
bar,two,"{'small': [6], 'large': [7]}"
foo,one,"{'small': [1], 'large': [2, 2]}"
foo,two,"{'small': [3, 3]}"


In [18]:
sectors.agg(lambda x: reduce(merge, x))

large
small
small
large
small
large
small
large
small
small
4
5
6
7
1
2
1
2
3
3
{'large': [4], 'small': [5]}
{'small': [5]}
{'small': [6], 'large': [7]}
{'large': [7]}
{'small': [1], 'large': [2, 2]}
{'large': [2]}
{'small': [1], 'large': [2, 2, 2]}
{'large': [2]}
{'small': [3, 3]}
{'small': [3]}


Unnamed: 0_level_0,Unnamed: 1_level_0,C,D,E
A,B,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
bar,one,large,4,"{'large': [4], 'small': [5, 5]}"
bar,two,small,6,"{'small': [6], 'large': [7, 7]}"
foo,one,small,1,"{'small': [1], 'large': [2, 2, 2, 2]}"
foo,two,small,3,"{'small': [3, 3, 3]}"


In [19]:
x = {
    "生理反應(生理)_1": "我只是失眠者隨",
    "負向(情緒)_1": "過早國中談戀愛，失戀了，感覺到痛苦萬分",
    "自殺行為(行為)_1": "對國中的我來說，可能壓抑不過去。\n這是我失去理智自殘的第一次。也是第N次",
    "自殺與憂鬱(認知)_1": "中間戀愛發生戀愛過程導致憂鬱",
    "自殺行為(行為)_2": "我從未帶到至學校自殘過\n只是在家偷偷的劃著",
    "自殺與憂鬱(認知)_2": "我怠惰了，我也墮落了\n我也還不明白自己怎麼了",
    "自殺行為(行為)_3": "今年\n我將自己壓抑到一個極限",
    "自殺與憂鬱(認知)_3": "工作要求太完美，學業要求太細節\n我感覺什麼事情都做不好辦不到",
    "負向(情緒)_2": "重點是男友也不懂我為何每日低落",
    "自殺與憂鬱(認知)_4": "我曾經跟他詢問說我好像可能憂鬱症嗎？我想看個醫生，他只覺得我想太多",
    "自殺行為(行為)_4": "一直到我計畫很久了老樣子\n情緒崩潰\n我自殘了\n這次送了救護車到醫院",
    "生理反應(生理)_2": "在我的夢裡不斷做惡夢",
    "正向理由(認知)_1": "我不想跳樓，砸到車要賠\n我不想燒炭，會變凶宅",
    "負向(情緒)_3": "老樣子\n情緒崩潰",
    "自殺行為(行為)_5": "我第一次接受身心科的問診\n也第一次直接被派發到病床",
    "自殺行為(行為)_8": "畫面很血腥，手臂內外共縫了20幾針，必須送醫院\n最後因為割到肌鍵所以打石膏一個月",
    "自殺行為(行為)_7": "我沒有把照片.生病發給身邊任何平台\n所以朋友都不知道這些事，我都是蓋護腕",
    "自殺與憂鬱(認知)_5": "一直到現在我可能都還沒認清憂鬱的事實",
    "自殺行為(行為)_6": "鼓起勇氣\n看了幾次的醫生",
    "負向(情緒)_4": "雖然每次都爆哭"
}

In [20]:
pd.DataFrame.from_dict(x, orient='index').stack()

生理反應(生理)_1   0                                      我只是失眠者隨
負向(情緒)_1     0                          過早國中談戀愛，失戀了，感覺到痛苦萬分
自殺行為(行為)_1   0        對國中的我來說，可能壓抑不過去。\n這是我失去理智自殘的第一次。也是第N次
自殺與憂鬱(認知)_1  0                               中間戀愛發生戀愛過程導致憂鬱
自殺行為(行為)_2   0                       我從未帶到至學校自殘過\n只是在家偷偷的劃著
自殺與憂鬱(認知)_2  0                      我怠惰了，我也墮落了\n我也還不明白自己怎麼了
自殺行為(行為)_3   0                              今年\n我將自己壓抑到一個極限
自殺與憂鬱(認知)_3  0              工作要求太完美，學業要求太細節\n我感覺什麼事情都做不好辦不到
負向(情緒)_2     0                              重點是男友也不懂我為何每日低落
自殺與憂鬱(認知)_4  0            我曾經跟他詢問說我好像可能憂鬱症嗎？我想看個醫生，他只覺得我想太多
自殺行為(行為)_4   0         一直到我計畫很久了老樣子\n情緒崩潰\n我自殘了\n這次送了救護車到醫院
生理反應(生理)_2   0                                   在我的夢裡不斷做惡夢
正向理由(認知)_1   0                      我不想跳樓，砸到車要賠\n我不想燒炭，會變凶宅
負向(情緒)_3     0                                    老樣子\n情緒崩潰
自殺行為(行為)_5   0                   我第一次接受身心科的問診\n也第一次直接被派發到病床
自殺行為(行為)_8   0    畫面很血腥，手臂內外共縫了20幾針，必須送醫院\n最後因為割到肌鍵所以打石膏一個月
自殺行為(行為)_7   0        我沒有把照片.生病發給身邊任何平台\

In [23]:
pd.DataFrame.from_dict(x, orient='index')

Unnamed: 0,0
生理反應(生理)_1,我只是失眠者隨
負向(情緒)_1,過早國中談戀愛，失戀了，感覺到痛苦萬分
自殺行為(行為)_1,對國中的我來說，可能壓抑不過去。\n這是我失去理智自殘的第一次。也是第N次
自殺與憂鬱(認知)_1,中間戀愛發生戀愛過程導致憂鬱
自殺行為(行為)_2,我從未帶到至學校自殘過\n只是在家偷偷的劃著
自殺與憂鬱(認知)_2,我怠惰了，我也墮落了\n我也還不明白自己怎麼了
自殺行為(行為)_3,今年\n我將自己壓抑到一個極限
自殺與憂鬱(認知)_3,工作要求太完美，學業要求太細節\n我感覺什麼事情都做不好辦不到
負向(情緒)_2,重點是男友也不懂我為何每日低落
自殺與憂鬱(認知)_4,我曾經跟他詢問說我好像可能憂鬱症嗎？我想看個醫生，他只覺得我想太多


In [27]:
pd.DataFrame.from_dict(x, orient='columns')

ValueError: If using all scalar values, you must pass an index

In [21]:
def add(x, y) :
    print('debug')
    print(type(y))
    return x + y
 
reduce(add, [1]) 

1

In [22]:
reduce(add, [1,2]) 

debug
<class 'int'>


3