In [2]:
import pandas as pd
import numpy as np
import re

In [3]:
df_keyword = pd.DataFrame({
    "keyid": np.arange(5),
    "keyword": ["numpy", "pandas", "matplotlib", "sklearn", "tensorflow"]
})
df_keyword

Unnamed: 0,keyid,keyword
0,0,numpy
1,1,pandas
2,2,matplotlib
3,3,sklearn
4,4,tensorflow


In [4]:
df_sentence = pd.DataFrame({
    "senid": np.arange(10, 17),
    "sentence": [
        "怎样用Pandas实现数据的Merge？",
        "Python之Numpy详细教程",
        "怎样使用Pandas批量拆分与合并Excel文件？",
        "怎样使用Pandas的map和apply函数？",
        "深度学习及TensorFlow简介",
        "Tensorflow和Numpy的关系",
        "基于sklearn的一些机器学习的代码"
    ]
})
df_sentence

Unnamed: 0,senid,sentence
0,10,怎样用Pandas实现数据的Merge？
1,11,Python之Numpy详细教程
2,12,怎样使用Pandas批量拆分与合并Excel文件？
3,13,怎样使用Pandas的map和apply函数？
4,14,深度学习及TensorFlow简介
5,15,Tensorflow和Numpy的关系
6,16,基于sklearn的一些机器学习的代码


In [5]:
df_keyword['a'] = 1
df_keyword.head()

Unnamed: 0,keyid,keyword,a
0,0,numpy,1
1,1,pandas,1
2,2,matplotlib,1
3,3,sklearn,1
4,4,tensorflow,1


In [6]:
df_sentence["a"] = 1
df_sentence.head()

Unnamed: 0,senid,sentence,a
0,10,怎样用Pandas实现数据的Merge？,1
1,11,Python之Numpy详细教程,1
2,12,怎样使用Pandas批量拆分与合并Excel文件？,1
3,13,怎样使用Pandas的map和apply函数？,1
4,14,深度学习及TensorFlow简介,1


In [11]:
df = pd.merge(df_keyword, df_sentence)
df

Unnamed: 0,keyid,keyword,a,senid,sentence
0,0,numpy,1,10,怎样用Pandas实现数据的Merge？
1,0,numpy,1,11,Python之Numpy详细教程
2,0,numpy,1,12,怎样使用Pandas批量拆分与合并Excel文件？
3,0,numpy,1,13,怎样使用Pandas的map和apply函数？
4,0,numpy,1,14,深度学习及TensorFlow简介
5,0,numpy,1,15,Tensorflow和Numpy的关系
6,0,numpy,1,16,基于sklearn的一些机器学习的代码
7,1,pandas,1,10,怎样用Pandas实现数据的Merge？
8,1,pandas,1,11,Python之Numpy详细教程
9,1,pandas,1,12,怎样使用Pandas批量拆分与合并Excel文件？


In [13]:
def panduan(df_):
    return re.search(df_['keyword'], df_['sentence'],re.IGNORECASE) is not None
df[df.apply(panduan, axis=1)]

Unnamed: 0,keyid,keyword,a,senid,sentence
1,0,numpy,1,11,Python之Numpy详细教程
5,0,numpy,1,15,Tensorflow和Numpy的关系
7,1,pandas,1,10,怎样用Pandas实现数据的Merge？
9,1,pandas,1,12,怎样使用Pandas批量拆分与合并Excel文件？
10,1,pandas,1,13,怎样使用Pandas的map和apply函数？
27,3,sklearn,1,16,基于sklearn的一些机器学习的代码
32,4,tensorflow,1,14,深度学习及TensorFlow简介
33,4,tensorflow,1,15,Tensorflow和Numpy的关系


In [18]:
de_keyword_dict={
    df_.keyword:df_.keyid
    for df_ in df_keyword.itertuples()
}
de_keyword_dict

{'numpy': 0, 'pandas': 1, 'matplotlib': 2, 'sklearn': 3, 'tensorflow': 4}

In [27]:
def panduan(df_):
    for keyword, keyid in de_keyword_dict.items():
         if re.search(keyword, df_["sentence"], re.IGNORECASE):
                df_['b'] = [keyid]
            
    return df_
df_merge = df_sentence.apply(panduan, axis=1)
df_merge

Unnamed: 0,senid,sentence,a,b
0,10,怎样用Pandas实现数据的Merge？,1,[1]
1,11,Python之Numpy详细教程,1,[0]
2,12,怎样使用Pandas批量拆分与合并Excel文件？,1,[1]
3,13,怎样使用Pandas的map和apply函数？,1,[1]
4,14,深度学习及TensorFlow简介,1,[4]
5,15,Tensorflow和Numpy的关系,1,[4]
6,16,基于sklearn的一些机器学习的代码,1,[3]


In [28]:
def panduan(df_):
    df_['b'] = [
        keyid
        for keyword, keyid in de_keyword_dict.items() 
        if re.search(keyword, df_["sentence"], re.IGNORECASE)]
            
    return df_
df_merge = df_sentence.apply(panduan, axis=1)
df_merge

Unnamed: 0,senid,sentence,a,b
0,10,怎样用Pandas实现数据的Merge？,1,[1]
1,11,Python之Numpy详细教程,1,[0]
2,12,怎样使用Pandas批量拆分与合并Excel文件？,1,[1]
3,13,怎样使用Pandas的map和apply函数？,1,[1]
4,14,深度学习及TensorFlow简介,1,[4]
5,15,Tensorflow和Numpy的关系,1,"[0, 4]"
6,16,基于sklearn的一些机器学习的代码,1,[3]


In [29]:
df_merge.explode("b")

Unnamed: 0,senid,sentence,a,b
0,10,怎样用Pandas实现数据的Merge？,1,1
1,11,Python之Numpy详细教程,1,0
2,12,怎样使用Pandas批量拆分与合并Excel文件？,1,1
3,13,怎样使用Pandas的map和apply函数？,1,1
4,14,深度学习及TensorFlow简介,1,4
5,15,Tensorflow和Numpy的关系,1,0
5,15,Tensorflow和Numpy的关系,1,4
6,16,基于sklearn的一些机器学习的代码,1,3


In [30]:
df_result = pd.merge(
    left = df_merge.explode("b"),
    right = df_keyword,
    left_on = "b",
    right_on = "keyid"
)
df_result

Unnamed: 0,senid,sentence,a_x,b,keyid,keyword,a_y
0,10,怎样用Pandas实现数据的Merge？,1,1,1,pandas,1
1,12,怎样使用Pandas批量拆分与合并Excel文件？,1,1,1,pandas,1
2,13,怎样使用Pandas的map和apply函数？,1,1,1,pandas,1
3,11,Python之Numpy详细教程,1,0,0,numpy,1
4,15,Tensorflow和Numpy的关系,1,0,0,numpy,1
5,14,深度学习及TensorFlow简介,1,4,4,tensorflow,1
6,15,Tensorflow和Numpy的关系,1,4,4,tensorflow,1
7,16,基于sklearn的一些机器学习的代码,1,3,3,sklearn,1
