*** Unsupervised Text Feature Extraction ***

History:  
- v1: first version, 2017-09-26
- v2: update, 2017-10-09
  - 先用結巴斷詞
      - 中文以詞為單位, 而不是用字
      - 英文以單字為單位, 而不是用char
  - 結合N*N單字矩陣時, 兩個英文字中間加一個空白, 解決兩個英文單字結合時, 無法計算分數的問題
  - 儲存分析每一個iteration的關鍵字變化
  - 用簡總的文章再做一次
  - 用多篇文章找關鍵字
  

- TODO:     
  - 確認之前有哪一篇可以找出常用詞彙(應該是用簡總會議全部文章)

  
   

In [1]:
import os
import pandas as pd
import numpy as np

import matplotlib
import matplotlib.pyplot as plt

import jieba
import gensim
from gensim.models import Word2Vec
from gensim.models import KeyedVectors
import re
import ast

import random

import logging
import html_template as ht
import collections
from collections import OrderedDict
import itertools
import math

from itertools import combinations
from itertools import permutations
import argparse
    
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
pd.set_option('display.max_colwidth', -1)

%matplotlib inline
%load_ext autoreload
%autoreload 2


pd.set_option('display.max_columns', None)
punct = u'''\n +-％%:!),.:;?]}¢'"、。〉》」』】〕〗〞︰|︱︳丨﹐､﹒﹔﹕﹖﹗﹚﹜﹞！），．：；？｜｝︴︶︸︺︼︾﹀﹂﹄﹏､～￠々‖•·ˇˉ―′’”([{£¥'"‵〈《「『【〔〖（［｛￡￥〝︵︷︹︻︽︿﹁﹃﹙﹛﹝（｛“‘—_…~/#><'''
jieba.set_dictionary('dict.txt.big')
jieba.load_userdict('userdict.txt')

Building prefix dict from /Users/jayhsu/work/github/textmining/dict.txt.big ...
Loading model from cache /var/folders/yf/hq7ghg4j3ksb8k34wyh8vk2m0000gn/T/jieba.ub36e993abda9bbf53d1f5b38e3ae9b44.cache
Loading model cost 2.384 seconds.
Prefix dict has been built succesfully.


In [2]:
data_cleanregex = ['\[SS_\w+\]','\(adsbygoogle.+\)\;']
data_deleteregex_ = [r'.*\.srt$']

def data_clean(dirty_str):
    tmp_str = dirty_str
    for pat in data_cleanregex:
        tmp_str = re.sub(pat, '', tmp_str)
    return tmp_str

data_deleteregex = list(map(lambda x: re.compile(x), data_deleteregex_))
def data_delete(dirty_str):
    tmp_str = dirty_str
    for pattern in data_deleteregex:
        #pattern = re.compile(pat)  
        match1 = pattern.match(dirty_str)
        if match1:
            return True
    return False   
def loaddocs(folder, topic):
    files = os.listdir('{f}/{w}'.format(f=folder, w=topic))
    docs=[]
    fileName=[]
    
    for fidx, fname in enumerate(files):
        if fname.startswith('.') or fname.endswith('.flag') :
            continue

        file = open('{fd}/{w}/{f}'.format(fd=folder, w=topic, f=fname), 'r') 
        doc =[] 
        for line in file.readlines():                          
            line = line.strip()
            if not len(line):                               
                continue
            if data_delete(line):
                continue
                
            line = data_clean(line)
            
            doc.append(line) 
        if len(doc)==0:
            continue
        docs.append('\n'.join(doc))
        fileName.append(str(fidx)+'_'+fname)
    dl_df = pd.DataFrame({'fname':fileName, 'doc':docs})
    return dl_df

In [3]:
def remove_similar(powerterm):
    remove_list=[]
    for tup in powerterm:
        tmp2 = powerterm.copy()
        tmp2.remove(tup)
        tmp2 = dict(tmp2)
        result = [(key, value) for key, value in tmp2.items() if tup[0] in key]
        if len(result)==0:
            continue
        result = sorted(result, key=lambda tup: tup[1], reverse=True)
        if tup[1] < result[0][1]:
            remove_list.append(tup)

    _ = list(map(lambda tup:powerterm.remove(tup), remove_list))    

''' 
Example Case: 
tmplist = [('aa',1),('bb',1),('cc',1),('aa',1),]
remove_duplicate(tmplist)
display(tmplist)
'''

def is_chinese(uchar):         
    if '\u4e00' <= uchar<='\u9fff':
        return True
    else:
        return False
    

def is_number(uchar):
    if '\u0030' <= uchar<='\u0039':
        return True
    else:
        return False

def is_alphabet(uchar):         
    if ('\u0041' <= uchar<='\u005a') or ('\u0061' <= uchar<='\u007a'):
        return True
    else:
        return False

In [149]:
len(nature_chunk)

109

In [4]:
#計算分數的function
def NC_Scoring(tmp, nature_chunk):
    score =0
    subscore_fb=subscore_fl=subscore_fr=subscore_fn=0
    for chunk in nature_chunk:
        if tmp == chunk:
            subscore_fb = subscore_fb+1
        if chunk.startswith(tmp):
            subscore_fl = subscore_fl+1
        if chunk.endswith(tmp):
            subscore_fr = subscore_fr+1
        if tmp in chunk:
            subscore_fn = subscore_fn+1
    score = 0.5*subscore_fb + 0.2*(subscore_fl+subscore_fr)+0.1*subscore_fn
    score = len(tmp) * score
    return float('%.3f'% score)

#NC_Scoring('TITAN X')

In [5]:
def __getPowerTerm__(powerterm, paragraph, nature_chunk):
    #1. 斷字
    corpora_sentence = []
    for p in paragraph:
        term_known = list(filter(lambda t: t[0] in p, powerterm))
        term_known = list(map(lambda tup: tup[0], term_known))
        for w in powerterm:
            p = p.replace(w[0], '')
        p_cut = list(p)
        p_cut = list(filter(lambda x: x not in punct, p_cut))
        corpora_sentence.append(p_cut+term_known)
    
    #2. LDA
    sen_dictionary = gensim.corpora.Dictionary(corpora_sentence)  
    sen_corpus = [sen_dictionary.doc2bow(text) for text in corpora_sentence]  

    K = 5
    lda = gensim.models.ldamodel.LdaModel(corpus=sen_corpus, id2word=sen_dictionary, num_topics=K, update_every=0, passes=1)  
    corpus_lda = lda[sen_corpus] 
    wordTopic = lda.print_topics(num_topics=-1, num_words=15)
    wordTopic_pure = (list(map(lambda tup: (list(map(lambda tup: tup.split('*')[1].replace('"','').strip(),tup[1].split('+')))   ),wordTopic)))

    #3. 產生NxN term candidate, scoring排序, 取前5%為power term
    wordTopic_NN = list(map(lambda x: list(map(lambda tup: tup[0]+tup[1], list(permutations(x, 2)))) , wordTopic_pure))
    powerterm_candidate = set(sum(wordTopic_NN,[]))
    powerterm = list(map(lambda term: (term, NC_Scoring(term, nature_chunk)), powerterm_candidate))
    powerterm = list(filter(lambda tup: tup[1]>0,powerterm))
    powerterm = sorted(powerterm, key=lambda tup: tup[1], reverse=True)
    #powerterm = powerterm[: int(len(powerterm)*0.1)]
    #powerterm = list(map(lambda tup: tup[0], powerterm))
    return powerterm


In [279]:
def getPowerTerm(powerterm, paragraph, usejieba=False, num_words=15):
    #1. 斷字
    corpora_sentence = []
    for p in paragraph:
        term_known = list(filter(lambda t: t[0] in p, powerterm))
        term_known = list(map(lambda tup: tup[0], term_known))
        for w in term_known:
            p = p.replace(w, '')
        if usejieba:
            p_cut = jieba.cut(p)
            p_cut = list(p_cut)
        else:
            p_cut = list(p)
        p_cut = list(filter(lambda x: x not in punct, p_cut))
        corpora_sentence.append(p_cut+term_known)
    
    #2. LDA
    sen_dictionary = gensim.corpora.Dictionary(corpora_sentence)  
    sen_corpus = [sen_dictionary.doc2bow(text) for text in corpora_sentence]  

    K = 5
    lda = gensim.models.ldamodel.LdaModel(corpus=sen_corpus, id2word=sen_dictionary, num_topics=K, update_every=0, passes=1)  
    corpus_lda = lda[sen_corpus] 
    wordTopic = lda.print_topics(num_topics=-1, num_words=num_words)
    wordTopic_pure = (list(map(lambda tup: (list(map(lambda tup: tup.split('*')[1].replace('"','').strip(),tup[1].split('+')))   ),wordTopic)))
    wordTopic_pure = list(map(lambda x: list(filter(lambda y: len(y.strip())!=0, x)),wordTopic_pure))
    print(wordTopic_pure)
    #3. 產生NxN term candidate, scoring排序, 取前5%為power term
    #wordTopic_NN = list(map(lambda x: list(map(lambda tup: tup[0]+tup[1], list(permutations(x, 2)))) , wordTopic_pure))
    wordTopic_NN = list(map(lambda x: list(map(lambda tup: ' '.join([tup[0],tup[1]]) if is_alphabet(tup[0]) and is_alphabet(tup[1]) else ''.join([tup[0],tup[1]]), list(permutations(x, 2)))) , wordTopic_pure))
    
    #powerterm_candidate = set(sum(wordTopic_NN,[]))
    #powerterm = list(map(lambda term: (term, NC_Scoring(term, nature_chunk)), powerterm_candidate))
    #powerterm = list(filter(lambda tup: tup[1]>0,powerterm))
    #powerterm = sorted(powerterm, key=lambda tup: tup[1], reverse=True)
    #powerterm = powerterm[: int(len(powerterm)*0.1)]
    #powerterm = list(map(lambda tup: tup[0], powerterm))
    
    powerterm_list = []
    for words in wordTopic_NN:
        powerterm_candidate = set(words)
        powerterm = list(map(lambda term: (term, NC_Scoring(term, nature_chunk)), powerterm_candidate))
        powerterm = list(filter(lambda tup: tup[1]>0,powerterm))
        powerterm = sorted(powerterm, key=lambda tup: tup[1], reverse=True)
        powerterm_list.append(powerterm)
    return powerterm_list


In [228]:
nature_chunk=[]
def main(doc, itera = 20, linebreaknum=1, num_words=15):
    global nature_chunk
    paragraph_tmp = list(filter(lambda x: x != '...', doc.split('\n')))
    paragraph =[]
    for idx, item in enumerate (paragraph_tmp):
        if idx%linebreaknum ==0:
            paragraph.append('。'.join(paragraph_tmp[idx:idx+linebreaknum]))
    print(len(paragraph))
    print(paragraph)
    #產生nature_chunk
    nature_chunk = []
    for p in paragraph:
        chunk = ''.join((char if char.isalpha() or char.isdigit() or char.isspace() else '|') for char in p).strip().split('|')
        chunk = list(map(lambda x: x.strip(), chunk))
        nature_chunk = nature_chunk+chunk
    nature_chunk = list(filter(lambda a: a != '', nature_chunk))
    print(len(nature_chunk))
    #print(nature_chunk)
    powerterm = []
    powerterm_eachiter=[]
    powerterm_list=[]
    powerterm_list_eachiter=[]
    powerterm_word=[]
    for i in range(itera):
        powerterm_list= getPowerTerm(powerterm, paragraph,usejieba=True, num_words=num_words)
        powerterm_new = list(filter(lambda x: x[0] not in powerterm_word, sum(powerterm_list,[])))
        powerterm = powerterm + list(set(powerterm_new))
        powerterm = sorted(powerterm, key=lambda tup: tup[1], reverse=True)
        remove_similar(powerterm)
        powerterm_word = list(map(lambda tup: tup[0], powerterm))
        powerterm_eachiter.append(powerterm)
        powerterm_list_eachiter.append(powerterm_list)
    return powerterm_list_eachiter, powerterm_eachiter



In [263]:
def main2(doc, itera = 20, linebreaknum=1,num_words=15):
    global nature_chunk
    #paragraph_tmp = list(filter(lambda x: x != '...', doc.split('\n')))
    #paragraph =[]
    #for idx, item in enumerate (paragraph_tmp):
    #    if idx%linebreaknum ==0:
    #        paragraph.append('。'.join(paragraph_tmp[idx:idx+linebreaknum]))
    paragraph = list(map(lambda d: '。'.join(list(filter(lambda x: x != '...', d.split('\n')))), doc))
    print(len(paragraph))
    #print(paragraph)
    #產生nature_chunk
    nature_chunk = []
    for p in paragraph:
        chunk = ''.join((char if char.isalpha() or char.isdigit() or char.isspace() else '|') for char in p).strip().split('|')
        chunk = list(map(lambda x: x.strip(), chunk))
        nature_chunk = nature_chunk+chunk
    nature_chunk = list(filter(lambda a: a != '', nature_chunk))
    print('\n----------------------\n')
    print(len(nature_chunk))
    #print(nature_chunk)
    powerterm = []
    powerterm_eachiter=[]
    powerterm_list=[]
    powerterm_list_eachiter=[]
    powerterm_word=[]
    for i in range(itera):
        print('itera:',i)
        powerterm_list= getPowerTerm(powerterm, paragraph,usejieba=True, num_words=num_words)
        powerterm_new = list(filter(lambda x: x[0] not in powerterm_word, sum(powerterm_list,[])))
        powerterm = powerterm + list(set(powerterm_new))
        powerterm = sorted(powerterm, key=lambda tup: tup[1], reverse=True)
        remove_similar(powerterm)
        powerterm_word = list(map(lambda tup: tup[0], powerterm))
        powerterm_eachiter.append(powerterm)
        powerterm_list_eachiter.append(powerterm_list)
    return powerterm_list_eachiter, powerterm_eachiter

***
**Deep Learning Doc **

In [186]:
# CONFIGs
parser = argparse.ArgumentParser()
parser.add_argument('--data_dir', type=str, default='text/techdoc',)
parser.add_argument('--topic', type=str, default='深度學習',)  #'MARK'
parser.add_argument('--docid', type=str, default=13,)  
parser.add_argument('--iter', type=str, default=50,)  
args,unparsed = parser.parse_known_args()

dl_df = loaddocs(folder = args.data_dir, topic=args.topic)

In [187]:
%%time
doc = dl_df['doc'][args.docid]
powerterm_list_eachiter, powerterm_eachiter= main(doc, args.iter,linebreaknum=1)

26
109
CPU times: user 13.7 s, sys: 87.4 ms, total: 13.7 s
Wall time: 13.9 s


In [188]:
for i in range(args.iter):
    print('\n\niter ',i)
    topic_powerterm = pd.DataFrame(powerterm_list_eachiter[i])
    display(topic_powerterm.transpose().head()) 
    top_powerterm = pd.DataFrame(powerterm_eachiter[i])
    display(top_powerterm[:5+i])



iter  0


Unnamed: 0,0,1,2,3,4
0,"(TITAN X, 10.5)","(TITAN X, 10.5)","(DIGITS DevBox, 35.1)","(用於深度學習, 1.8)","(訓練系統, 4.0)"
1,"(DIGITS深度學習, 7.0)","(DIGITS深度學習, 7.0)","(DIGITS深度學習, 7.0)","(的深度學習, 1.5)","(NVIDIA深度學習, 3.0)"
2,"(GeForce GTX, 6.6)","(使用DIGITS, 4.8)","(使用DIGITS, 4.8)","(深度學習的, 1.0)","(DevBox的, 2.1)"
3,"(使用DIGITS, 4.8)","(訓練系統, 4.0)","(NVIDIA深度學習, 3.0)","(的系統, 0.9)","(的深度學習, 1.5)"
4,"(訓練系統, 4.0)","(X GPU, 3.0)","(DevBox的, 2.1)","(系統中, 0.3)","(GPU訓練, 1.5)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,TITAN X,10.5
2,DIGITS深度學習,7.0
3,GeForce GTX,6.6
4,使用DIGITS,4.8




iter  1


Unnamed: 0,0,1,2,3,4
0,"(TITAN X GPU, 6.6)","(深度學習GPU訓練系統, 6.6)","(GeForce GTX TITAN X, 13.3)","(TITAN X GPU, 6.6)","(GeForce GTX TITAN X, 13.3)"
1,"(使用DIGITS DevBox, 4.5)","(GPU訓練系統, 4.2)","(TITAN X GPU, 6.6)","(採用TITAN X, 2.7)","(NVIDIA GeForce GTX, 5.4)"
2,"(的DIGITS DevBox, 4.2)","(DIGITS深度學習 GPU, 4.2)","(GPU訓練系統, 4.2)","(的TITAN X, 2.4)","(的DIGITS DevBox, 4.2)"
3,"(的TITAN X, 2.4)","(數據科學家和, 1.2)","(的DIGITS DevBox, 4.2)","(採用NVIDIA, 2.4)","(NVIDIA深度學習, 3.0)"
4,"(TITAN X在, 2.4)","(了數據科學家, 0.6)","(全球最快, 2.4)","(TITAN X的, 2.4)","(的TITAN X, 2.4)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,GeForce GTX TITAN X,13.3
2,DIGITS深度學習,7.0
3,TITAN X GPU,6.6
4,深度學習GPU訓練系統,6.6
5,NVIDIA GeForce GTX,5.4




iter  2


Unnamed: 0,0,1,2,3,4
0,"(的深度學習研究工作, 0.9)","(GeForce GTX TITAN X的, 6.0)","(DIGITS深度學習 GPU, 4.2)","(使用DIGITS DevBox, 4.5)","(採用TITAN X GPU, 13.0)"
1,"(研究工作提供, 0.6)","(DIGITS深度學習 GPU, 4.2)","(訓練系統, 4.0)","(的DIGITS DevBox, 4.2)","(採用NVIDIA, 2.4)"
2,"(最佳化, 0.3)","(訓練系統, 4.0)","(的深度神經網絡, 2.8)","(訓練和, 0.9)","(的系統, 0.9)"
3,"(進行了, 0.3)","(GeForce GTX TITAN X售價, 2.1)","(訓練深度神經網絡, 2.4)","(訓練深度神經網絡的, 0.9)","(是NVIDIA, 0.7)"
4,"(了最, 0.2)","(的GeForce GTX TITAN X, 2.0)","(深度神經網絡的, 2.1)","(活動上, 0.9)","(而在, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,GeForce GTX TITAN X,13.3
2,採用TITAN X GPU,13.0
3,DIGITS深度學習,7.0
4,深度學習GPU訓練系統,6.6
5,GeForce GTX TITAN X的,6.0
6,NVIDIA GeForce GTX,5.4




iter  3


Unnamed: 0,0,1,2,3,4
0,"(DIGITS深度學習 GPU, 4.2)","(DIGITS DevBox可以, 4.5)","(NVIDIA GeForce GTX TITAN X, 26.0)","(訓練系統, 4.0)","(使用DIGITS DevBox, 4.5)"
1,"(GPU訓練, 1.5)","(使用DIGITS DevBox, 4.5)","(GeForce GTX TITAN X的, 6.0)","(訓練和, 0.9)","(的DIGITS DevBox, 4.2)"
2,"(的深度學習研究工作提供, 1.1)","(的DIGITS DevBox, 4.2)","(的GeForce GTX TITAN X, 2.0)","(的系統, 0.9)","(訓練系統, 4.0)"
3,"(自始至終都, 0.5)","(GPU訓練, 1.5)","(GPU訓練, 1.5)","(訓練數據集, 0.5)","(GPU訓練, 1.5)"
4,"(的GPU, 0.4)","(可以在, 0.9)","(訓練深度神經網絡的, 0.9)","(數據集都, 0.4)","(訓練模型, 1.2)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,採用TITAN X GPU,13.0
3,DIGITS深度學習,7.0
4,深度學習GPU訓練系統,6.6
5,GeForce GTX TITAN X的,6.0
6,使用DIGITS,4.8
7,使用DIGITS DevBox,4.5




iter  4


Unnamed: 0,0,1,2,3,4
0,"(使用DIGITS DevBox, 4.5)","(的DIGITS DevBox, 4.2)","(現已上市的GeForce GTX TITAN X, 7.2)","(DIGITS深度學習 GPU, 4.2)","(DIGITS深度學習 GPU, 4.2)"
1,"(的DIGITS DevBox, 4.2)","(的DIGITS, 1.4)","(現已上市的GeForce GTX, 4.8)","(GPU訓練, 1.5)","(訓練系統, 4.0)"
2,"(的時間, 1.8)","(在安裝, 0.9)","(的GeForce GTX TITAN X售價為, 2.3)","(訓練和, 0.9)","(GPU訓練, 1.5)"
3,"(DIGITS DevBox來訓練, 1.6)","(的系統, 0.9)","(GeForce GTX TITAN X售價為, 2.2)","(3072個, 0.5)","(的系統, 0.9)"
4,"(訓練深度神經網絡的, 0.9)","(的深度學習研究, 0.7)","(的GeForce GTX TITAN X售價, 2.2)","(的GPU, 0.4)","(的GPU, 0.4)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,採用TITAN X GPU,13.0
3,現已上市的GeForce GTX TITAN X,7.2
4,DIGITS深度學習,7.0
5,深度學習GPU訓練系統,6.6
6,GeForce GTX TITAN X的,6.0
7,使用DIGITS,4.8
8,使用DIGITS DevBox,4.5




iter  5


Unnamed: 0,0,1,2,3,4
0,"(全球最快的桌邊型, 4.8)","(DIGITS深度學習GPU訓練系統, 22.1)","(DIGITS深度學習 GPU, 4.2)","(在TITAN, 1.8)","(使用DIGITS, 4.8)"
1,"(的DIGITS DevBox, 4.2)","(DIGITS深度學習 GPU, 4.2)","(的DIGITS DevBox, 4.2)","(深度學習研究工作, 0.8)","(DIGITS可, 2.1)"
2,"(全球最快的, 3.0)","(GPU訓練, 1.5)","(的深度學習, 1.5)","(的深度學習研究, 0.7)","(的DIGITS, 1.4)"
3,"(桌邊型深度學習機器, 2.7)","(的DIGITS, 1.4)","(GPU訓練, 1.5)","(深度學習研究的, 0.7)","(訓練深度神經網絡的, 0.9)"
4,"(最快的桌邊型深度學習, 2.0)","(訓練和, 0.9)","(於深度學習, 1.5)","(的TITAN, 0.6)","(和訓練深度神經網絡, 0.9)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,DIGITS深度學習GPU訓練系統,22.1
3,採用TITAN X GPU,13.0
4,現已上市的GeForce GTX TITAN X,7.2
5,GeForce GTX TITAN X的,6.0
6,使用DIGITS,4.8
7,全球最快的桌邊型,4.8
8,使用DIGITS DevBox,4.5
9,DIGITS DevBox可以,4.5




iter  6


Unnamed: 0,0,1,2,3,4
0,"(和軟體, 0.9)","(GeForce GTX TITAN X的另一面, 23.0)","(全球最快的桌邊型深度學習, 7.2)","(GPU訓練, 1.5)","(數據科學家和研究人員, 2.0)"
1,"(NVIDIA全新, 0.8)","(的另一面, 1.2)","(開發的DIGITS DevBox, 4.8)","(訓練和, 0.9)","(和研究人員, 1.0)"
2,"(深度學習研究工作, 0.8)","(所有這些, 1.2)","(的DIGITS DevBox, 4.2)","(訓練深度神經網絡的, 0.9)","(了數據科學家和, 0.7)"
3,"(的深度學習研究, 0.7)","(需要普通的, 0.5)","(為訓練深度神經網絡, 2.7)","(來運行, 0.9)","(研究人員在, 0.5)"
4,"(深度學習研究的, 0.7)","(這些都, 0.3)","(的深度學習, 1.5)","(和訓練深度神經網絡, 0.9)","(上使用, 0.3)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,GeForce GTX TITAN X的另一面,23.0
3,DIGITS深度學習GPU訓練系統,22.1
4,採用TITAN X GPU,13.0
5,現已上市的GeForce GTX TITAN X,7.2
6,全球最快的桌邊型深度學習,7.2
7,使用DIGITS,4.8
8,開發的DIGITS DevBox,4.8
9,使用DIGITS DevBox,4.5




iter  7


Unnamed: 0,0,1,2,3,4
0,"(而開發的DIGITS DevBox, 5.1)","(的GeForce GTX TITAN X售價為7999, 2.7)","(的DIGITS DevBox, 4.2)","(為用戶提供, 1.0)","(AlexNet上, 2.4)"
1,"(的DIGITS DevBox, 4.2)","(7999元人民幣, 2.4)","(對在座, 0.9)","(的兩倍, 0.9)","(GPU訓練, 1.5)"
2,"(是NVIDIA, 0.7)","(訓練和, 0.9)","(直觀的, 0.3)","(和性能功耗, 0.5)","(上的時間, 1.2)"
3,"(和研究, 0.6)","(為訓練, 0.9)","(在座, 0.2)","(核心的, 0.3)","(訓練深度神經網絡的, 0.9)"
4,"(工作而開發的, 0.6)","(為7999, 0.5)","(座的, 0.2)","(比方面, 0.3)","(訓練AlexNet, 0.9)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,GeForce GTX TITAN X的另一面,23.0
3,DIGITS深度學習GPU訓練系統,22.1
4,採用TITAN X GPU,13.0
5,現已上市的GeForce GTX TITAN X,7.2
6,全球最快的桌邊型深度學習,7.2
7,而開發的DIGITS DevBox,5.1
8,使用DIGITS,4.8
9,使用DIGITS DevBox,4.5




iter  8


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)","(NVIDIA深度學習, 3.0)","(為訓練, 0.9)","(全球最快的桌邊型深度學習機器, 14.0)"
1,"(的平台, 0.9)","(的DIGITS訓練, 0.9)","(用於深度學習, 1.8)","(的事情, 0.9)","(現已上市的GeForce GTX TITAN X售價, 7.8)"
2,"(加快深度學習的, 0.7)","(的深度學習研究, 0.7)","(的深度學習, 1.5)","(自己的, 0.6)","(的DIGITS DevBox, 4.2)"
3,"(功能於一身, 0.5)","(深度學習研究的, 0.7)","(深度學習GPU, 1.4)","(教自己, 0.3)","(的桌邊型深度學習機器, 3.0)"
4,"(為了自己的, 0.5)","(的遊戲, 0.3)","(數據科學家和研究人員在, 1.1)","(費時的, 0.3)","(為7999元人民幣, 2.7)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,GeForce GTX TITAN X的另一面,23.0
3,DIGITS深度學習GPU訓練系統,22.1
4,全球最快的桌邊型深度學習機器,14.0
5,採用TITAN X GPU,13.0
6,現已上市的GeForce GTX TITAN X售價,7.8
7,而開發的DIGITS DevBox,5.1
8,使用DIGITS,4.8
9,使用DIGITS DevBox,4.5




iter  9


Unnamed: 0,0,1,2,3,4
0,"(最優的深度神經網絡, 2.7)","(的DIGITS DevBox, 4.2)","(DIGITS可在安裝, 10.0)","(多元領域, 1.2)","(DIGITS深度學習, 7.0)"
1,"(幫助用戶建立, 1.8)","(深度學習研究工作, 0.8)","(的工作好讓, 0.5)","(訓練深度神經網絡的, 0.9)","(使用DIGITS, 4.8)"
2,"(的深度學習, 1.5)","(的深度學習研究, 0.7)","(指導一處理, 0.5)","(深度學習技術是, 0.7)","(使用DIGITS DevBox, 4.5)"
3,"(GPU訓練, 1.5)","(深度學習研究的, 0.7)","(核心的, 0.3)","(的深度學習技術, 0.7)","(的DIGITS DevBox, 4.2)"
4,"(深度學習GPU, 1.4)","(了TITAN, 0.6)","(能專心, 0.3)","(領域快速, 0.4)","(NVIDIA深度學習, 3.0)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,GeForce GTX TITAN X的另一面,23.0
3,DIGITS深度學習GPU訓練系統,22.1
4,全球最快的桌邊型深度學習機器,14.0
5,採用TITAN X GPU,13.0
6,DIGITS可在安裝,10.0
7,現已上市的GeForce GTX TITAN X售價,7.8
8,而開發的DIGITS DevBox,5.1
9,使用DIGITS,4.8




iter  10


Unnamed: 0,0,1,2,3,4
0,"(DIGITS深度學習, 7.0)","(高品質深度神經網絡, 2.7)","(工作而開發的DIGITS DevBox, 5.7)","(Shadow of, 2.7)","(上使用DIGITS, 2.7)"
1,"(NVIDIA深度學習, 3.0)","(能利用這套軟體, 0.7)","(的DIGITS DevBox, 4.2)","(以30FPS, 0.6)","(訓練和, 0.9)"
2,"(在TITAN, 1.8)","(與研究人員能, 0.6)","(是NVIDIA, 0.7)","(FXAA高, 0.5)","(準備和, 0.9)"
3,"(的深度學習, 1.5)","(軟體便捷地, 0.5)","(為了自己的, 0.5)","(超高畫質, 0.4)","(為訓練, 0.9)"
4,"(的DIGITS, 1.4)",,"(了自己的, 0.4)","(的遊戲, 0.3)","(訓練數據集都, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,NVIDIA GeForce GTX TITAN X,26.0
2,GeForce GTX TITAN X的另一面,23.0
3,DIGITS深度學習GPU訓練系統,22.1
4,全球最快的桌邊型深度學習機器,14.0
5,採用TITAN X GPU,13.0
6,DIGITS可在安裝,10.0
7,現已上市的GeForce GTX TITAN X售價,7.8
8,工作而開發的DIGITS DevBox,5.7
9,使用DIGITS,4.8




iter  11


Unnamed: 0,0,1,2,3,4
0,"(研發工作而開發的DIGITS DevBox, 6.3)","(使用DIGITS DevBox, 4.5)","(現已上市的GeForce GTX TITAN X售價為7999元人民幣, 35.0)","(訪問http, 6.0)","(為了, 0.8)"
1,"(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)","(為訓練深度神經網絡而開發的最, 4.2)","(diqits即可, 2.4)","(深度學習研究工作, 0.8)"
2,"(GPU訓練, 1.5)","(訓練系統, 4.0)","(強大的處理器, 1.8)","(分類深度神經網絡的, 0.9)","(的深度學習研究, 0.7)"
3,"(而在, 0.6)","(的DIGITS訓練系統, 3.3)","(訓練深度神經網絡而開發的, 1.2)","(圖像分類, 0.4)","(深度學習研究的, 0.7)"
4,"(自己的研發, 0.5)","(的深度學習, 1.5)","(而開發的最強大的處理, 1.0)",,"(讓它, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,全球最快的桌邊型深度學習機器,14.0
6,採用TITAN X GPU,13.0
7,DIGITS可在安裝,10.0
8,研發工作而開發的DIGITS DevBox,6.3
9,訪問http,6.0




iter  12


Unnamed: 0,0,1,2,3,4
0,"(NVIDIA聯合, 2.4)","(使用DIGITS DevBox, 4.5)","(訓練和驗證, 1.5)","(費時的事情, 1.5)","(直觀易用的DIGITS訓練系統, 4.5)"
1,"(總裁兼執行長, 1.8)","(的DIGITS DevBox, 4.2)","(圖像分類深度神經網絡的, 1.1)","(訓練電腦, 0.4)","(的DIGITS DevBox, 4.2)"
2,"(的DIGITS, 1.4)","(上的時間, 1.2)","(驗證圖像分類, 0.6)",,"(全球最快, 2.4)"
3,"(對在座的, 1.2)","(訓練和, 0.9)","(的工作, 0.6)",,"(深度學習工具, 1.8)"
4,"(推動深度學習的, 0.7)","(訓練深度神經網絡的, 0.9)","(為了自己的, 0.5)",,"(的深度學習, 1.5)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,全球最快的桌邊型深度學習機器,14.0
6,採用TITAN X GPU,13.0
7,DIGITS可在安裝,10.0
8,研發工作而開發的DIGITS DevBox,6.3
9,訪問http,6.0




iter  13


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)","(深度學習研究的速度, 2.7)","(使用深度神經網絡來, 2.7)","(用於深度學習, 1.8)"
1,"(桌邊型深度學習工具, 2.7)","(多項功能於一身, 0.7)","(為了解決, 1.2)","(又費時的事情, 1.8)","(的深度學習, 1.5)"
2,"(適合用於深度學習, 2.4)","(功能於一身的, 0.6)","(的速度, 0.9)","(識別物體, 1.2)","(深度學習GPU, 1.4)"
3,"(的DIGITS, 1.4)","(而在, 0.6)","(的深度學習研究, 0.7)","(是一件, 0.9)","(數據科學家和研究人員在, 1.1)"
4,"(的桌邊型, 0.8)","(為了自己的, 0.5)","(深度學習研究的, 0.7)","(教自己如何, 0.5)","(深度學習的, 1.0)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,全球最快的桌邊型深度學習機器,14.0
6,採用TITAN X GPU,13.0
7,DIGITS可在安裝,10.0
8,研發工作而開發的DIGITS DevBox,6.3
9,訪問http,6.0




iter  14


Unnamed: 0,0,1,2,3,4
0,"(最佳化調試, 1.5)","(用戶建立最優的深度神經網絡, 3.9)","(的深度學習, 1.5)","(使用DIGITS DevBox, 4.5)","(的DIGITS DevBox, 4.2)"
1,"(可為最, 0.9)","(上述的局面, 1.5)","(的新技術, 1.2)","(的DIGITS DevBox, 4.2)","(深度神經網絡的便捷, 0.9)"
2,"(的深度學習研究, 0.7)","(是在網絡, 0.4)","(數據科學家和研究人員在, 1.1)","(而使用, 0.9)","(的GPU, 0.4)"
3,"(進行了最佳化, 0.6)","(網絡上, 0.3)","(深度學習的, 1.0)","(是NVIDIA, 0.7)","(在GPU, 0.4)"
4,"(的TITAN, 0.6)",,"(GPU加速深度學習, 0.9)","(而在, 0.6)","(的工作好, 0.4)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,全球最快的桌邊型深度學習機器,14.0
6,採用TITAN X GPU,13.0
7,DIGITS可在安裝,10.0
8,研發工作而開發的DIGITS DevBox,6.3
9,訪問http,6.0




iter  15


Unnamed: 0,0,1,2,3,4
0,"(單精度峰值, 1.5)","(的DIGITS DevBox, 4.2)","(使用DIGITS, 4.8)","(的DIGITS DevBox, 4.2)","(幫助用戶建立最優的深度神經網絡, 15.0)"
1,"(板載的, 0.3)","(的桌邊型深度學習工具, 3.0)","(的DIGITS, 1.4)","(多項功能於一身的, 0.8)","(改變上述的局面, 7.0)"
2,"(核心的, 0.3)","(一件繁重又費時的事情, 3.0)","(數據科學家和研究人員在, 1.1)","(深度學習的研究, 0.7)","(的深度學習, 1.5)"
3,,"(如何分類和識別物體, 2.7)","(了數據科學家和研究人員, 1.1)","(了TITAN, 0.6)","(深度學習GPU, 1.4)"
4,,"(自己如何分類和, 0.7)","(為了, 0.8)","(的TITAN, 0.6)","(訓練系統軟體自始至終都, 1.1)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,幫助用戶建立最優的深度神經網絡,15.0
6,全球最快的桌邊型深度學習機器,14.0
7,採用TITAN X GPU,13.0
8,DIGITS可在安裝,10.0
9,改變上述的局面,7.0




iter  16


Unnamed: 0,0,1,2,3,4
0,"(GPU架構的TITAN X, 3.9)","(的深度學習技術是一項, 1.0)","(為訓練深度神經網絡而開發的最強大的處理器, 20.0)","(的DIGITS DevBox, 4.2)","(用於深度學習, 1.8)"
1,"(在性能和性能功耗, 2.4)","(的計算, 0.3)","(的DIGITS DevBox, 4.2)","(DevBox的每個, 2.7)","(的深度學習, 1.5)"
2,"(處理核心, 1.2)","(可在, 0.2)","(的數據, 0.9)","(採用TITAN, 2.1)","(了數據科學家和研究人員, 1.1)"
3,"(和性能功耗比方面, 0.8)",,"(需數據, 0.9)","(的深度學習研究, 0.7)","(深度學習的, 1.0)"
4,"(GPU架構的, 0.6)",,"(的遊戲, 0.3)","(了TITAN, 0.6)","(GPU加速深度學習, 0.9)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,幫助用戶建立最優的深度神經網絡,15.0
7,全球最快的桌邊型深度學習機器,14.0
8,採用TITAN X GPU,13.0
9,DIGITS可在安裝,10.0




iter  17


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS DevBox, 4.2)","(在網絡上, 0.4)","(的DIGITS DevBox, 4.2)","(的多元領域, 1.5)","(DIGITS深度學習, 7.0)"
1,"(全球最快, 2.4)","(的遊戲, 0.3)","(的工作, 0.6)","(在人工智慧, 1.5)","(使用DIGITS, 4.8)"
2,"(旗艦級遊戲顯卡, 2.1)",,"(為了自己的, 0.5)","(汽車的多元, 0.5)","(NVIDIA深度學習, 3.0)"
3,"(推出的旗艦級遊戲, 0.8)",,"(工作而, 0.3)","(醫藥研究到, 0.5)","(的深度學習, 1.5)"
4,"(最快的, 0.6)",,"(功能的, 0.3)","(一項創新, 0.4)","(的DIGITS, 1.4)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,幫助用戶建立最優的深度神經網絡,15.0
7,全球最快的桌邊型深度學習機器,14.0
8,採用TITAN X GPU,13.0
9,DIGITS可在安裝,10.0




iter  18


Unnamed: 0,0,1,2,3,4
0,"(使用120, 1.5)","(使用DIGITS DevBox, 4.5)","(和訓練深度神經網絡過程中, 1.2)","(的GeForce, 1.6)","(功耗比方面皆是, 0.7)"
1,"(ImageNet圖像, 1.0)","(的DIGITS DevBox, 4.2)","(為用戶提供指導一處理, 1.0)","(是以30FPS, 0.7)","(汽車的, 0.3)"
2,"(而使用, 0.9)","(在TITAN, 1.8)","(結果上, 0.9)","(設定值的, 0.4)","(是在, 0.2)"
3,"(的帶寬, 0.9)","(的深度學習, 1.5)","(過程中為用戶提供, 0.8)","(的遊戲, 0.3)",
4,"(圖像數據集, 0.5)","(深度學習GPU, 1.4)","(的工作好讓科學家, 0.8)","(的瑰麗, 0.3)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,幫助用戶建立最優的深度神經網絡,15.0
7,全球最快的桌邊型深度學習機器,14.0
8,採用TITAN X GPU,13.0
9,DIGITS可在安裝,10.0




iter  19


Unnamed: 0,0,1,2,3,4
0,"(組件都進行了最佳化, 0.9)","(訓練和驗證圖像, 2.1)","(Maxwell GPU架構的TITAN X, 6.3)","(數據科學家和研究人員在, 1.1)","(的DIGITS, 1.4)"
1,"(的深度學習研究, 0.7)","(的深度學習, 1.5)","(12GB顯存, 1.8)","(的工作, 0.6)","(通往最佳, 1.2)"
2,"(了TITAN, 0.6)","(深度學習GPU, 1.4)","(和性能功耗比方面皆, 0.9)","(的GPU加速, 0.6)","(最佳深度神經網絡的便捷, 1.1)"
3,"(研究工作, 0.4)","(深度學習的, 1.0)","(的12GB, 0.5)","(便捷地開發, 0.5)","(深度神經網絡的便捷之, 1.0)"
4,"(工作提供, 0.4)","(在GPU, 0.4)","(產品的, 0.3)","(與研究人員, 0.5)","(深度神經網絡的便捷, 0.9)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,幫助用戶建立最優的深度神經網絡,15.0
7,全球最快的桌邊型深度學習機器,14.0
8,採用TITAN X GPU,13.0
9,DIGITS可在安裝,10.0




iter  20


Unnamed: 0,0,1,2,3,4
0,"(配置和訓練深度神經網絡過程中, 4.2)","(DIGITS可, 2.1)","(數據科學家與研究人員能, 3.3)","(在TITAN, 1.8)","(搭配直觀易用的DIGITS訓練系統, 17.0)"
1,"(和訓練深度神經網絡過程中為用戶提供, 1.7)","(汽車的多元領域, 2.1)","(的旗艦級遊戲顯卡, 2.4)","(GPU訓練, 1.5)","(的DIGITS DevBox, 4.2)"
2,"(指導一處理複雜的工作好讓科學家, 1.5)","(的計算引擎, 1.5)","(NVIDIA全新推出的旗艦級遊戲, 1.6)","(訓練深度神經網絡的, 0.9)","(最快的桌邊型深度學習工具, 3.6)"
3,"(過程中為用戶提供指導一處理複雜, 1.5)","(的DIGITS, 1.4)","(NVIDIA全新推出, 1.0)","(了TITAN, 0.6)","(全球最快, 2.4)"
4,"(為用戶提供指導一處理複雜, 1.2)","(一項創新的計算, 0.7)","(是NVIDIA全新, 0.9)","(的TITAN, 0.6)","(專為相關任務而, 2.1)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  21


Unnamed: 0,0,1,2,3,4
0,"(訓練系統軟體自始至終都將為, 1.3)","(在TITAN, 1.8)","(GPU訓練, 1.5)","(下載DIGITS深度學習GPU訓練系統, 5.7)","(的深度學習, 1.5)"
1,"(所需數據, 1.2)","(為藍本, 0.9)","(訓練和, 0.9)","(diqits即可下載, 3.0)","(只需要普通, 1.5)"
2,"(用戶提供, 0.8)","(段名為, 0.9)","(處理用於訓練, 0.6)","(驗證圖像分類深度神經網絡的, 1.3)","(深度學習的, 1.0)"
3,"(將為用戶, 0.4)","(是NVIDIA, 0.7)","(能處理用於, 0.5)","(這是首套, 1.2)","(開發的, 0.6)"
4,"(提供所, 0.3)","(的TITAN, 0.6)","(和訓練, 0.3)","(用戶提供, 0.8)","(而在, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  22


Unnamed: 0,0,1,2,3,4
0,"(配置和訓練深度神經網絡過程中為, 4.5)","(領域快速成長的深度學習, 1.1)","(是一件繁重又費時的事情, 11.0)","(在TITAN, 1.8)","(使用DIGITS DevBox, 4.5)"
1,"(和訓練深度神經網絡過程中為用戶提供指導一處理複雜的工作好讓科學家, 3.2)","(開發的, 0.6)","(使用深度神經網絡來訓練電腦, 3.9)","(功耗比方面皆是前代, 0.9)","(的DIGITS DevBox, 4.2)"
2,"(在研究活動和結果上, 2.7)","(在從先進, 0.4)","(訓練電腦教自己如何, 0.9)","(了TITAN, 0.6)","(推出的旗艦級遊戲顯卡, 3.0)"
3,"(指導一處理複雜的工作好讓科學家能專心, 1.8)","(在開發, 0.3)","(教自己如何分類和, 0.8)","(的TITAN, 0.6)","(但也特別適合, 1.8)"
4,"(提供指導一處理複雜的工作好讓科學家, 1.7)","(能的, 0.2)","(自己的, 0.6)","(在GPU, 0.4)","(是NVIDIA全新推出, 1.1)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  23


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS, 1.4)","(使用DIGITS DevBox, 4.5)","(訓練和驗證圖像分類, 2.7)","(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)"
1,"(是一項創新的, 0.6)","(的DIGITS DevBox, 4.2)","(這是首套用於, 1.8)","(和訓練深度神經網絡過程中為用戶提供指導一處理複雜的工作好讓科學家能專心在研究活動, 4.0)","(的深度學習, 1.5)"
2,"(的工作, 0.6)","(的深度學習, 1.5)","(用於設計, 1.2)","(提供所需數據, 1.8)","(深度學習的, 1.0)"
3,"(的GPU, 0.4)","(於深度學習, 1.5)","(深度神經網絡的多合一, 1.0)","(用戶提供, 0.8)","(四千名與會嘉賓, 0.7)"
4,"(領域快速, 0.4)","(深度學習GPU, 1.4)","(分類深度神經網絡的, 0.9)","(將為用戶提供所, 0.7)","(推動深度學習, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  24


Unnamed: 0,0,1,2,3,4
0,"(全新推出的旗艦級遊戲顯卡, 3.6)","(在性能和性能功耗比, 2.7)","(它以電影, 4.0)","(的深度學習, 1.5)","(的DIGITS DevBox, 4.2)"
1,"(特別適合用於深度學習, 3.0)","(的12GB顯存, 2.1)","(虛擬現實體驗, 1.8)","(數據科學家和研究人員在, 1.1)","(用戶提供, 0.8)"
2,"(NVIDIA全新, 0.8)","(產品的兩倍, 1.5)","(巨龍為藍本, 1.5)","(了數據科學家和研究人員, 1.1)","(開發的, 0.6)"
3,"(了全新, 0.3)","(功耗比方面皆是前代產品, 1.1)","(在舊金山, 1.2)","(深度學習的, 1.0)","(的TITAN, 0.6)"
4,,"(產品的, 0.3)","(精彩的, 0.9)","(GPU加速深度學習, 0.9)","(的工作, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  25


Unnamed: 0,0,1,2,3,4
0,"(DIGITS深度學習, 7.0)","(的DIGITS DevBox, 4.2)","(為了解決當今世界, 2.4)","(在TITAN, 1.8)","(只需要普通的, 1.8)"
1,"(的DIGITS DevBox, 4.2)","(數據科學家與研究人員能利用, 3.9)","(了全新的硬體和, 0.7)","(了TITAN, 0.6)","(所有這些都, 1.5)"
2,"(專心在研究活動和結果上, 3.3)","(出高品質深度神經網絡, 3.0)","(全新的硬體和, 0.6)","(的TITAN, 0.6)","(優美的, 0.3)"
3,"(NVIDIA深度學習, 3.0)","(軟體便捷地開發, 0.7)","(了全新的硬體, 0.6)","(的工作, 0.6)","(集結在, 0.3)"
4,"(的深度學習, 1.5)","(這套軟體便捷地, 0.7)","(推出了全新的, 0.6)","(工作提供, 0.4)","(都集結, 0.3)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,採用TITAN X GPU,13.0




iter  26


Unnamed: 0,0,1,2,3,4
0,"(全球最快的桌邊型深度學習工具, 14.0)","(NVIDIA深度學習, 3.0)","(使用深度神經網絡來訓練電腦教自己如何分類和, 6.3)","(總裁兼執行長黃仁勛, 2.7)","(的DIGITS DevBox, 4.2)"
1,"(專為相關任務而打造, 9.0)","(的深度學習, 1.5)","(通往最佳深度神經網絡的便捷之, 4.2)","(深度學習的新技術, 2.4)","(而在, 0.6)"
2,"(的DIGITS DevBox, 4.2)","(數據科學家和研究人員在, 1.1)","(使用深度神經網絡來訓練電腦教, 4.2)","(的深度學習, 1.5)","(的GPU, 0.4)"
3,"(的遊戲, 0.3)","(了數據科學家和研究人員, 1.1)","(最佳深度神經網絡的便捷之路, 3.9)","(深度學習的, 1.0)","(在GPU, 0.4)"
4,,"(深度學習的, 1.0)","(通往最佳深度神經網絡的, 3.3)","(三項將推動深度學習, 0.9)","(功能的, 0.3)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,全球最快的桌邊型深度學習機器,14.0
9,全球最快的桌邊型深度學習工具,14.0




iter  27


Unnamed: 0,0,1,2,3,4
0,"(NVIDIA深度學習, 3.0)","(只需要普通的電源插座, 10.0)","(板載的12GB顯存, 2.7)","(在網絡上使用DIGITS, 3.6)","(通往最佳深度神經網絡的便捷之路, 15.0)"
1,"(一Caffe, 1.8)","(的DIGITS DevBox, 4.2)","(單精度峰值性, 1.8)","(得益於其, 1.2)","(NVIDIA全新推出的旗艦級遊戲顯卡, 5.4)"
2,"(的深度學習, 1.5)","(所有這些都集結在, 2.4)","(加上板載的, 1.5)","(的工作, 0.6)","(也特別適合用於深度學習, 3.3)"
3,"(了數據科學家和研究人員, 1.1)","(的電源插座, 1.5)","(加上板載, 1.2)","(研究工作, 0.4)","(的DIGITS, 1.4)"
4,"(深度學習的, 1.0)","(桌下即可, 1.2)","(是前代, 0.3)","(和強大的, 0.4)","(是NVIDIA全新推出的, 1.2)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,通往最佳深度神經網絡的便捷之路,15.0
9,全球最快的桌邊型深度學習機器,14.0




iter  28


Unnamed: 0,0,1,2,3,4
0,"(的深度學習, 1.5)","(配置和訓練深度神經網絡過程中為用戶, 5.1)","(的DIGITS DevBox, 4.2)","(但也特別適合用於深度學習, 12.0)","(準備和加載, 1.5)"
1,"(數據科學家和研究人員在, 1.1)","(的DIGITS DevBox, 4.2)","(能夠加快深度學習的, 2.7)","(使用深度神經網絡來訓練電腦教自己如何分類和識別, 6.9)","(訓練數據集都相當, 0.8)"
2,"(了數據科學家和研究人員, 1.1)","(能專心在研究活動和結果上, 3.6)","(加快深度學習的研究, 0.9)","(識別物體, 1.2)","(加載訓練數據集都, 0.8)"
3,"(深度學習的, 1.0)","(用戶提供, 0.8)","(開發的, 0.6)",,"(工作流程, 0.4)"
4,"(GPU加速深度學習, 0.9)","(的工作, 0.6)","(而在, 0.6)",,


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,通往最佳深度神經網絡的便捷之路,15.0
9,全球最快的桌邊型深度學習機器,14.0




iter  29


Unnamed: 0,0,1,2,3,4
0,"(的桌下即可, 1.5)","(研究人, 0.9)","(對在座的四千名, 2.1)","(訓練數據集都相當簡單, 3.0)","(數據科學家與研究人員能利用這套軟體便捷地, 6.0)"
1,"(硬體和軟體, 1.5)","(它採用, 0.9)","(GPU技術大會的開幕, 1.0)","(得益於其直觀, 1.8)","(軟體便捷地開發出高品質深度神經網絡, 5.1)"
2,"(的硬體, 0.3)","(的深度學習研究, 0.7)","(用戶提供, 0.8)","(在本地系統, 0.5)","(的DIGITS DevBox, 4.2)"
3,"(地提高, 0.3)","(和研究, 0.6)","(在GPU技術, 0.6)",,"(開發出高品質深度神經網絡, 3.6)"
4,"(硬體和, 0.3)","(研究工作, 0.4)","(的四千名, 0.4)",,"(的深度學習, 1.5)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,通往最佳深度神經網絡的便捷之路,15.0
9,全球最快的桌邊型深度學習機器,14.0




iter  30


Unnamed: 0,0,1,2,3,4
0,"(成長的深度學習技術是一項, 1.2)","(NVIDIA聯合創始人, 11.0)","(訓練和驗證圖像分類深度神經網絡的多合一, 5.7)","(配置和訓練深度神經網絡過程中為用戶提供, 5.7)","(的DIGITS DevBox, 4.2)"
1,"(應用在從先進醫藥研究到, 1.1)","(推動深度學習的新技術, 3.0)","(深度神經網絡的多合一圖形系統, 4.2)","(的DIGITS DevBox, 4.2)","(和研究, 0.6)"
2,"(先進醫藥研究到全自動, 1.0)","(GPU技術大會的開幕主題演講, 1.4)","(的深度學習, 1.5)","(的DIGITS, 1.4)","(開發的, 0.6)"
3,"(成長的深度學習, 0.7)","(在GPU技術大會的開幕, 1.1)","(深度學習的, 1.0)","(用戶提供, 0.8)","(而開發, 0.6)"
4,,"(將推動深度學習的, 0.8)","(的遊戲, 0.3)","(的工作, 0.6)","(的工作, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,DIGITS深度學習GPU訓練系統,22.1
5,為訓練深度神經網絡而開發的最強大的處理器,20.0
6,搭配直觀易用的DIGITS訓練系統,17.0
7,幫助用戶建立最優的深度神經網絡,15.0
8,通往最佳深度神經網絡的便捷之路,15.0
9,全球最快的桌邊型深度學習機器,14.0




iter  31


Unnamed: 0,0,1,2,3,4
0,"(GPU技術大會的開幕主題演講活動上, 5.1)","(訓練和驗證圖像分類深度神經網絡的多合一圖形系統, 23.0)","(DIGITS深度學習, 7.0)","(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)"
1,"(總裁兼執行長黃仁勛先生, 3.3)","(這是首套用於設計, 8.0)","(使用DIGITS, 4.8)","(FXAA高設定值的, 0.9)","(所有這些都集結在這個, 3.0)"
2,"(對在座的四千名與會, 2.7)",,"(使用DIGITS DevBox, 4.5)","(開啟FXAA高, 0.7)","(運行流暢, 1.2)"
3,"(在GPU技術大會的開幕主題演講, 1.5)",,"(NVIDIA深度學習, 3.0)","(AAA遊戲, 0.5)","(而在, 0.6)"
4,"(先生在GPU技術大會的開幕, 1.3)",,"(使用深度神經網絡, 2.4)","(的遊戲, 0.3)","(的工作, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
5,DIGITS深度學習GPU訓練系統,22.1
6,為訓練深度神經網絡而開發的最強大的處理器,20.0
7,搭配直觀易用的DIGITS訓練系統,17.0
8,幫助用戶建立最優的深度神經網絡,15.0
9,通往最佳深度神經網絡的便捷之路,15.0




iter  32


Unnamed: 0,0,1,2,3,4
0,"(推出了全新的硬體和軟體, 3.3)","(的DIGITS DevBox, 4.2)","(配置和訓練深度神經網絡過程中為用戶提供指導, 6.3)","(版本Caffe, 2.1)","(了最佳化調試, 1.8)"
1,"(為了解決當今世界最, 2.7)","(的深度神經網絡, 2.8)","(科學家能專心在研究活動和結果上, 4.5)","(功能的系統, 1.5)","(在TITAN, 1.8)"
2,"(NVIDIA剛剛, 2.4)","(深度神經網絡的, 2.1)","(的DIGITS DevBox, 4.2)","(用戶可以, 1.2)","(的深度學習研究, 0.7)"
3,"(挑戰之一, 1.2)","(一身的平台, 1.5)","(的工作, 0.6)","(數據科學家和研究人員在, 1.1)","(了TITAN, 0.6)"
4,"(和功用, 0.9)","(的DIGITS, 1.4)","(的處理, 0.6)","(可以在, 0.9)","(高效率的性能, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,GeForce GTX TITAN X的另一面,23.0
4,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
5,DIGITS深度學習GPU訓練系統,22.1
6,為訓練深度神經網絡而開發的最強大的處理器,20.0
7,搭配直觀易用的DIGITS訓練系統,17.0
8,幫助用戶建立最優的深度神經網絡,15.0
9,通往最佳深度神經網絡的便捷之路,15.0




iter  33


Unnamed: 0,0,1,2,3,4
0,"(在性能和性能功耗比方面, 3.3)","(在您, 0.2)","(的深度學習研究工作提供高效率的性能, 1.7)","(的研發工作而開發的DIGITS DevBox, 6.6)","(使用深度神經網絡來訓練電腦教自己如何分類和識別物體, 25.0)"
1,"(3072個處理核心, 2.7)",,"(嚴苛的深度學習研究工作提供, 1.3)","(的DIGITS DevBox, 4.2)","(能處理用於訓練深度神經網絡的, 1.4)"
2,"(單精度峰值性能為, 2.4)",,"(嚴苛的深度學習, 0.7)","(於一身的平台, 1.8)",
3,"(結合3072個, 2.1)",,,"(的DIGITS, 1.4)",
4,"(和性能功耗比方面皆是, 1.0)",,,"(集多項功能於一身的, 0.9)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,GeForce GTX TITAN X的另一面,23.0
5,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
6,DIGITS深度學習GPU訓練系統,22.1
7,為訓練深度神經網絡而開發的最強大的處理器,20.0
8,搭配直觀易用的DIGITS訓練系統,17.0
9,幫助用戶建立最優的深度神經網絡,15.0




iter  34


Unnamed: 0,0,1,2,3,4
0,"(加上板載的12GB顯存, 11.0)","(的深度學習, 1.5)","(準備和加載訓練數據集都相當簡單, 15.0)","(在GPU技術大會的開幕主題演講活動上, 5.4)","(暗影神偷, 4.0)"
1,"(結合3072個處理核心, 11.0)","(深度學習的, 1.0)","(不論是在本地系統, 2.4)","(的DIGITS DevBox, 4.2)","(里的史, 0.9)"
2,"(單精度峰值性能為7, 2.7)",,"(得益於其直觀的, 2.1)","(總裁兼執行長黃仁勛先生在, 3.6)","(的遊戲開發者, 0.6)"
3,"(皆是, 0.2)",,"(介面和強大的, 0.6)","(對在座的四千名與會嘉賓, 3.3)","(開發者大會, 0.5)"
4,,,,"(與會嘉賓展示三項將推動深度學習的, 1.6)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,GeForce GTX TITAN X的另一面,23.0
5,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
6,DIGITS深度學習GPU訓練系統,22.1
7,為訓練深度神經網絡而開發的最強大的處理器,20.0
8,搭配直觀易用的DIGITS訓練系統,17.0
9,幫助用戶建立最優的深度神經網絡,15.0




iter  35


Unnamed: 0,0,1,2,3,4
0,"(進行了最佳化調試, 2.4)","(在人工智慧領域快速成長的深度學習, 4.8)","(使用DIGITS DevBox, 4.5)","(40幀, 0.9)","(所有這些都集結在這個高, 3.3)"
1,"(嚴苛的深度學習研究工作提供高效率的性能, 1.9)","(駕駛汽車的多元領域, 2.7)","(的DIGITS DevBox, 4.2)",,"(的軟體包中, 1.5)"
2,"(從內存, 0.9)","(創新的計算引擎, 2.1)","(加快深度學習的研究活動, 3.3)",,"(高能效, 0.9)"
3,"(到I, 0.6)","(在人工智慧領域, 2.1)","(的深度學習, 1.5)",,"(外形優美的, 0.5)"
4,"(內存到, 0.3)","(成長的深度學習技術是一項創新, 1.4)","(深度學習GPU, 1.4)",,"(優美的軟體, 0.5)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,GeForce GTX TITAN X的另一面,23.0
5,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
6,DIGITS深度學習GPU訓練系統,22.1
7,為訓練深度神經網絡而開發的最強大的處理器,20.0
8,搭配直觀易用的DIGITS訓練系統,17.0
9,幫助用戶建立最優的深度神經網絡,15.0




iter  36


Unnamed: 0,0,1,2,3,4
0,"(NVIDIA剛剛推出了全新的硬體和軟體, 19.0)","(快速成長的深度學習技術是一項創新的計算引擎, 6.3)","(的DIGITS DevBox, 4.2)","(TITAN X, 10.5)","(得益於其直觀的用戶, 2.7)"
1,"(易用性和功用, 6.0)","(在人工智慧領域快速成長的深度學習技術, 5.4)","(的深度學習, 1.5)","(的DIGITS DevBox, 4.2)","(用戶提供所需數據, 2.4)"
2,"(將推動深度學習的新技術, 3.3)","(可應用在從先進醫藥研究到, 3.6)","(運行流暢且, 1.5)","(DevBox的每個組件, 3.3)","(訓練系統軟體自始至終都將為用戶, 1.5)"
3,"(總裁兼執行長, 1.8)","(全自動駕駛汽車的多元領域, 3.6)","(低調安置, 1.2)","(X GPU, 3.0)","(的用戶介面和強大的, 0.9)"
4,"(黃仁勛先生在GPU技術大會的開幕, 1.6)","(一項創新的計算引擎, 2.7)","(深度學習的, 1.0)","(X TITAN, 2.1)","(用戶介面和強大的, 0.8)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,GeForce GTX TITAN X的另一面,23.0
5,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
6,DIGITS深度學習GPU訓練系統,22.1
7,為訓練深度神經網絡而開發的最強大的處理器,20.0
8,NVIDIA剛剛推出了全新的硬體和軟體,19.0
9,搭配直觀易用的DIGITS訓練系統,17.0




iter  37


Unnamed: 0,0,1,2,3,4
0,"(的深度學習, 1.5)","(嚴苛的深度學習研究工作提供高效率的性能表現, 6.3)","(NVIDIA深度學習工程團隊, 4.2)","(讓科學家能專心在研究活動和結果上, 4.8)","(三項將推動深度學習的新技術, 3.9)"
1,"(數據科學家和研究人員在, 1.1)",,"(的DIGITS DevBox, 4.2)","(訓練系統, 4.0)","(對在座的四千名與會嘉賓展示, 3.9)"
2,"(了數據科學家和研究人員, 1.1)",,"(安置在您的桌下即可, 2.7)","(的系統, 0.9)","(地提高深度學習研究的速度, 3.6)"
3,"(深度學習的, 1.0)",,"(開發的, 0.6)","(軟體自始至終, 0.6)","(展示三項, 0.4)"
4,"(GPU加速深度學習, 0.9)",,"(工程團隊為了, 0.6)","(的工作, 0.6)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,GeForce GTX TITAN X的另一面,23.0
5,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
6,DIGITS深度學習GPU訓練系統,22.1
7,為訓練深度神經網絡而開發的最強大的處理器,20.0
8,NVIDIA剛剛推出了全新的硬體和軟體,19.0
9,搭配直觀易用的DIGITS訓練系統,17.0




iter  38


Unnamed: 0,0,1,2,3,4
0,"(訓練系統, 4.0)","(能夠加快深度學習的研究活動, 13.0)","(可為最嚴苛的深度學習研究工作提供高效率的性能表現, 24.0)","(了TITAN X的身影, 3.3)","(前所未有地提高深度學習研究的速度, 4.8)"
1,"(將為用戶提供所需數據, 3.0)","(NVIDIA深度學習工程團隊為了, 4.8)","(TITAN X, 10.5)","(矛戈巨龍為藍本, 2.1)","(的深度神經網絡, 2.8)"
2,"(都將為用戶提供所, 0.8)","(的DIGITS DevBox, 4.2)","(從內存到I, 5.0)","(了一段名為, 1.5)","(尖端的技術挑戰之一, 2.7)"
3,"(軟體自始至終, 0.6)","(是一套集多項功能於一身的, 3.6)","(DevBox的每個組件都, 3.6)","(里的史矛戈, 1.5)","(高品質深度神經網絡, 2.7)"
4,"(自始至終都, 0.5)","(功能於一身的平台, 2.4)","(X GPU, 3.0)","(先睹為快了TITAN X的, 1.3)","(深度神經網絡的, 2.1)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
5,GeForce GTX TITAN X的另一面,23.0
6,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
7,DIGITS深度學習GPU訓練系統,22.1
8,為訓練深度神經網絡而開發的最強大的處理器,20.0
9,NVIDIA剛剛推出了全新的硬體和軟體,19.0




iter  39


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS DevBox, 4.2)","(DevBox的每個組件都進行了最佳化調試, 20.0)","(低調安置在您的桌下即可, 11.0)","(的深度學習, 1.5)","(播放了一段名為, 7.0)"
1,"(管理能力, 1.2)","(TITAN X, 10.5)","(運行流暢且外形優美的軟體, 3.6)","(深度學習的, 1.0)","(的DIGITS DevBox, 4.2)"
2,"(強大的, 0.9)","(的DIGITS DevBox, 4.2)","(運行流暢且外形, 2.1)","(的GPU加速深度學習, 1.0)","(的虛擬現實體驗, 2.1)"
3,"(工作流程管理, 0.6)","(X GPU, 3.0)","(優美的軟體包中, 2.1)","(GPU加速深度學習, 0.9)","(各位先睹為快, 0.6)"
4,"(的工作流程, 0.5)","(X TITAN, 2.1)","(外形優美, 0.4)","(深度學習架構, 0.6)","(里的, 0.6)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
5,GeForce GTX TITAN X的另一面,23.0
6,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
7,DIGITS深度學習GPU訓練系統,22.1
8,為訓練深度神經網絡而開發的最強大的處理器,20.0
9,DevBox的每個組件都進行了最佳化調試,20.0




iter  40


Unnamed: 0,0,1,2,3,4
0,"(為了解決當今世界最尖端的技術挑戰之一, 18.0)","(訓練系統, 4.0)","(前代產品的兩倍, 2.1)","(配置和訓練深度神經網絡過程中為用戶提供指導一, 6.6)","(各位先睹為快了TITAN X的身影, 5.1)"
1,"(TITAN X, 10.5)","(都將為用戶提供所需數據, 3.3)","(和性能功耗比方面皆是前代, 1.2)","(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)"
2,"(它採用四個TITAN, 3.0)","(自始至終都將為用戶提供所, 1.2)","(是前代, 0.3)","(在人工智慧, 1.5)","(史矛戈巨龍為藍本, 2.4)"
3,"(X GPU, 3.0)","(和軟體, 0.9)",,"(的處理, 0.6)","(的DIGITS, 1.4)"
4,"(X TITAN, 2.1)","(訓練和, 0.9)",,"(在GPU, 0.4)","(上讓各位先睹為快, 0.8)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
4,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
5,GeForce GTX TITAN X的另一面,23.0
6,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
7,DIGITS深度學習GPU訓練系統,22.1
8,為訓練深度神經網絡而開發的最強大的處理器,20.0
9,DevBox的每個組件都進行了最佳化調試,20.0




iter  41


Unnamed: 0,0,1,2,3,4
0,"(的DIGITS DevBox, 4.2)",,"(對在座的四千名與會嘉賓展示三項將推動深度學習的新技術, 26.0)","(是一套集多項功能於一身的平台, 14.0)","(所有這些都集結在這個高能效, 13.0)"
1,"(的DIGITS, 1.4)",,"(先生在GPU技術大會的開幕主題演講活動上, 6.0)","(NVIDIA深度學習工程團隊為了自己的研發工作而開發, 7.8)","(在GPU, 0.4)"
2,"(功耗比方面皆是前代產品的, 1.2)",,"(總裁兼執行長, 1.8)","(的DIGITS DevBox, 4.2)",
3,"(DIGITS軟體, 0.8)",,"(執行長黃仁勛, 0.6)","(自己的研發工作而開發的, 1.1)",
4,"(DIGITS訓練, 0.8)",,"(黃仁勛先生, 0.5)","(的平台, 0.9)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,GeForce GTX TITAN X的另一面,23.0
7,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
8,DIGITS深度學習GPU訓練系統,22.1
9,為訓練深度神經網絡而開發的最強大的處理器,20.0




iter  42


Unnamed: 0,0,1,2,3,4
0,"(好讓科學家能專心在研究活動和結果上, 5.1)","(黃仁勛先生在GPU技術大會的開幕主題演講活動上, 6.9)","(在性能和性能功耗比方面皆, 3.6)","(NVIDIA深度學習工程團隊為了自己的研發工作而開發的, 8.1)","(使用DIGITS DevBox, 4.5)"
1,"(的DIGITS DevBox, 4.2)","(執行長黃仁勛先生在GPU技術大會的開幕, 1.9)","(是前代產品的兩倍, 2.4)","(自己的研發工作而開發的DIGITS DevBox, 7.2)","(的DIGITS DevBox, 4.2)"
2,"(的處理, 0.6)","(總裁兼執行長, 1.8)","(皆是, 0.2)","(的DIGITS DevBox, 4.2)","(訓練系統, 4.0)"
3,"(處理複雜, 0.4)","(的深度學習, 1.5)",,"(自己的研發工作而開發的DIGITS, 1.7)","(數據科學家和研究人員在, 1.1)"
4,"(的GPU, 0.4)","(深度學習的, 1.0)",,"(的DIGITS, 1.4)","(的系統, 0.9)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,GeForce GTX TITAN X的另一面,23.0
7,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
8,DIGITS深度學習GPU訓練系統,22.1
9,為訓練深度神經網絡而開發的最強大的處理器,20.0




iter  43


Unnamed: 0,0,1,2,3,4
0,"(運行流暢且外形優美的軟體包中, 14.0)","(的DIGITS DevBox, 4.2)","(數據科學家與研究人員能利用這套軟體便捷地開發, 6.6)","(自始至終都將為用戶提供所需數據, 4.5)","(在性能和性能功耗比方面皆是前代產品的兩倍, 20.0)"
1,,"(得益於其直觀的用戶介面, 3.3)","(X GPU, 3.0)","(的DIGITS DevBox, 4.2)",
2,,"(的用戶介面和強大的工作流程管理, 1.5)","(高品質深度神經網絡, 2.7)","(訓練系統, 4.0)",
3,,"(強大的, 0.9)","(這套軟體便捷地開發出高品質, 1.3)","(的深度學習, 1.5)",
4,,"(的工作流程管理, 0.7)","(出高品質, 0.4)","(GPU訓練, 1.5)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,GeForce GTX TITAN X的另一面,23.0
7,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
8,DIGITS深度學習GPU訓練系統,22.1
9,為訓練深度神經網絡而開發的最強大的處理器,20.0




iter  44


Unnamed: 0,0,1,2,3,4
0,"(讓各位先睹為快了TITAN X的身影, 5.4)","(軟體自始至終都將為用戶提供所需數據, 5.1)","(的DIGITS DevBox, 4.2)","(的DIGITS DevBox, 4.2)","(數據科學家和研究人員在, 1.1)"
1,"(的史矛戈巨龍為藍本, 2.7)","(訓練系統, 4.0)","(上的時間, 1.2)","(得益於其直觀的用戶介面和, 3.6)","(的工作, 0.6)"
2,"(里的史矛戈巨龍, 2.1)","(系統軟體自始至終都將為用戶提供所, 1.6)","(的GPU, 0.4)","(流程管理能力, 1.8)","(的GPU加速, 0.6)"
3,"(的遊戲開發者大會上讓各位先睹為快, 1.6)","(GPU訓練, 1.5)","(上的, 0.2)","(強大的, 0.9)","(複雜的, 0.3)"
4,"(舉辦的遊戲開發者大會, 1.0)","(系統軟體, 0.4)",,"(的工作, 0.6)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,GeForce GTX TITAN X的另一面,23.0
7,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
8,DIGITS深度學習GPU訓練系統,22.1
9,為訓練深度神經網絡而開發的最強大的處理器,20.0




iter  45


Unnamed: 0,0,1,2,3,4
0,"(了數據科學家和研究人員, 1.1)","(得益於其直觀的用戶介面和強大, 4.2)","(系統軟體自始至終都將為用戶提供所需數據, 5.7)","(可應用在從先進醫藥研究到全自動駕駛汽車的多元領域, 24.0)","(上讓各位先睹為快了TITAN X的身影, 5.7)"
1,"(的GPU加速, 0.6)","(工作流程管理能力, 2.4)","(訓練系統, 4.0)","(領域快速成長的深度學習技術是一項創新的計算引擎, 6.9)","(在舊金山舉辦的遊戲開發者大會, 4.2)"
2,,"(強大的, 0.9)","(訓練深度神經網絡, 2.4)","(的深度學習, 1.5)","(霍比特人, 4.0)"
3,,"(的工作, 0.6)","(GPU訓練, 1.5)","(先進醫藥研究到全自動駕駛汽車的, 1.5)","(舉辦的遊戲開發者大會上, 1.1)"
4,,,,"(在人工智慧, 1.5)",


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,可應用在從先進醫藥研究到全自動駕駛汽車的多元領域,24.0
7,GeForce GTX TITAN X的另一面,23.0
8,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
9,DIGITS深度學習GPU訓練系統,22.1




iter  46


Unnamed: 0,0,1,2,3,4
0,"(而在九月, 1.2)","(執行長黃仁勛先生在GPU技術大會的開幕主題演講活動上, 7.8)","(數據科學家與研究人員能利用這套軟體便捷地開發出, 6.9)","(得益於其直觀的用戶介面和強大的, 4.5)",
1,"(的話則, 0.6)","(配置和訓練深度神經網絡過程中為用戶提供指導一處理, 7.2)","(這套軟體便捷地開發出高品質深度神經網絡, 5.7)","(的DIGITS DevBox, 4.2)",
2,"(的GPU, 0.4)","(工作好讓科學家能專心在研究活動和結果上, 5.7)","(GPU加速版本Caffe, 3.6)","(的工作流程管理能力, 2.7)",
3,,"(的工作, 0.6)","(高品質深度神經網絡, 2.7)",,
4,,"(的處理, 0.6)","(使用深度神經網絡, 2.4)",,


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,可應用在從先進醫藥研究到全自動駕駛汽車的多元領域,24.0
7,GeForce GTX TITAN X的另一面,23.0
8,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
9,DIGITS深度學習GPU訓練系統,22.1




iter  47


Unnamed: 0,0,1,2,3,4
0,"(使用DIGITS DevBox, 4.5)",,"(數據科學家與研究人員能利用這套軟體便捷地開發出高品質, 7.8)","(將前所未有地提高深度學習研究的速度, 17.0)","(精彩的虛擬現實體驗, 9.0)"
1,"(的DIGITS DevBox, 4.2)",,"(的DIGITS DevBox, 4.2)","(的工作好讓科學家能專心在研究活動和結果上, 6.0)",
2,"(X GPU, 3.0)",,"(的深度神經網絡, 2.8)","(的GPU, 0.4)",
3,"(GPU訓練, 1.5)",,"(高品質深度神經網絡, 2.7)",,
4,"(數據科學家和研究人員在, 1.1)",,"(深度神經網絡的, 2.1)",,


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,NVIDIA GeForce GTX TITAN X,26.0
3,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
4,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
5,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
6,可應用在從先進醫藥研究到全自動駕駛汽車的多元領域,24.0
7,GeForce GTX TITAN X的另一面,23.0
8,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0
9,DIGITS深度學習GPU訓練系統,22.1




iter  48


Unnamed: 0,0,1,2,3,4
0,"(得益於其直觀的用戶介面和強大的工作, 5.1)","(總裁兼執行長黃仁勛先生在GPU, 4.5)","(訓練系統軟體自始至終都將為用戶提供所需數據, 6.3)","(在舊金山舉辦的遊戲開發者大會上讓各位先睹為快了TITAN X的身影, 33.0)",
1,"(的用戶介面和強大的工作流程管理能力, 5.1)","(X GPU, 3.0)","(GPU訓練, 1.5)","(里的史矛戈巨龍為藍本, 10.0)",
2,"(管理能力, 1.2)",,,"(里的, 0.6)",
3,"(工作流程, 0.4)",,,,
4,"(流程管理, 0.4)",,,,


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,在舊金山舉辦的遊戲開發者大會上讓各位先睹為快了TITAN X的身影,33.0
3,NVIDIA GeForce GTX TITAN X,26.0
4,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
5,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
6,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
7,可應用在從先進醫藥研究到全自動駕駛汽車的多元領域,24.0
8,GeForce GTX TITAN X的另一面,23.0
9,訓練和驗證圖像分類深度神經網絡的多合一圖形系統,23.0




iter  49


Unnamed: 0,0,1,2,3,4
0,"(直觀的用戶介面和強大的工作流程管理能力, 5.7)","(總裁兼執行長黃仁勛先生在GPU技術大會的開幕主題演講活動上, 29.0)","(的DIGITS DevBox, 4.2)",,"(對工作進行微調, 2.1)"
1,"(得益於其, 1.2)","(X GPU, 3.0)",,,"(廣泛使用, 1.2)"
2,"(其直觀, 0.3)",,,,"(數據科學家和研究人員在, 1.1)"


Unnamed: 0,0,1
0,DIGITS DevBox,35.1
1,現已上市的GeForce GTX TITAN X售價為7999元人民幣,35.0
2,在舊金山舉辦的遊戲開發者大會上讓各位先睹為快了TITAN X的身影,33.0
3,總裁兼執行長黃仁勛先生在GPU技術大會的開幕主題演講活動上,29.0
4,NVIDIA GeForce GTX TITAN X,26.0
5,對在座的四千名與會嘉賓展示三項將推動深度學習的新技術,26.0
6,使用深度神經網絡來訓練電腦教自己如何分類和識別物體,25.0
7,可為最嚴苛的深度學習研究工作提供高效率的性能表現,24.0
8,可應用在從先進醫藥研究到全自動駕駛汽車的多元領域,24.0
9,GeForce GTX TITAN X的另一面,23.0


CPU times: user 1.88 s, sys: 429 ms, total: 2.31 s
Wall time: 2.72 s


*** 
**簡總Meeting Minutes **

In [227]:
# CONFIGs
parser = argparse.ArgumentParser()
parser.add_argument('--data_dir', type=str, default='text/techdoc',)
parser.add_argument('--topic', type=str, default='MARK',)  #'MARK'
parser.add_argument('--docid', type=str, default=1,)  
parser.add_argument('--iter', type=str, default=20,)  
args,unparsed = parser.parse_known_args()

dl_df = loaddocs(folder = args.data_dir, topic=args.topic)

In [None]:
%%time
doc = dl_df['doc'][args.docid]
powerterm_list_eachiter, powerterm_eachiter= main(doc, args.iter, linebreaknum=30, num_words=30)

In [243]:
n=30
print('all powerterm')
display(pd.DataFrame(powerterm_eachiter[n][:20]))
print('by topic')
topic_powerterm = pd.DataFrame(powerterm_list_eachiter[n])
display(topic_powerterm.transpose())

#powerterms
'''
for i in range(args.iter):
    print('\n\niter ',i)
    topic_powerterm = pd.DataFrame(powerterm_list_eachiter[i])
    display(topic_powerterm.transpose().head()) 
    top_powerterm = pd.DataFrame(powerterm_eachiter[i])
    display(top_powerterm[:5+i])
'''

all powerterm


Unnamed: 0,0,1
0,的,1760.9
1,深度學習,1723.2
2,網絡,746.6
3,1,692.7
4,n,641.7
5,2,639.6
6,是,587.9
7,在,556.9
8,我們,490.2
9,3,441.8


by topic


Unnamed: 0,0,1,2,3,4
0,"(卷積神經, 152.8)","(學習模型, 79.6)","(用於, 83.2)","(卷積神經, 152.8)","(卷積神經, 152.8)"
1,"(學習模型, 79.6)","(訓練數據, 68.4)","(學習模型, 79.6)","(學習模型, 79.6)","(學習模型, 79.6)"
2,"(訓練數據, 68.4)","(層神經, 51.6)","(訓練數據, 68.4)","(訓練數據, 68.4)","(訓練數據, 68.4)"
3,"(學習技術, 67.6)","(學習方法, 47.2)","(學習技術, 67.6)","(學習方法, 47.2)","(學習技術, 67.6)"
4,"(你可以, 63.6)","(可以通過, 44.4)","(層神經, 51.6)","(可以通過, 44.4)","(你可以, 63.6)"
5,"(就可以, 39.0)","(輸入層, 42.9)","(輸出層, 47.7)","(輸入數據, 42.4)","(你可, 50.0)"
6,"(人工智慧技術, 22.2)","(輸入數據, 42.4)","(學習方法, 47.2)","(學習領域, 42.4)","(學習方法, 47.2)"
7,"(它可以, 21.3)","(訓練方法, 41.2)","(可以通過, 44.4)","(訓練方法, 41.2)","(訓練方法, 41.2)"
8,"(訓練參數, 18.4)","(就可以, 39.0)","(輸入層, 42.9)","(40, 39.2)","(就可以, 39.0)"
9,"(你需要, 18.3)","(層模型, 31.8)","(輸入數據, 42.4)","(就可以, 39.0)","(特徵學習, 34.0)"


"\nfor i in range(args.iter):\n    print('\n\niter ',i)\n    topic_powerterm = pd.DataFrame(powerterm_list_eachiter[i])\n    display(topic_powerterm.transpose().head()) \n    top_powerterm = pd.DataFrame(powerterm_eachiter[i])\n    display(top_powerterm[:5+i])\n"

***
** All Doc **

In [283]:
# CONFIGs
parser = argparse.ArgumentParser()
parser.add_argument('--data_dir', type=str, default='text/techdoc',)
parser.add_argument('--topic', type=str, default='深度學習',)  #'MARK'
parser.add_argument('--docid', type=str, default=1,)  
parser.add_argument('--iter', type=str, default=100,)  
args,unparsed = parser.parse_known_args()

dl_df = loaddocs(folder = args.data_dir, topic=args.topic)

In [284]:
%%time
doc = dl_df['doc'].tolist()
powerterm_list_eachiter, powerterm_eachiter= main2(doc, args.iter, linebreaknum=1, num_words=30)

101

----------------------

43694
itera: 0
[['的', '是', '在', '和', '學習', '了', '深度學習', '一個', '中', '訓練', '可以', '有', '神經網絡', '模型', '數據', '特徵', '輸入', '我們', '上', '網絡', '也', '層', '對', '為', '算法', '就', '1', '機器', '使用', '進行'], ['的', '和', '深度學習', '是', '在', '了', '一個', '學習', '數據', '中', '可以', '我們', '也', '訓練', '模型', '上', '神經網絡', '有', '機器', '對', '人工智慧', '到', '為', 'io', '技術', '與', '都', '使用', '網絡', '需要'], ['的', '是', '在', '深度學習', '了', '和', '一個', '可以', '神經網絡', '我們', '中', '模型', '學習', '訓練', '數據', '也', '機器', '有', '算法', '上', '為', '你', '網絡', '到', '對', '都', '需要', '特徵', '它', '計算'], ['的', '在', '是', '深度學習', '了', '和', '一個', '模型', '中', '學習', '數據', '訓練', '可以', '也', 'io', '神經網絡', '我們', '網絡', '有', '都', '你', '為', '特徵', '卷積', '到', '上', '使用', '機器', '會', '這個'], ['的', '在', '了', '和', '是', '一個', '深度學習', '學習', '模型', '中', '神經網絡', '數據', '有', '可以', '網絡', '訓練', '為', '我們', '使用', '算法', '上', 'GPU', '也', '機器', '需要', '對', '都', '特徵', '進行', '到']]
itera: 1
[['的', '在', '和', '了', '是', '圖像', '中', '深度學習', '模型', '更', '一個', '通過', '可以', '與', '我們

itera: 10
[['的', '和', '了', '在', '是', '一個', '中', '上', '可以', '為', 'io', '層', '與', '1', '就', '我們', '使用', '網絡', '學習', 'GPU', '等', 'n', '訓練', '也', '更', '0', '3', '算法', '來', '而'], ['的', '和', '在', '是', 'io', '了', '中', '一個', '1', '可以', 'n', '模型', '也', '我們', '學習', '訓練', '=', '數據', '有', '2', '到', '網絡', '上', '3', '來', '都', '為', '與', '對', '而'], ['的', '和', '了', '在', '是', '中', 'io', '為', '上', '我們', '模型', '深度', '可以', '一個', 'n', '進行', '學習', '其', '有', '1', '數據', '到', '算法', '也', '生成', '通過', '輸入', '網絡', '對', '用'], ['的', '和', '在', '是', '了', '中', '上', 'io', '到', '一個', '我們', '你', '1', '學習', '=', '為', '數據', '進行', '與', '可以', '也', '有', '模型', '年', '等', '使用', '2', '這', '新', '對'], ['的', '在', '是', '和', '了', '=', 'io', '學習', '一個', '上', '我們', '中', '為', '也', '模型', '訓練', '數據', '與', '有', 'n', '對', '算法', '個', '可以', '將', '2', '層', '等', '1', '使用']]
itera: 11
[['的', '在', '和', '了', 'io', '是', '1', '中', '=', '一個', 'n', '為', '模型', '可以', '訓練', '上', '2', '我們', '與', '技術', '等', '3', '使用', '數據', '神經網絡', '需要', '系統', '學習', '算法', '這些

itera: 20
[['的', '在', '和', '了', '個', 'io', '是', '中', '可以', '我們', '一個', 'n', '與', '1', '2', '學習', '通過', '訓練', '網絡', '=', '3', '上', '為', '模型', '數據', '從', '使用', '到', '圖像', '人類'], ['的', '在', '和', '是', '了', '=', '中', '個', '上', '一個', '我們', '模型', 'TensorFlow', '為', '可以', '3', 'x', '與', 'io', '學習', 'n', '有', '也', '等', '網絡', '從', '2', '到', '以及', '將'], ['的', '和', '了', '在', '是', 'io', '個', '1', '可以', '也', '中', '我們', '模型', '特徵', '算法', '學習', '數據', '層', '訓練', '一個', '輸入', '網絡', '表示', 'GPU', '2', '上', '為', 'n', '神經網絡', '就'], ['的', '和', '在', '了', '是', '個', '中', 'io', '一個', '為', '學習', '上', '=', '1', '可以', '數據', '到', 'n', '與', '訓練', '我們', '有', '進行', '也', '對', '使用', 'GPU', '年', '更', '大'], ['的', '在', '和', '是', '了', 'io', '1', '個', '中', '=', '上', 'n', '一個', '學習', '也', '使用', '為', '網絡', '我們', '算法', '對', '進行', '層', '到', '2', '可以', '有', '最', '問題', '年']]
itera: 21
[['的', '和', '在', '了', '是', '個', 'io', '中', '一個', '為', '我們', '學習', '1', '到', '上', '可以', '進行', 'n', '有', '=', '更', '輸入', '網絡', '也', '算法', '訓練', '你', '3'

itera: 30
[['的', '和', '在', '了', '是', '個', '=', '中', 'io', '一個', '1', '也', '為', '與', '可以', 'n', '學習', '訓練', '2', '3', '上', '我們', '來', '有', '進行', '就', '網絡', '輸入', '到', '層'], ['的', '在', '是', '和', '了', '個', '中', '一個', 'io', '我們', '1', '模型', '進行', '學習', '為', 'n', '上', '有', '訓練', '層', '到', '來', '數據', '可以', '網絡', '2', '我', '使用', '與', '問題'], ['的', '在', '了', '和', '是', '個', 'io', '可以', '中', '=', '上', '為', '我們', '1', '而', '到', '等', '對', 'n', '學習', '並', '從', '2', '就', '與', '也', '進行', '年', '會', '以'], ['的', '在', '和', 'io', '是', '中', '了', '個', '上', '1', '一個', 'n', '學習', '可以', '我們', '模型', '對', '網絡', '使用', '=', '也', '為', '訓練', 'GPU', '層', '算法', '有', '3', '輸入', '到'], ['的', '和', '在', '是', '了', '個', 'io', '可以', '我們', '與', '學習', '中', '=', '數據', '為', 'n', '你', '2', '訓練', '一個', 'GPU', '1', '而', '模型', '3', '由', '算法', '也', '有', '特徵']]
itera: 31
[['的', '和', '在', '了', '是', '個', 'io', '中', '學習', '上', '我們', 'n', '可以', '網絡', '進行', '一個', '訓練', '1', '到', '使用', '對', '2', '也', '為', '下', '層', 'GPU', '而', '特徵', '模型'], ['

itera: 40
[['的', '在', '和', '是', '了', '個', 'io', '中', 'n', '1', '學習', '=', '上', '3', '一個', '我們', '與', '訓練', '算法', '為', '網絡', '模型', '有', '也', '來', '方面', '它', '可以', '對', '會'], ['的', '在', '和', '了', '是', '中', '=', 'io', '一個', '上', '個', '1', '可以', '為', '與', '也', '2', 'n', 'GPU', '使用', '而', '就', '訓練', '學習', '對', '我們', '需要', '都', '模型', '有'], ['的', '和', '在', '是', '了', 'io', '個', '中', 'n', '我們', '上', '對', '一個', '與', '學習', '可以', '從', '模型', '為', '會', '使用', '系統', '通過', '到', '3', '這些', '他', '於', '都', '函數'], ['的', '和', '在', '是', '了', '個', '1', 'io', '我們', '學習', '=', '訓練', '中', '一個', '為', '可以', 'GPU', '與', '2', '也', '3', '層', 'n', '上', '使用', '有', '等', '來', '需要', '函數'], ['的', '在', '和', '了', '是', '個', 'io', '中', '可以', '1', '數據', '我們', '模型', '一個', '網絡', '為', '2', '上', '也', '到', '學習', 'n', '進行', '而', '層', '輸入', '=', '對', '訓練', '特徵']]
itera: 41
[['的', '在', '和', '了', '是', 'io', '個', '中', '=', 'n', '1', '學習', '一個', '我們', '可以', '訓練', '也', '而', '上', '到', '網絡', '使用', '與', '算法', '模型', '從', '為', '有', '年', '2'], [

itera: 50
[['的', '在', '和', '了', '是', '個', 'io', '中', '=', '我們', '3', '也', '1', '一個', '上', 'n', '網絡', '訓練', '對', '它', 'GPU', '2', '都', '就', '可以', '數據', '以', '層', '學習', '問題'], ['的', '和', '在', '了', '是', '=', '中', '個', '為', '上', 'io', '可以', '我們', '1', '網絡', '也', '使用', '與', '有', '進行', '訓練', '特徵', '學習', '模型', '輸入', '層', '技術', '2', '算法', '更'], ['的', '和', '在', '了', '是', 'io', '個', '學習', '一個', '中', '可以', '模型', '1', '到', '與', 'n', '為', '2', '我們', '訓練', '也', '有', '進行', '上', '而', '來', '數據', '函數', '從', '年'], ['的', '在', '=', '和', '是', '1', 'io', '了', '個', '中', '上', 'x', 'n', '我們', '一個', '學習', '為', '可以', '網絡', '算法', '3', '進行', '有', '輸入', '訓練', '但', '2', 'GPU', '0', '需要'], ['的', '在', '和', '了', '是', '中', 'io', '我們', '個', '一個', '與', '可以', '1', '為', '對', 'n', '上', 'GPU', '數據', '訓練', '層', '使用', '算法', '也', '需要', '而', '更', '它', '年', '不']]
itera: 51
[['的', '在', '了', '和', '是', '個', 'io', '中', '=', '可以', '1', '我們', 'n', '為', '2', '上', '一個', '從', '而', '學習', '對', '訓練', '與', '使用', '3', '就', '算法', '到', '來', '有'], 

itera: 60
[['的', '和', '是', '在', '了', '個', '=', '1', '我們', 'io', '一個', '也', '中', '2', 'n', '進行', '為', '學習', '對', '網絡', '訓練', '可以', '層', '使用', '有', '模型', '來', '從', '3', '需要'], ['的', '和', '在', '了', '是', '上', '個', '中', '可以', '我們', '一個', 'io', '訓練', '1', '學習', '也', '有', '使用', 'n', '來', '層', '=', '與', '進行', '而', '數據', '以', '2', '為', '輸入'], ['的', '在', 'io', '和', '了', '是', '中', '個', 'n', '為', '3', '上', '訓練', '與', '學習', '一個', '我們', '模型', '可以', '網絡', '=', '1', '你', 'GPU', '2', '通過', '年', '對', '就', '需要'], ['的', '在', '和', '了', '是', 'io', '中', '個', '1', '為', '學習', '與', '我們', '一個', 'n', '算法', '上', '也', '=', '網絡', '對', '可以', '模型', '而', '等', '層', '數據', '年', '2', '都'], ['的', '在', '和', '了', '是', 'io', '中', '個', '=', '可以', '學習', '一個', '到', '模型', '1', '為', '進行', '2', '地', '與', 'n', '你', '來', '上', '需要', '而', '3', '年', '我們', '更']]
itera: 61
[['的', '在', '和', '是', '了', '中', '1', '個', '訓練', '上', 'io', '一個', '也', '可以', '為', '學習', '我們', '函數', '使用', '有', '進行', '3', '而', '算法', '需要', '年', '層', '圖像', '等', '模型'], ['的

itera: 70
[['的', '和', '了', '在', '=', '是', '1', '個', '中', '3', '可以', '上', 'n', '學習', 'io', '模型', 'x', '一個', '我們', '與', '為', '網絡', 'Deep', 'GPU', '對', '2', '也', '0', '技術'], ['的', '在', '和', '是', '了', 'io', '中', '個', '我們', '為', '1', '一個', '訓練', '算法', '可以', '2', '層', 'n', 'GPU', '等', '學習', '年', '而', '與', '網絡', '有', '也', '來', '就', '需要'], ['的', '在', '和', '了', '是', 'io', '一個', '中', '個', '=', '也', 'n', '上', '模型', '1', '學習', '2', '有', '訓練', '3', '與', '使用', '來', '從', '對', '數據', '我們', '需要', '通過', '為'], ['的', '和', '在', '是', '了', '個', '中', '可以', 'io', '學習', '與', '上', '一個', 'n', '我們', '到', '為', '都', '等', '而', '進行', '1', '2', '函數', '數據', '也', '訓練', '=', '以', '對'], ['的', '和', '在', 'io', '了', '是', '個', '上', '學習', '1', '我們', '為', '中', '網絡', 'n', '=', '一個', '可以', '訓練', '也', '與', '模型', '有', '使用', '年', '進行', '從', '對', '輸入', '特徵']]
itera: 71
[['的', '在', '和', '是', '了', '個', 'io', '中', '學習', '可以', '一個', '上', '為', 'n', '與', '=', '進行', '網絡', '1', '模型', '我們', '而', 'GPU', '訓練', '到', '來', '都', '有', '也', '對'], ['的',

itera: 80
[['的', '和', '在', '了', '是', '個', '中', 'io', '1', '3', '我們', '上', '也', '與', '=', '學習', '一個', '網絡', '為', '等', '到', '數據', '而', '算法', 'n', '函數', '年', '就', '可以', '深度'], ['的', '和', '在', '是', '了', 'io', '中', '個', '上', 'n', '一個', '與', '我們', '可以', '為', '也', '需要', '等', '使用', '1', '模型', '2', '學習', '有', '算法', '訓練', '就', '對', '網絡', '從'], ['的', '了', '在', '和', 'io', '是', '=', '1', '一個', '個', '我們', '中', 'n', '為', '模型', '2', '可以', '學習', '對', '有', '而', '來', '使用', '網絡', '上', '技術', '也', '方法', '算法', '那麼'], ['的', '在', '是', '和', '了', '中', '個', 'io', '=', '學習', '為', '1', '可以', '一個', '訓練', '我們', '到', '上', 'n', '層', '也', '2', '與', '來', '問題', '例如', '對', '都', '年', '會'], ['的', '在', '和', '了', '是', 'io', '個', '1', 'n', '一個', '可以', '=', '訓練', '學習', '中', '進行', '為', '模型', '有', '2', '上', 'GPU', '數據', '使用', '網絡', '以', '與', '我們', '對', '或']]
itera: 81
[['的', '在', '和', '是', '了', '個', '中', 'io', '我們', '一個', '=', '訓練', '可以', '學習', '需要', 'n', '到', '2', '層', '進行', '其', '算法', '年', '3', '與', '為', '網絡', '有', '更', '特徵'], [

itera: 90
[['的', '在', '和', '是', 'io', '了', '個', '中', '上', '=', '一個', '可以', 'n', '我們', '1', '訓練', '網絡', '為', '2', '算法', '函數', '也', '模型', '數據', '與', '進行', '來', '到', '對', 'GPU'], ['的', '在', '和', '了', '是', 'io', '中', '個', '一個', '1', '與', '學習', '我們', '2', '可以', 'n', '3', '通過', '為', '有', '也', '網絡', '就', '上', '訓練', '而', '算法', '=', '下'], ['的', '和', '在', '了', '是', '個', 'io', '一個', '1', '為', '中', '可以', '學習', '也', '與', '進行', '=', '對', '我們', 'n', '使用', '輸入', '來', '就', '訓練', '你', '模型', '到', '表示', '層'], ['的', '和', '在', '了', '是', 'io', '中', '個', '上', '學習', 'n', '為', '也', '與', '1', '模型', '訓練', '我們', '有', '等', '網絡', '而', '使用', '可以', '圖像', '需要', '數據', '對', '到', '都'], ['的', '在', '和', '=', '了', '是', 'io', '中', '1', '個', '3', '學習', '2', '一個', '為', 'n', '可以', '我們', '模型', '到', '你', '需要', '更', '對', '進行', 'x', '從', '數據', '來', 'GPU']]
itera: 91
[['的', '在', '和', '了', '是', 'io', '中', '一個', '個', '可以', 'n', '學習', '算法', '1', '與', '我們', '對', '以', '從', '也', '到', '為', '等', '=', '上', '函數', '進行', '使用', '就', '更'], ['的', '

CPU times: user 3h 48min 37s, sys: 51.5 s, total: 3h 49min 28s
Wall time: 3h 50min 32s


In [296]:
print('all powerterm')
display(pd.DataFrame(powerterm_eachiter[-1][:20]))
print('by topic')
topic_powerterm = pd.DataFrame(powerterm_list_eachiter[-1])
display(topic_powerterm.transpose())
#powerterms

all powerterm


Unnamed: 0,0,1
0,深度學習,1723.2
1,機器學習,420.4
2,卷積神經網絡,376.2
3,20,303.6
4,深度學習的,294.5
5,但是,231.8
6,這個,221.4
7,10,191.8
8,神經網絡的,182.5
9,的深度學習,172.5


by topic


Unnamed: 0,0,1,2,3,4
0,"(深度學習, 1723.2)","(學習的, 173.7)","(學習的, 173.7)","(學習的, 173.7)","(學習的, 173.7)"
1,"(學習的, 173.7)","(網絡的, 148.2)","(網絡的, 148.2)","(網絡的, 148.2)","(網絡的, 148.2)"
2,"(就是, 168.4)","(的數據, 130.5)","(的模型, 107.1)","(的數據, 130.5)","(是一個, 102.0)"
3,"(的特徵, 140.4)","(學習算法, 127.2)","(是一個, 102.0)","(學習算法, 127.2)","(中的, 75.8)"
4,"(的深度, 127.2)","(的模型, 107.1)","(12, 99.6)","(的模型, 107.1)","(的網絡, 74.7)"
5,"(是一個, 102.0)","(是一個, 102.0)","(學習模型, 79.6)","(是一個, 102.0)","(的是, 69.6)"
6,"(也就, 83.8)","(12, 99.6)","(中的, 75.8)","(12, 99.6)","(我們可以, 67.6)"
7,"(中的, 75.8)","(學習模型, 79.6)","(的網絡, 74.7)","(學習模型, 79.6)","(13, 60.4)"
8,"(的是, 69.6)","(層的, 77.2)","(的是, 69.6)","(中的, 75.8)","(從而, 58.8)"
9,"(的訓練, 69.3)","(中的, 75.8)","(模型的, 69.0)","(的網絡, 74.7)","(到的, 56.8)"


In [278]:
print('all powerterm')
display(pd.DataFrame(powerterm_eachiter[n][:20]))
print('by topic')
topic_powerterm = pd.DataFrame(powerterm_list_eachiter[n])
display(topic_powerterm.transpose())
#powerterms
'''
for i in range(args.iter):
    print('\n\niter ',i)
    topic_powerterm = pd.DataFrame(powerterm_list_eachiter[i])
    display(topic_powerterm.transpose().head()) 
    top_powerterm = pd.DataFrame(powerterm_eachiter[i])
    display(top_powerterm[:5+i])
'''

all powerterm


Unnamed: 0,0,1
0,的,1760.9
1,深度學習,1723.2
2,網絡,746.6
3,1,692.7
4,n,641.7
5,2,639.6
6,是,587.9
7,在,556.9
8,我們,490.2
9,3,441.8


by topic


Unnamed: 0,0,1,2,3,4
0,"(學習的, 173.7)","(學習的, 173.7)","(的, 1760.9)","(學習的, 173.7)","(學習的, 173.7)"
1,"(網絡的, 148.2)","(網絡的, 148.2)","(學習, 1009.2)","(就是, 168.4)","(的特徵, 140.4)"
2,"(學習算法, 127.2)","(的特徵, 140.4)","(網絡, 746.6)","(的模型, 107.1)","(的模型, 107.1)"
3,"(的模型, 107.1)","(的數據, 130.5)","(1, 692.7)","(是一個, 102.0)","(是一個, 102.0)"
4,"(是一個, 102.0)","(的模型, 107.1)","(n, 641.7)","(也就, 83.8)","(12, 99.6)"
5,"(學習模型, 79.6)","(是一個, 102.0)","(2, 639.6)","(學習模型, 79.6)","(學習模型, 79.6)"
6,"(中的, 75.8)","(12, 99.6)","(是, 587.9)","(層的, 77.2)","(中的, 75.8)"
7,"(的網絡, 74.7)","(學習模型, 79.6)","(在, 556.9)","(中的, 75.8)","(的是, 69.6)"
8,"(的是, 69.6)","(中的, 75.8)","(我們, 490.2)","(的是, 69.6)","(的訓練, 69.3)"
9,"(的訓練, 69.3)","(的網絡, 74.7)","(3, 441.8)","(的訓練, 69.3)","(模型的, 69.0)"


"\nfor i in range(args.iter):\n    print('\n\niter ',i)\n    topic_powerterm = pd.DataFrame(powerterm_list_eachiter[i])\n    display(topic_powerterm.transpose().head()) \n    top_powerterm = pd.DataFrame(powerterm_eachiter[i])\n    display(top_powerterm[:5+i])\n"

In [234]:
powerterm_eachiter[-1]

[('的', 1760.9),
 ('深度學習', 1723.2),
 ('網絡', 746.6),
 ('1', 692.7),
 ('n', 641.7),
 ('2', 639.6),
 ('是', 587.9),
 ('一', 585.1),
 ('在', 556.9),
 ('這', 541.7),
 ('我們', 490.2),
 ('神經', 480.8),
 ('模型', 446.6),
 ('數據', 444.0),
 ('3', 441.8),
 ('一個', 432.0),
 ('用', 422.1),
 ('機器學習', 420.4),
 ('人工智慧', 420.0),
 ('0', 377.7),
 ('卷積神經網絡', 376.2),
 ('訓練', 374.4),
 ('可以', 358.6),
 ('Deep', 347.6),
 ('com', 338.1),
 ('了', 335.8),
 ('有', 330.1),
 ('中', 327.6),
 ('特徵', 307.8),
 ('GPU', 306.6),
 ('20', 303.6),
 ('和', 296.7),
 ('深度學習的', 294.5),
 ('層', 287.5),
 ('如', 285.2),
 ('大', 283.2),
 ('算法', 273.8),
 ('C', 273.6),
 ('計算', 273.2),
 ('問題', 272.6),
 ('A', 271.2),
 ('4', 267.9),
 ('為', 265.0),
 ('不', 259.7),
 ('能', 257.2),
 ('例如', 257.2),
 ('作者', 246.4),
 ('輸入', 244.4),
 ('來', 243.1),
 ('方法', 241.0),
 ('S', 241.0),
 ('圖', 240.2),
 ('因此', 239.2),
 ('而', 236.5),
 ('5', 236.3),
 ('Google', 235.2),
 ('但是', 231.8),
 ('使用', 231.4),
 ('上', 229.6),
 ('對', 223.3),
 ('這個', 221.4),
 ('圖像', 221.4),
 ('如果', 216.0),
