In [1]:
import os
import re
import json
import math
import numpy as np
from tqdm import tqdm_notebook as tqdm

from keras_bert import load_vocabulary, load_trained_model_from_checkpoint, Tokenizer, get_checkpoint_paths

import keras.backend as K
from keras.layers import Input, Dense, Lambda, Multiply, Masking, Concatenate
from keras.models import Model
from keras.preprocessing.sequence import pad_sequences
from keras.callbacks import Callback, ModelCheckpoint
from keras.utils.data_utils import Sequence
from keras.utils import multi_gpu_model

from nl2sql.utils import read_data, read_tables, SQL, MultiSentenceTokenizer, Query, Question, Table
from nl2sql.utils.optimizer import RAdam

Using TensorFlow backend.


In [2]:
train_table_file = './data/train.tables.json'
train_data_file = './data/train.json'

val_table_file = './data/val.tables.json'
val_data_file = './data/val.json'

test_table_file = './data/val.tables.json'
test_data_file = './data/val.json'

# Download pretrained BERT model from https://github.com/ymcui/Chinese-BERT-wwm
bert_model_path = './model'
paths = get_checkpoint_paths(bert_model_path)

In [3]:
train_tables = read_tables(train_table_file)
train_data = read_data(train_data_file, train_tables)

val_tables = read_tables(val_table_file)
val_data = read_data(val_data_file, val_tables)

test_tables = read_tables(test_table_file)
test_data = read_data(test_data_file, test_tables)

In [8]:
val_tables.__getitem__("ab2c2fc23b0611e99a3af40f24344a08")

Unnamed: 0,ISBN,正书名,作者,出版社,出版时间,定价,封面图片,页码,开本,中图法分类号,内容简介,读者对象,语种,币制
0,9.78730128604e+12,职场综合英语教程,主编童敬东,北京大学出版社,43344.0,39.0,9.78730128604e+12,132页,26cm,H319.3,本书以传承职场文化，培养学生的职业素养为目标，实用性强；将职场文化与英语语言技能培养于一体，...,英语学习者,chi,CNY
1,9.78730128744e+12,汉学传统与东亚文明关系论,(俄)米·列·季塔连科著,北京大学出版社,42979.0,65.0,9.78730128744e+12,"23,403页",23cm,K207.8-53,本书主要译介了其在中国古代哲学传统对当代中国文化的影响方面的系统观点和文章。,汉学研究人员,chi,CNY
2,9.78730129218e+12,区域贸易协定中的反倾销制度研究,何艳华著,北京大学出版社,43344.0,45.0,9.78730129218e+12,240页,23cm,D912.294.4,本书通过对反倾销制度合理性问题的反思，从法理和实证两方面对区域贸易协定中的反倾销制度作了分析...,国际经济法研究者、国际贸易产业从业者,chi,CNY
3,9.78730129273e+12,汉语反义词的词汇语义学研究,丁晶著,北京大学出版社,43344.0,32.0,9.78730129273e+12,135页,24cm,H136.2,本书从大规模语料库出发，系统探讨了汉语反义词（“opposites”）在不同类型的固定结构中...,语言学及计算机语言学研究者,chi,CNY
4,9.78730129278e+12,现代日本社会,主编边静,北京大学出版社,43466.0,39.0,9.78730129278e+12,209页,26cm,H369.39,本书为北京科技大学规划教材，内容在《新日本社会》（日语）的中文扩展版的基础上，加入了最近两年...,通识教育课；对现代日本社会、文化感兴趣的读者,chi,CNY
5,9.78730129346e+12,审判委员会制度改革实证研究,左卫民...[等]著,北京大学出版社,43374.0,49.0,9.78730129346e+12,224页,23cm,D925.04,本书以A省三级法院审判委员会为调研对象，实证描绘了审判委员会组织结构、讨论案件职能、宏观指导...,司法界,chi,CNY
6,9.78730129361e+12,营销策划,主编周明,北京大学出版社,43374.0,38.0,9.78730129361e+12,226页,26cm,F713.50,本书吸收了国内外营销策划理论的先进成果，结合中国本土市场的特点，有针对性地在理论阐述中穿插实...,市场营销、工商管理及其他相关专业，工商企业管理者和企划人员培训,chi,CNY
7,9.78730129442e+12,日语语法,"张玉玲,李占军编著",北京大学出版社,43374.0,48.0,9.78730129442e+12,262页,24cm,H364,本书全面系统地解析日语专业八级、N1、N2大纲涵盖的所有句型。摘取《日语专业八级考试大纲》以...,日语学习者,chi,CNY
8,9.78730129607e+12,中世纪英国动物叙事文学研究,张亚婷著,北京大学出版社,43435.0,52.0,9.78730129607e+12,"20,246页",23cm,I561.063,本研究以环境伦理学为切入点，研究12-15世纪英国作家在拉丁语、盎格鲁-诺曼语和中世纪英语作...,英国文学研究人员,chi,CNY
9,9.78730129616e+12,朴婉绪小说汉译研究,杨磊著,北京大学出版社,43344.0,46.0,9.78730129616e+12,222页,23cm,I312.607.4,本书以朴婉绪小说的汉译作品为研究对象，从翻译美学入手，梳理译者采用的翻译手法和策略，力图找出...,韩国文学汉译研究者,chi,CNY
