通过对句子的语法结构进行分析可以进一步分析句子的含义
NLTK通过命题逻辑、一阶逻辑等方式分析自然语言的含义

In [1]:
import nltk

对语句含义的理解可以考虑通过语法将其转换为计算机更容易理解的语言
NLTK内置了很多文法进行语言的简单翻译
如下边的示例 根据NLTK中内置的文法 将自然语言转换为SQL语句

In [4]:
from nltk import load_parser
cp = load_parser('grammars/book_grammars/sql0.fcfg')
query = 'What cities are located in China'
trees = list(cp.parse(query.split()))
answer = trees[0].label()['SEM']
answer = [s for s in answer if s]
q = ' '.join(answer)
print(q)

SELECT City FROM city_table WHERE Country="china"


NLTK可以将语言用逻辑语言进行表达，通过命题逻辑推理语言的含义
NLTK用命题逻辑表示语言结构中和特定句子连接词相对应的部分

In [5]:
# NLTK中命题逻辑的逻辑运算符有五种
print(nltk.boolean_ops())

negation       	-
conjunction    	&
disjunction    	|
implication    	->
equivalence    	<->
None


NLTK可以将逻辑表达式转换为Expression对象，通过NLTK的推理模块对Expression进行逻辑证明

In [10]:
from nltk.inference import Prover9

# nltk中的Expression对象能够将逻辑表达式，处理成Expression的子类。
read_expr = nltk.sem.Expression.fromstring
result = read_expr('-(P & Q)')
print(result)

# 逻辑证明通过nltk的推理模块进行。例如通过第三方定理证明程序prover9的接口。
# 并且推理机制的输入必须首先转换为逻辑表达式
SnF = read_expr('SnF')
NotFns = read_expr('-FnS')
R = read_expr('SnF -> -FnS')
prover = Prover9()
result = prover.prove(NotFns, [SnF, R])
print(result)

-(P & Q)


LookupError: 

===========================================================================
NLTK was unable to find the prover9 file!
Use software specific configuration paramaters or set the PROVER9 environment variable.

  Searched in:
    - /usr/local/bin/prover9
    - /usr/local/bin/prover9/bin
    - /usr/local/bin
    - /usr/bin
    - /usr/local/prover9
    - /usr/local/share/prover9

  For more information on prover9, see:
    <http://www.cs.unm.edu/~mccune/prover9/>
===========================================================================

NLTK还可以通过Valuation对象来确定逻辑表达式的真值

In [12]:
# Valuation ：从逻辑的基本符号映射到他们的值。
val = nltk.Valuation([('P', True), ('Q', True), ('R', False)])
dom = set()
g = nltk.Assignment(dom)
# 用val初始化模型m
m = nltk.Model(dom, val)
# 使用evaluate()可确定逻辑表达式的真值情况
result = m.evaluate('(P & Q)', g)
print(result)

True


NLTK可以通过将自然语言表达式转换为一阶逻辑来表达语句的含义
一阶逻辑保留命题逻辑的所有布尔运算，将识别命题中的谓词和参数进行分析
一阶逻辑表达式的语法结构通常是为表达式分配类型：实体类型和公式类型
一阶逻辑也可以通过Prover9进行逻辑证明
以下是代码示例

In [14]:
read_expr = nltk.sem.Expression.fromstring
expr = read_expr('walk(angus)', type_check=True)
print(expr.argument)           # 参数
print(expr.argument.type)      # 实体类型
print(expr.function)           # 谓词
print(expr.function.type)      # 公式类型

# 对一阶逻辑进行逻辑证明
NotFnS = read_expr('-north_of(f, s)')
SnF = read_expr('north_of(s, f)')
R = read_expr('all x. all y. (north_of(x, y) -> -north_of(y, x))')
prover = nltk.Prover9()
prover.prove(NotFnS, [SnF, R]) # True

angus
e
walk
<e,?>


In [15]:
v = """
    bertie => b
    olive => o
    cyril => c
    boy => {b}
    girl => {o}
    dog => {c}
    walk => {o, c}
    see => {(b, o), (c, b), (o, c)}
    """
val = nltk.Valuation.fromstring(v)
print(val)

{'bertie': 'b',
 'boy': {('b',)},
 'cyril': 'c',
 'dog': {('c',)},
 'girl': {('o',)},
 'olive': 'o',
 'see': {('o', 'c'), ('b', 'o'), ('c', 'b')},
 'walk': {('o',), ('c',)}}
