<a href="https://colab.research.google.com/github/lab319204/2024paper/blob/main/shenjunyao/Hanlp%E5%AD%A6%E4%B9%A0%E5%8F%8A%E8%AE%BA%E6%96%87%E5%A4%8D%E5%88%BB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

HanLP 是一个由中国开发者何晗(hankcs)于 2014 年开发的自然语言处理库，自发布之后，HanLP 不断更新迭代，进行了许多新功能和性能的优化，Github 上 Star 数量已超过 3w，其在主流自然语言工具包中非常受欢迎。HanLP 具有丰富的功能，可以进行一系列文本分析任务，比如词法分析（分词、词性标注、命名实体识别）、句法分析、文本分类/聚类、信息抽取、语义分析等等。发展至今，HanLP 已经衍生出了 1.x和 2.x 两大版本，本文介绍的是主打追求经典、稳定、高效的 1.x 版本，并且 1.x 版本内部的算法经过了学术界、工业界的考验，已有出版的配套书籍《自然语言处理入门》（作者就是 HanLP 库的开发者），感兴趣的读者可以深入学习。

由于这是第一篇介绍 HanLP 的文章，本文更加侧重以入门为主，主要介绍了在 Python 中安装并使用 HanLP1.x 的方法，以及如何获取 HanLP 的分词器进行分词，当然我们也会在后面的文章中介绍更多关于 HanLP 的功能。HanLP 开源地址：https://github.com/hankcs/HanLP

In [7]:
!pip install hanlp_restful -U



In [8]:
from hanlp_restful import HanLPClient
# 支持zh中文，en英语，ja日本语，mul多语种
HanLP = HanLPClient('https://www.hanlp.com/api', auth='NzgxNkBiYnMuaGFubHAuY29tOnQ1QTl6YlJ5YlBiMEJoS2k=')  # auth需要申请

#代码演示




In [9]:
text="贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告。在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明。书中最令人不安的例子之一就是拉帕努伊。\
根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居。他们发展出了一个繁荣的社会，人口或许达到了1.5万人。他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点。当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失。人口减少到了几千人，他们正努力维持生存。戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种。他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃。\
这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境。乐观的是，作者指出，我们可以选择不在今天犯同样的错误。这本书写得很好，值得任何关心环境的人阅读。"

In [10]:
#实体识别
text_try="贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告。"
HanLP.parse(text_try, tasks='ner/ontonotes').pretty_print()

In [11]:
#依存语法识别
doc = HanLP.parse(text_try, tasks='dep')
print(doc)

{
  "tok/fine": [
    ["贾雷德·戴蒙德", "的", "新", "书", "《", "崩溃", "》", "是", "对", "破坏", "环境", "后果", "的", "明确", "警告", "。"]
  ],
  "dep": [
    [[4, "nmod:assmod"], [1, "case"], [4, "amod"], [6, "compound:nn"], [6, "punct"], [15, "nsubj"], [6, "punct"], [15, "cop"], [12, "case"], [12, "acl"], [10, "dobj"], [15, "nmod"], [12, "case"], [15, "amod"], [0, "root"], [15, "punct"]]
  ]
}


In [12]:
doc.pretty_print()

In [13]:
HanLP.keyphrase_extraction(text)#关键词（短语）提取（Keyphrase Extraction）的目标是文本中最具有代表性的关键词以及短语。

{'拉帕努伊': 0.9746366739273071,
 '贾雷德·戴蒙德的新书': 0.5544393658638,
 '摩艾雕像': 0.5513750314712524,
 '拉帕努伊社会的崩溃': 0.5053567290306091,
 '著名的摩艾雕像': 0.4849400520324707,
 '岛上的不同地点': 0.44859373569488525,
 '摩艾': 0.3831756114959717,
 '崩溃': 0.3810558617115021,
 '作者的说法': 0.3765204846858978,
 '任何关心环境的人': 0.3719581663608551}

In [14]:
#情感分析
HanLP.sentiment_analysis(text)

0.8642482161521912

# 论文复刻

关键性、完整性、独立性
1. 计算输入文本中每个句子的关键性，并根据关键性对句子进行排名，从最高开始。
2. 根据段落长度为每个段落分配考点配额。
3. 沿着关键性列表选择考点，同时遵守配额限制，如果候选句子所属的段落已经满足其配额，则拒绝该候选句子；如果检测到候选句子与已选考点句子具有相似意义，则拒绝该候选句子。如果在选择过程中没有可用的候选句子，则调整阈值。

贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告。在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明。书中最令人不安的例子之一就是拉帕努伊。

根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居。他们发展出了一个繁荣的社会，人口或许达到了1.5万人。他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点。当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失。人口减少到了几千人，他们正努力维持生存。戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种。他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃。

这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境。乐观的是，作者指出，我们可以选择不在今天犯同样的错误。这本书写得很好，值得任何关心环境的人阅读。

In [15]:
text="""贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告。在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明。书中最令人不安的例子之一就是拉帕努伊。
根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居。他们发展出了一个繁荣的社会，人口或许达到了1.5万人。他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点。当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失。人口减少到了几千人，他们正努力维持生存。戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种。他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃。
这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境。乐观的是，作者指出，我们可以选择不在今天犯同样的错误。这本书写得很好，值得任何关心环境的人阅读。"""

In [16]:
#创建两个列表保存句子和段落信息
import re

def split_sentences(text):#保留句子信息和句子对应的段落信息
    # 定义中文句子的结束符号
    sentence_endings = r'[。！？]'#对应hanlp中的分句逻辑
    # 使用换行符分割段落
    paragraphs = text.split('\n')
    # 去掉空字符串
    paragraphs = [paragraph.strip() for paragraph in paragraphs if paragraph.strip()]

    sentences = []  # 存储所有句子
    paragraph_indices = []  # 存储每个句子所属的段落编号

    for paragraph_index, paragraph in enumerate(paragraphs):
        # 对每个段落进行句子分割
        paragraph_sentences = re.split(sentence_endings, paragraph)
        # 去掉空字符串
        paragraph_sentences = [sentence.strip() for sentence in paragraph_sentences if sentence.strip()]
        # 将句子和段落编号添加到列表中
        sentences.extend(paragraph_sentences)
        paragraph_indices.extend([paragraph_index + 1] * len(paragraph_sentences))

    return sentences, paragraph_indices
def split_paragraphs(text):#保留段路信息
    # 使用反斜杠分割段落
    paragraphs = text.split('\n')  # 修改为反斜杠分割
    # 去掉空字符串
    paragraphs = [paragraph.strip() for paragraph in paragraphs if paragraph.strip()]
    return paragraphs


In [17]:
sentence_infor,paragraph_index=split_sentences(text)
sentence_infor,paragraph_index

(['贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告',
  '在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明',
  '书中最令人不安的例子之一就是拉帕努伊',
  '根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居',
  '他们发展出了一个繁荣的社会，人口或许达到了1.5万人',
  '他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点',
  '当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失',
  '人口减少到了几千人，他们正努力维持生存',
  '戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种',
  '他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃',
  '这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境',
  '乐观的是，作者指出，我们可以选择不在今天犯同样的错误',
  '这本书写得很好，值得任何关心环境的人阅读'],
 [1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3])

In [18]:
paragraphs_infor=split_paragraphs(text)

In [19]:
#使用细分
words=HanLP.tokenize(text)
words

[['贾雷德·戴蒙德',
  '的',
  '新',
  '书',
  '《',
  '崩溃',
  '》',
  '是',
  '对',
  '破坏',
  '环境',
  '后果',
  '的',
  '明确',
  '警告',
  '。'],
 ['在',
  '书中',
  '，',
  '作者',
  '描述',
  '了',
  '几',
  '个',
  '因',
  '自身',
  '选择',
  '及其',
  '对',
  '环境',
  '的',
  '影响',
  '而',
  '崩溃',
  '的',
  '文明',
  '。'],
 ['书中', '最', '令', '人', '不安', '的', '例子', '之一', '就是', '拉帕努伊', '。'],
 ['根据',
  '作者',
  '的',
  '说法',
  '，',
  '拉帕努伊',
  '在',
  '公元',
  '700',
  '年',
  '之后',
  '的',
  '某个',
  '时候',
  '由',
  '波利尼西亚',
  '人',
  '定居',
  '。'],
 ['他们',
  '发展',
  '出了',
  '一',
  '个',
  '繁荣',
  '的',
  '社会',
  '，',
  '人口',
  '或许',
  '达到',
  '了',
  '1.5万',
  '人',
  '。'],
 ['他们',
  '雕刻',
  '了',
  '著名',
  '的',
  '摩艾',
  '雕像',
  '，',
  '并',
  '利用',
  '可用',
  '的',
  '自然',
  '资源',
  '将',
  '这些',
  '巨大',
  '的',
  '雕像',
  '运到',
  '岛',
  '上',
  '的',
  '不同',
  '地点',
  '。'],
 ['当',
  '第一',
  '批',
  '欧洲人',
  '在',
  '1722',
  '年',
  '登上',
  '拉帕努伊岛',
  '时',
  '，',
  '摩艾',
  '雕像',
  '仍然',
  '存在',
  '，',
  '但',
  '树木',
  '已经',
  '消失',
  '。'],
 ['人口', '减少'

In [20]:
#使用粗分
words=HanLP.tokenize(text, coarse=True)
words

[['贾雷德·戴蒙德',
  '的',
  '新书',
  '《崩溃》',
  '是',
  '对',
  '破坏',
  '环境',
  '后果',
  '的',
  '明确',
  '警告',
  '。'],
 ['在',
  '书中',
  '，',
  '作者',
  '描述',
  '了',
  '几个',
  '因',
  '自身',
  '选择',
  '及其',
  '对',
  '环境',
  '的',
  '影响',
  '而',
  '崩溃',
  '的',
  '文明',
  '。'],
 ['书中', '最', '令人', '不安', '的', '例子', '之一', '就是', '拉帕努伊', '。'],
 ['根据',
  '作者',
  '的',
  '说法',
  '，',
  '拉帕努伊',
  '在',
  '公元700年',
  '之后',
  '的',
  '某个',
  '时候',
  '由',
  '波利尼西亚人',
  '定居',
  '。'],
 ['他们',
  '发展',
  '出了',
  '一个',
  '繁荣的',
  '社会',
  '，',
  '人口',
  '或许',
  '达到',
  '了',
  '1.5万',
  '人',
  '。'],
 ['他们',
  '雕刻',
  '了',
  '著名',
  '的',
  '摩艾',
  '雕像',
  '，',
  '并',
  '利用',
  '可用',
  '的',
  '自然资源',
  '将',
  '这些',
  '巨大',
  '的',
  '雕像',
  '运到',
  '岛',
  '上',
  '的',
  '不同',
  '地点',
  '。'],
 ['当',
  '第一批',
  '欧洲人',
  '在',
  '1722年',
  '登上',
  '拉帕努伊岛',
  '时',
  '，',
  '摩艾',
  '雕像',
  '仍然',
  '存在',
  '，',
  '但',
  '树木',
  '已经',
  '消失',
  '。'],
 ['人口减少', '到了', '几千', '人', '，', '他们', '正', '努力', '维持', '生存', '。'],
 ['戴蒙德',
  '先生',
  '写

In [21]:
text="贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告。在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明。书中最令人不安的例子之一就是拉帕努伊。\
根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居。他们发展出了一个繁荣的社会，人口或许达到了1.5万人。他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点。当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失。人口减少到了几千人，他们正努力维持生存。戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种。他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃。\
这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境。乐观的是，作者指出，我们可以选择不在今天犯同样的错误。这本书写得很好，值得任何关心环境的人阅读。"

In [22]:
segmented_words=HanLP.parse(text, tasks='pos/pku')

In [23]:
area=["n","v","a","d"]#确定实词范围，名词、动词、形容词、副词

In [24]:
after= [[] for _ in range(len(segmented_words['pos/pku']))]

In [25]:
for i in range(len(segmented_words['pos/pku'])):
  for j in range(len(segmented_words['pos/pku'][i])):
    if segmented_words['pos/pku'][i][j] in area:
      after[i].append(segmented_words['tok/fine'][i][j])
after

[['新', '书', '崩溃', '是', '破坏', '环境', '后果', '明确'],
 ['作者', '描述', '环境', '崩溃', '文明'],
 ['最', '令', '人', '不安', '例子', '就是'],
 ['作者', '说法', '公元', '时候', '人', '定居'],
 ['发展', '出了', '繁荣', '社会', '人口', '或许', '达到', '人'],
 ['雕刻', '著名', '雕像', '利用', '可用', '巨大', '雕像', '运到', '岛', '不同', '地点'],
 ['欧洲人', '登上', '雕像', '仍然', '存在', '树木', '已经', '消失'],
 ['人口', '减少', '到了', '人', '正', '维持'],
 ['先生',
  '写道',
  '人',
  '农业',
  '目的',
  '清理',
  '土地',
  '过度',
  '捕猎',
  '岛',
  '曾经',
  '繁盛',
  '海鸟',
  '陆鸟',
  '物种'],
 ['推测', '导致', '内战', '社会'],
 ['书',
  '精彩',
  '也',
  '令',
  '人',
  '警醒',
  '告诉',
  '人类',
  '选择',
  '砍伐',
  '树木',
  '动物',
  '物种',
  '猎杀',
  '至',
  '灭绝',
  '来',
  '破坏',
  '环境'],
 ['乐观', '是', '作者', '指出', '可以', '选择', '不在', '犯', '错误'],
 ['书写', '好', '值得', '关心', '环境', '人', '阅读']]

In [26]:
from collections import Counter
#计算词频，也许可以生成一个字典
flat_words = [word for sublist in after for word in sublist]
word_counts = Counter(flat_words)
word_counts

Counter({'新': 1,
         '书': 2,
         '崩溃': 2,
         '是': 2,
         '破坏': 2,
         '环境': 4,
         '后果': 1,
         '明确': 1,
         '作者': 3,
         '描述': 1,
         '文明': 1,
         '最': 1,
         '令': 2,
         '人': 7,
         '不安': 1,
         '例子': 1,
         '就是': 1,
         '说法': 1,
         '公元': 1,
         '时候': 1,
         '定居': 1,
         '发展': 1,
         '出了': 1,
         '繁荣': 1,
         '社会': 2,
         '人口': 2,
         '或许': 1,
         '达到': 1,
         '雕刻': 1,
         '著名': 1,
         '雕像': 3,
         '利用': 1,
         '可用': 1,
         '巨大': 1,
         '运到': 1,
         '岛': 2,
         '不同': 1,
         '地点': 1,
         '欧洲人': 1,
         '登上': 1,
         '仍然': 1,
         '存在': 1,
         '树木': 2,
         '已经': 1,
         '消失': 1,
         '减少': 1,
         '到了': 1,
         '正': 1,
         '维持': 1,
         '先生': 1,
         '写道': 1,
         '农业': 1,
         '目的': 1,
         '清理': 1,
         '土地': 1,
         '过度': 1,

In [27]:
#计算每句话的词频，并储存到一个词频的list中
sentence_count=[]
for i in range(len(after)):
  count=0
  for j in after[i]:
    count+=word_counts[j]
  sentence_count.append(count/len(after[i]))
sentence_count

[1.875,
 2.2,
 2.1666666666666665,
 2.3333333333333335,
 2.0,
 1.4545454545454546,
 1.375,
 2.1666666666666665,
 1.5333333333333334,
 1.25,
 1.7894736842105263,
 1.4444444444444444,
 2.2857142857142856]

In [28]:
#从大到小排序
key_index=[]
so=sorted(sentence_count,reverse=True)
for i in range(len(sentence_count)):
  j=so.index(sentence_count[i])
  key_index.append(j)
key_index


[6, 2, 3, 0, 5, 9, 11, 3, 8, 12, 7, 10, 1]

In [29]:
#考虑索引中会出现重复的情况
standard=list(range(len(sentence_count)))
for i in range(len(sentence_count)):
  while standard[i] not in key_index:
    key_index[key_index.index(3)]+=1
key_index

[6, 2, 4, 0, 5, 9, 11, 3, 8, 12, 7, 10, 1]

In [30]:
#实现计算每个段的试题数量
def allocate(n,paragraph_infor):
  allocation=[]
  All=0
  for i in range(len(paragraph_infor)):
    All+=len(paragraph_infor[i])
  for i in range(len(paragraph_infor)):
    allocation.append(round((len(paragraph_infor[i])/All)*n))
  return allocation
allocation=allocate(5,paragraphs_infor)#第一个参数是试题总数量,返回每段的试题数量
allocation

[1, 3, 1]

1. 计算输入文本中每个句子的关键性，并根据关键性对句子进行排名，从最高开始。
2. 根据段落长度为每个段落分配考点配额。
3. 沿着关键性列表选择考点，同时遵守配额限制，如果候选句子所属的段落已经满足其配额，则拒绝该候选句子；如果检测到候选句子与已选考点句子具有相似意义，则拒绝该候选句子。如果在选择过程中没有可用的候选句子，则调整阈值。

In [31]:
#实现两句话直接的相似性对比——》完成相似度的比较--函数HanLP.semantic_textual_similarity()
threshold=0.8#设置阈值

In [32]:
#检验相似度函数
def similar(sentence,list,threshold):
  for i in range(len(list)):
    if HanLP.semantic_textual_similarity((sentence,list[i]))>threshold:
      return False
  return True

In [33]:
#设置题目数量
q_number=5
question=[]
i=0
paragraph_target=[0,0,0]
while i<q_number:
  target=key_index.index(i)
  target_k=paragraph_index[target]
  if paragraph_target[target_k-1]>allocation[target_k-1]:
    print("配额已满")
  if similar(sentence_infor[target],question,threshold) is False:
    print("相似度过高")
  if paragraph_target[target_k-1]<=allocation[target_k-1] and similar(sentence_infor[target],question,threshold):#根据配额分配
    question.append(sentence_infor[target])
    paragraph_target[target_k-1]+=1
  i+=1
  #检验相似度
question

['根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居',
 '这本书写得很好，值得任何关心环境的人阅读',
 '在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明',
 '人口减少到了几千人，他们正努力维持生存',
 '书中最令人不安的例子之一就是拉帕努伊']

In [34]:
key_index

[6, 2, 4, 0, 5, 9, 11, 3, 8, 12, 7, 10, 1]

In [35]:
sentence_infor

['贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告',
 '在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明',
 '书中最令人不安的例子之一就是拉帕努伊',
 '根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居',
 '他们发展出了一个繁荣的社会，人口或许达到了1.5万人',
 '他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点',
 '当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失',
 '人口减少到了几千人，他们正努力维持生存',
 '戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种',
 '他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃',
 '这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境',
 '乐观的是，作者指出，我们可以选择不在今天犯同样的错误',
 '这本书写得很好，值得任何关心环境的人阅读']

In [36]:
len(key_index)

13

In [37]:
sorted_list = [sentence_infor[key_index.index(i)] for i in range(len(key_index))]
sorted_list

['根据作者的说法，拉帕努伊在公元700年之后的某个时候由波利尼西亚人定居',
 '这本书写得很好，值得任何关心环境的人阅读',
 '在书中，作者描述了几个因自身选择及其对环境的影响而崩溃的文明',
 '人口减少到了几千人，他们正努力维持生存',
 '书中最令人不安的例子之一就是拉帕努伊',
 '他们发展出了一个繁荣的社会，人口或许达到了1.5万人',
 '贾雷德·戴蒙德的新书《崩溃》是对破坏环境后果的明确警告',
 '这本书虽然精彩，但也令人警醒，它告诉我们，在过去，人类选择通过砍伐所有树木和将动物物种猎杀至灭绝来破坏环境',
 '戴蒙德先生写道，拉帕努伊人为了农业和其他目的清理了土地，并且过度捕猎了岛上曾经繁盛的众多海鸟和陆鸟物种',
 '他们雕刻了著名的摩艾雕像，并利用可用的自然资源将这些巨大的雕像运到岛上的不同地点',
 '乐观的是，作者指出，我们可以选择不在今天犯同样的错误',
 '当第一批欧洲人在1722年登上拉帕努伊岛时，摩艾雕像仍然存在，但树木已经消失',
 '他推测，自然资源的枯竭导致了内战以及拉帕努伊社会的崩溃']