# Document

> `Document`对象是`elasticsearch_dsl`中的一个类，用于表示`Elasticsearch`中的文档。它的参数可以包括文档中的`字段`、`类型`和`属性`等信息。

In [1]:
from elasticsearch_dsl import (
    connections, Index, Document, Text, Integer, Boolean, Keyword)

In [2]:
# 连接到 Elasticsearch
connection = connections.create_connection(hosts=["localhost"])

# 创建`Document`

以下是一个示例，演示如何使用`Document`对象创建一个`Elasticsearch`文档：

In [3]:
# 定义索引和映射
class Books(Document):
    title = Text()
    description = Text()
    category = Keyword()
    price = Integer()
    in_stock = Boolean()

    class Index:
        name = "books"

In [4]:
# 如果存在则删除已经创建的索引
if Index('books').exists():
    Index("books").delete()

在这个示例中，我们定义了一个名为`Books`的`Document`类，它具有`title、description、category、price和in_stock`五个字段。其中，

1. `Text`类型：`title、description`
1. `Integer`类型: `price`
1. `Keyword`类型: `category`
1. `Boolean`类型: `in_stock`

# 读取一些数据构建这个文档

In [5]:
import pandas as pd

df_books = pd.read_csv('./data/books.csv', encoding='gbk')
df_books

Unnamed: 0,title,description,category,price,in_stock
0,西游记,由明朝作家吴承恩创作，讲述了孙悟空、猪八戒、沙僧等人与唐僧师徒四人西天取经的故事。小说通过描...,小说,10,False
1,红楼梦,由清朝作家曹雪芹创作，被誉为中国古代小说的巅峰之作。小说描绘了贾宝玉、林黛玉等人的生活，以及...,小说,20,True
2,水浒传,由明朝作家施耐庵创作，讲述了宋朝末年一群落难英雄在梁山泊起义反抗统治者的故事。小说通过塑造众...,小说,45,False
3,三国演义,由明朝作家罗贯中创作，讲述了三国时期的历史故事。小说通过描绘曹操、刘备、孙权等历史人物的生活...,小说,30,True
4,创意者的突破,"（""The Innovators: How a Group of Hackers, Geni...",传记,10,False
5,追风筝的人,"（""The Kite Runner""）：由卡勒德·胡赛尼（Khaled Hosseini）所...",传记,20,True
6,马拉拉的故事,"（""I Am Malala: The Girl Who Stood Up for Educa...",传记,45,False
7,爱因斯坦传,"（""Einstein: His Life and Universe""）：由沃尔特·艾萨克森所...",传记,35,True
8,Python,Python elastic search,工具,47,True
9,Term,Term-context,test,5,False


## 构建文档

实例化`Books`，并设置了`title, description, category, price, in_stock`5个字段的值。

In [7]:
data = df_books.iloc[0, :]
print(data)
book = Books(
    title=data.title, description=data.description, 
    category=data.category, price=data.price, in_stock=data.in_stock)

title                                                        西游记
description    由明朝作家吴承恩创作，讲述了孙悟空、猪八戒、沙僧等人与唐僧师徒四人西天取经的故事。小说通过描...
category                                                      小说
price                                                         10
in_stock                                                   False
Name: 0, dtype: object


## 批量保存

然后调用`.save()`方法将这个文档保存到`Elasticsearch`，下面写了一个`for-loop`，将全部数据保存到`book`index。

In [8]:
for row_no, row in df_books.iterrows():
    book = Books(
        title=row.title, description=row.description, 
        category=row.category, price=row.price, in_stock=row.in_stock)
    book.save()

------