# 全部采用本地化部署的方式和开源模型来建立的问答能力和本地化知识库集成的能力

定义语言模型

In [1]:
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True).half().cuda()
model = model.eval()

  from .autonotebook import tqdm as notebook_tqdm


No compiled kernel found.
Compiling kernels : /home/xiaodong/.cache/huggingface/modules/transformers_modules/THUDM/chatglm-6b-int4/02a065cf2797029c036a02cac30f1da1a9bc49a3/quantization_kernels_parallel.c
Compiling gcc -O3 -fPIC -pthread -fopenmp -std=c99 /home/xiaodong/.cache/huggingface/modules/transformers_modules/THUDM/chatglm-6b-int4/02a065cf2797029c036a02cac30f1da1a9bc49a3/quantization_kernels_parallel.c -shared -o /home/xiaodong/.cache/huggingface/modules/transformers_modules/THUDM/chatglm-6b-int4/02a065cf2797029c036a02cac30f1da1a9bc49a3/quantization_kernels_parallel.so
Load kernel : /home/xiaodong/.cache/huggingface/modules/transformers_modules/THUDM/chatglm-6b-int4/02a065cf2797029c036a02cac30f1da1a9bc49a3/quantization_kernels_parallel.so
Setting CPU quantization kernel threads to 6
Using quantization cache
Applying quantization to glm layers


按照langchain标准进行模型封装

In [2]:
from langchain.llms.base import LLM
from typing import Optional, List, Mapping, Any
from llama_index import LLMPredictor

class CustomLLM(LLM):

    def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
        response, history = model.chat(tokenizer, prompt, history=[])
        # only return newly generated tokens
        return response

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        return {"name_of_model": "THUDM/chatglm-6b-int4"}

    @property
    def _llm_type(self) -> str:
        return "custom"
    
llm_predictor = LLMPredictor(llm=CustomLLM())



引入embedding模型

In [3]:
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from llama_index import LangchainEmbedding

embed_model = LangchainEmbedding(HuggingFaceEmbeddings(
    model_name="sentence-transformers/paraphrase-multilingual-mpnet-base-v2"
))

定义包含embedding模型和语言模型的Service Context

In [4]:
from llama_index import ServiceContext

service_context = ServiceContext.from_defaults(embed_model=embed_model, llm_predictor=llm_predictor)

构建本地知识库（本地知识的索引库）

In [5]:
from langchain.text_splitter import CharacterTextSplitter
from llama_index import SimpleDirectoryReader
from llama_index import GPTVectorStoreIndex
from llama_index.node_parser import SimpleNodeParser

text_splitter = CharacterTextSplitter(separator="\n\n", chunk_size=100, chunk_overlap=20)
parser = SimpleNodeParser(text_splitter=text_splitter)
documents = SimpleDirectoryReader('./data/faq/').load_data()
nodes = parser.get_nodes_from_documents(documents)


index = GPTVectorStoreIndex(nodes=nodes, service_context=service_context)
query_engine = index.as_query_engine()

Created a chunk of size 130, which is longer than the specified 100


结合本地知识库和语言模型进行提问

In [6]:
question = """
请用中文回答下述问题：

Q: 你们能配送到天津吗？另外，你们的退货政策是怎样的？
"""
response = query_engine.query(question)
print(response)

The dtype of attention mask (torch.int64) is not bool


A: 我们的配送范围是全国大部分省份，包括北京、上海、天津、重庆、河北、山西、辽宁、吉林、黑龙江、江苏、浙江、安徽、福建、江西、山东、河南、湖北、湖南、广东、海南、四川、贵州、云南、陕西、甘肃、青海、台湾、内蒙古、广西、西藏、宁夏和新疆。因此，天津是我们可以配送的地区之一。至于退货政策，请参考我们的用户手册，每个订单的情况可能不同，因此具体的政策可能会因订单而异。


In [7]:
question = """
请用中文回答下述问题：

Q: 请介绍一下ChatGLM？
"""
response = query_engine.query(question)
print(response)

ChatGLM-6B 是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型 GLM-6B 开发的，我的任务是针对用户的问题和要求提供适当的答复和支持。


In [8]:
question = """
请用中文回答下述问题：

Q: 请介绍一下语言模型中的Alpaca。
"""
response = query_engine.query(question)
print(response)

Alpaca是一个基于深度学习的自然语言处理模型，由Google开发。它被设计为能够处理自然语言，并能够像人类一样理解、阅读、翻译和生成文本。Alpaca采用了与BERT类似的架构，但是与BERT不同的是，BERT是为了解决语言模型在处理长句子和多任务学习上的问题，而Alpaca的目标是在大规模数据集上实现高效的自然语言理解和生成。

Alpaca采用了多种技术，包括上下文无关文法(Context-Free Language)、词向量(Word Embeddings)、自注意力机制(Self-Attention)、和基于Transformer架构的编码器-解码器模型。这些技术使得Alpaca能够在处理大规模文本数据集时表现出色，如处理维基百科、新闻报道、电子邮件等数据集时，取得了良好的效果。

Alpaca的应用广泛，已经被应用于自然语言处理、机器翻译、文本生成、智能客服等领域。


In [9]:
question = """
请用中文回答下述问题：

Q: 请写一段python代码，展示如何使用Alpaca的模型在本地GPU运行支持语言任务的能力。
"""
response = query_engine.query(question)
print(response)

Alpaca 是一个开源的语言模型，可以在本地 GPU 上运行。以下是一个 Python 代码示例，展示了如何使用 Alpaca 模型在本地 GPU 上运行支持语言任务的能力：
```python
from alpaca_model_manager import ModelManager

# 创建 Alpaca 模型
manager = ModelManager()

# 获取 Alpaca 模型的参数
model_params = manager.get_model_params()

# 获取模型的权重
model_weights = model_params['weights']

# 使用模型训练语言任务
model_manager.train_text(
    text_dataset,
    text_model,
    model_weights,
    num_epochs=10,
    data_dir='/path/to/local/data',
    data_per_device=1,
    device='GPU'
)
```
在这个示例中，我们首先创建了一个 Alpaca 模型的实例，然后获取了模型的参数和权重。接着，我们使用模型训练语言任务，将训练数据移动到本地 GPU 上，并设置数据访问权限。最后，我们使用模型的参数和权重对语言任务进行训练。


使用新的TextSplitter来对原始内容进行处理，换一个新的index来处理索引，对文章进行总结

In [10]:
from langchain.text_splitter import SpacyTextSplitter

new_text_splitter = SpacyTextSplitter(pipeline="zh_core_web_sm", chunk_size = 2048)
new_parser = SimpleNodeParser(text_splitter=new_text_splitter)
new_documents = SimpleDirectoryReader('./data/mr_fujino').load_data()
new_nodes = new_parser.get_nodes_from_documents(new_documents)



In [11]:
from llama_index import GPTListIndex

list_index = GPTListIndex(nodes=new_nodes, service_context=service_context)

# response = list_index.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:", response_mode="tree_summarize")

query_engine = list_index.as_query_engine(
    response_mode="tree_summarize"
)
response = query_engine.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:")

print(response)

Token indices sequence length is longer than the specified maximum sequence length for this model (1680 > 1024). Running this sequence through the model will result in indexing errors


这段文字是鲁迅先生的《藤野先生》节选。以下是对这段文字的总结：

我还记得东京的樱花烂熳的时节，我去了仙台医学专门学校。开始在学生宿舍里住，后来搬到了一个远离监狱的地方，每天过得并不怎么样，但是遇到了一些有趣的人物和经历。

我一开始在学生宿舍里住，那里很热，蚊子很多，但我每天过得并不怎么样，但遇到了一些有趣的人物。我遇到了一个中国的留学生，我们一起上课、考试，还去喝酒。

后来，我搬到了一个远离监狱的地方，每天过得并不怎么样，但遇到了一些有趣的人物。我遇到了一些留学生，我们一起上课、考试，还去喝酒。

我虽然遇到了很多有趣的人物，但是最终也明白了一些事情。我最终明白了藤野先生的穿衣风格，以及他对学生的严格要求。我也明白了学习的重要性，以及在困难时期要坚持的信念。

这段文字是鲁迅先生在回忆自己的学运经历，讲述了自己在中国的一次学运中的经历，以及对自己的影响。在这段文字中，作者描绘了自己与同学一起讨论中国女性裹脚的问题，被老师误解，被同学嘲笑，但最终还是理解了老师和同学的心情，感受到了他们对中国的热爱。作者也描述了自己参观枪毙中国人的命运，被中国人欢呼声所刺耳，感受到了中国弱国的事实，以及日本战胜俄国的情形。作者还回忆了与藤野先生的对话，表达了自己对藤野先生对中国传统文化的热爱和尊重，以及藤野先生对自己的误解和失望。整段文字表达了作者对中国传统文化的热爱和对自己成长经历的思考。


换用TreeIndex来试试效果

In [12]:
from llama_index import GPTTreeIndex

# define LLM
tree_index = GPTTreeIndex(nodes=new_nodes, service_context=service_context)
# response = tree_index.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:", mode="summarize")

#query_engine = tree_index.as_query_engine(
#    response_mode="summarize"
#)

query_engine = tree_index.as_query_engine()

response = query_engine.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:")

print(response)

鲁迅在日本仙台医学专门学校读书时的老师藤野先生是一位来自日本的解剖学教授，他让我们在学生之间轮流抄他讲义，并在最后让我们把讲义送给他。他对我们的教育很用心，但我们却经常不用功，有些任性。最后，他的讲义被我们全部推翻，重新用红笔添改过，并达到了他想要的效果。

藤野先生还让我们在学生之间轮流抄他讲义，并最后让我们把讲义送给他。虽然我们都有些任性，但他对我们的教育很用心，对我们的教育很用心，但我们却经常不用功，有些任性。最后，他的讲义被我们全部推翻，重新用红笔添改过，并达到了他想要的效果。

学年试验完毕之后，鲁迅去了东京玩一夏天，秋初再回学校，成绩早已发表了，同学一百余人之中，他在中间，不过是没有落第。这回藤野先生所担任的功课，是解剖实习和局部解剖学。

藤野先生也偶有使我很为难的时候。他听说中国的女人是裹脚的，但不知道详细，所以要问我怎么裹法，足骨变成怎样的畸形，还叹息道，“总要看一看才知道。

究竟是怎么一回事呢？”

有一天，本级的学生会干事到我寓里来了，要借我的讲义看。鲁迅检出来交给他们，却只翻检了一通，并没有带走。但他们一走，邮差就送到一封很厚的信，打开后，第一句是：“你改悔罢！”这是《新约》上的句子，但经托尔斯泰新近引用过的。


尝试Vector Store - pinecone

In [13]:
'''
# 目前这个不分不工作
import pinecone
from llama_index import StorageContext
from llama_index.vector_stores import PineconeVectorStore
import os

# pinecone_api_key = os.environ.get("PINECONE_API_KEY")
# pinecone_env = os.environ.get("PINECONE_ENV")

pinecone_api_key = os.environ['PINECONE_API_KEY']
pinecone_env = os.environ['PINECONE_ENV']


# init pinecone
pinecone.init(pinecone_api_key, pinecone_env)
pinecone.create_index("xdtest1", dimension=1536, metric="cosine", pod_type="p1") # pinecone.create_index("quickstart", dimension=1536, metric="euclidean", pod_type="p1")

# construct vector store and customize storage context
storage_context = StorageContext.from_defaults(
    vector_store = PineconeVectorStore(pinecone.Index("xdtest1"))
)

# Load documents and build index
documents_p = SimpleDirectoryReader('./data/mr_fujino').load_data()
index_p = GPTVectorStoreIndex.from_documents(documents_p, service_context=service_context, storage_context=storage_context)

query_engine = index_p.as_query_engine()

response = query_engine.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:")

print(response)
'''

'\n# 目前这个不分不工作\nimport pinecone\nfrom llama_index import StorageContext\nfrom llama_index.vector_stores import PineconeVectorStore\nimport os\n\n# pinecone_api_key = os.environ.get("PINECONE_API_KEY")\n# pinecone_env = os.environ.get("PINECONE_ENV")\n\npinecone_api_key = os.environ[\'PINECONE_API_KEY\']\npinecone_env = os.environ[\'PINECONE_ENV\']\n\n\n# init pinecone\npinecone.init(pinecone_api_key, pinecone_env)\npinecone.create_index("xdtest1", dimension=1536, metric="cosine", pod_type="p1") # pinecone.create_index("quickstart", dimension=1536, metric="euclidean", pod_type="p1")\n\n# construct vector store and customize storage context\nstorage_context = StorageContext.from_defaults(\n    vector_store = PineconeVectorStore(pinecone.Index("xdtest1"))\n)\n\n# Load documents and build index\ndocuments_p = SimpleDirectoryReader(\'./data/mr_fujino\').load_data()\nindex_p = GPTVectorStoreIndex.from_documents(documents_p, service_context=service_context, storage_context=storage_context)\n\

Faiss Vector Store的使用

In [4]:
import logging
import sys

logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

In [5]:
from langchain.vectorstores import FAISS
from langchain.document_loaders import UnstructuredFileLoader, TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

em_model = "GanymedeNil/text2vec-large-chinese"
em_device = "cuda"

hgf_embeddings = HuggingFaceEmbeddings(model_name=em_model,
                                        model_kwargs={'device': em_device})

import re

# 文本分句长度
SENTENCE_SIZE = 100

class ChineseTextSplitter(CharacterTextSplitter):
    def __init__(self, pdf: bool = False, sentence_size: int = SENTENCE_SIZE, **kwargs):
        super().__init__(**kwargs)
        self.pdf = pdf
        self.sentence_size = sentence_size

    def split_text1(self, text: str) -> List[str]:
        if self.pdf:
            text = re.sub(r"\n{3,}", "\n", text)
            text = re.sub('\s', ' ', text)
            text = text.replace("\n\n", "")
        sent_sep_pattern = re.compile('([﹒﹔﹖﹗．。！？]["’”」』]{0,2}|(?=["‘“「『]{1,2}|$))')  # del ：；
        sent_list = []
        for ele in sent_sep_pattern.split(text):
            if sent_sep_pattern.match(ele) and sent_list:
                sent_list[-1] += ele
            elif ele:
                sent_list.append(ele)
        return sent_list

    def split_text(self, text: str) -> List[str]:   ##此处需要进一步优化逻辑
        if self.pdf:
            text = re.sub(r"\n{3,}", r"\n", text)
            text = re.sub('\s', " ", text)
            text = re.sub("\n\n", "", text)

        text = re.sub(r'([;；.!?。！？\?])([^”’])', r"\1\n\2", text)  # 单字符断句符
        text = re.sub(r'(\.{6})([^"’”」』])', r"\1\n\2", text)  # 英文省略号
        text = re.sub(r'(\…{2})([^"’”」』])', r"\1\n\2", text)  # 中文省略号
        text = re.sub(r'([;；!?。！？\?]["’”」』]{0,2})([^;；!?，。！？\?])', r'\1\n\2', text)
        # 如果双引号前有终止符，那么双引号才是句子的终点，把分句符\n放到双引号后，注意前面的几句都小心保留了双引号
        text = text.rstrip()  # 段尾如果有多余的\n就去掉它
        # 很多规则中会考虑分号;，但是这里我把它忽略不计，破折号、英文双引号等同样忽略，需要的再做些简单调整即可。
        ls = [i for i in text.split("\n") if i]
        for ele in ls:
            if len(ele) > self.sentence_size:
                ele1 = re.sub(r'([,，.]["’”」』]{0,2})([^,，.])', r'\1\n\2', ele)
                ele1_ls = ele1.split("\n")
                for ele_ele1 in ele1_ls:
                    if len(ele_ele1) > self.sentence_size:
                        ele_ele2 = re.sub(r'([\n]{1,}| {2,}["’”」』]{0,2})([^\s])', r'\1\n\2', ele_ele1)
                        ele2_ls = ele_ele2.split("\n")
                        for ele_ele2 in ele2_ls:
                            if len(ele_ele2) > self.sentence_size:
                                ele_ele3 = re.sub('( ["’”」』]{0,2})([^ ])', r'\1\n\2', ele_ele2)
                                ele2_id = ele2_ls.index(ele_ele2)
                                ele2_ls = ele2_ls[:ele2_id] + [i for i in ele_ele3.split("\n") if i] + ele2_ls[
                                                                                                       ele2_id + 1:]
                        ele_id = ele1_ls.index(ele_ele1)
                        ele1_ls = ele1_ls[:ele_id] + [i for i in ele2_ls if i] + ele1_ls[ele_id + 1:]

                id = ls.index(ele)
                ls = ls[:id] + [i for i in ele1_ls if i] + ls[id + 1:]
        return ls

filepath = "data/faq/ecommerce_faq.txt"
loader = TextLoader(filepath)
textsplitter = ChineseTextSplitter(pdf=False, sentence_size=SENTENCE_SIZE)
docs = loader.load_and_split(textsplitter)

vs_path = "./vector_storage"
faiss_vector_store = FAISS.from_documents(docs, hgf_embeddings)


INFO:sentence_transformers.SentenceTransformer:Load pretrained SentenceTransformer: GanymedeNil/text2vec-large-chinese
Load pretrained SentenceTransformer: GanymedeNil/text2vec-large-chinese
No sentence-transformers model found with name /home/xiaodong/.cache/torch/sentence_transformers/GanymedeNil_text2vec-large-chinese. Creating a new one with MEAN pooling.


Batches: 100%|██████████| 3/3 [00:01<00:00,  1.58it/s]

INFO:faiss.loader:Loading faiss with AVX2 support.
Loading faiss with AVX2 support.
INFO:faiss.loader:Could not load library with AVX2 support due to:
ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")
Could not load library with AVX2 support due to:
ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")
INFO:faiss.loader:Loading faiss.
Loading faiss.
INFO:faiss.loader:Successfully loaded faiss.
Successfully loaded faiss.





In [6]:
faiss_vector_store.save_local(vs_path)

faiss_vector_store = FAISS.load_local(vs_path, hgf_embeddings)
query_faiss = "配送范围是？"
result_docs = faiss_vector_store.similarity_search(query=query_faiss)
print(result_docs[0].page_content)

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.47it/s]

Q: 支持哪些省份配送？





In [10]:
from langchain.chains import RetrievalQA

'''
chain_type：chain类型
    stuff: 这种最简单粗暴，会把所有的 document 一次全部传给 llm 模型进行总结。如果document很多的话，势必会报超出最大 token 限制的错，所以总结文本的时候一般不会选中这个。
    map_reduce: 这个方式会先将每个 document 进行总结，最后将所有 document 总结出的结果再进行一次总结。
    refine: 这种方式会先总结第一个 document，然后在将第一个 document 总结出的内容和第二个 document 一起发给 llm 模型在进行总结，以此类推。这种方式的好处就是在总结后一个 document 的时候，会带着前一个的 document 进行总结，给需要总结的 document 添加了上下文，增加了总结内容的连贯性。
    这种一般不会用在总结的 chain 上，而是会用在问答的 chain 上，他其实是一种搜索答案的匹配方式。首先你要给出一个问题，他会根据问题给每个 document 计算一个这个 document 能回答这个问题的概率分数，然后找到分数最高的那个 document ，在通过把这个 document 转化为问题的 prompt 的一部分（问题+document）发送给 llm 模型，最后 llm 模型返回具体答案。

'''

qa = RetrievalQA.from_chain_type(llm=model, chain_type="stuff", retriever=faiss_vector_store.as_retriever())
qa.run(query_faiss)


ValidationError: 1 validation error for LLMChain
llm
  value is not a valid dict (type=type_error.dict)

In [24]:
import faiss
from llama_index.vector_stores.faiss import FaissVectorStore
from llama_index.storage.docstore import SimpleDocumentStore
from llama_index.storage.index_store import SimpleIndexStore
from llama_index import StorageContext, load_index_from_storage

new_text_splitter = SpacyTextSplitter(pipeline="zh_core_web_sm", chunk_size = 2048)
new_parser = SimpleNodeParser(text_splitter=new_text_splitter)
new_documents = SimpleDirectoryReader('./data/mr_fujino').load_data()
new_nodes = new_parser.get_nodes_from_documents(new_documents)

dimention_faiss = 1536
faiss_index = faiss.IndexFlatL2(dimention_faiss)

vector_store = FaissVectorStore(faiss_index=faiss_index)
storage_context = StorageContext.from_defaults( docstore=SimpleDocumentStore(), vector_store=vector_store, index_store=SimpleIndexStore())
storage_context.docstore.add_documents(new_nodes)
index_by_faiss = GPTVectorStoreIndex(new_nodes, storage_context=storage_context, service_context=service_context)

index_by_faiss.storage_context.persist()


Batches: 100%|██████████| 1/1 [00:00<00:00, 38.11it/s]


AssertionError: 

In [None]:
# load index from disk
vector_store_loaded = FaissVectorStore.from_persist_dir('./storage')
# 下面这个部分必须要提供persist_dir这个路径，似乎缺省不起作用
storage_context_loaded = StorageContext.from_defaults(vector_store=vector_store_loaded, persist_dir="./storage")
index_by_faiss_loaded = load_index_from_storage(storage_context=storage_context_loaded)

query_engine = index_by_faiss_loaded.as_query_engine()
response = query_engine.query("下面鲁迅先生以第一人称‘我’写的内容，请你用中文总结一下:")

print(response)

INFO:root:Loading llama_index.vector_stores.faiss from ./storage/vector_store.json.
Loading llama_index.vector_stores.faiss from ./storage/vector_store.json.
INFO:llama_index.indices.loading:Loading all indices.
Loading all indices.
INFO:llama_index.token_counter.token_counter:> [retrieve] Total LLM token usage: 0 tokens
> [retrieve] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [retrieve] Total embedding token usage: 57 tokens
> [retrieve] Total embedding token usage: 57 tokens
INFO:llama_index.token_counter.token_counter:> [get_response] Total LLM token usage: 2220 tokens
> [get_response] Total LLM token usage: 2220 tokens
INFO:llama_index.token_counter.token_counter:> [get_response] Total embedding token usage: 0 tokens
> [get_response] Total embedding token usage: 0 tokens

鲁迅先生回忆了他在仙台的经历，他曾经被藤野先生教导，但最终决定不学医学，而是去学生物学。藤野先生有些悲哀，但他叮嘱鲁迅先生将来照相并及时通信告诉他此后的状况。然而，鲁迅先生多年没有照相，也没有写信，从藤野先生的角度看，他已经杳无消息。最后


Prompt template的支持

In [20]:
from llama_index import QuestionAnswerPrompt

# load documents
new_documents = SimpleDirectoryReader('./data/mr_fujino').load_data()

# define custom QuestionAnswerPrompt
query_str = "请问你们海南能发货吗？"
QA_PROMPT_TMPL = (
    "请参考如下上下文信息. \n"
    "---------------------\n"
    "{context_str}"
    "\n---------------------\n"
    "基于这样的上下文信息，请回答: {query_str}\n"
)
QA_PROMPT = QuestionAnswerPrompt(QA_PROMPT_TMPL)
# Build GPTVectorStoreIndex
index = GPTVectorStoreIndex.from_documents(new_documents, service_context=service_context)

query_engine = index.as_query_engine(
    text_qa_template=QA_PROMPT
)
response = query_engine.query(query_str)
print(response)

Batches: 100%|██████████| 1/1 [00:00<00:00, 23.92it/s]

INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total LLM token usage: 0 tokens
> [build_index_from_nodes] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [build_index_from_nodes] Total embedding token usage: 7055 tokens
> [build_index_from_nodes] Total embedding token usage: 7055 tokens



Batches: 100%|██████████| 1/1 [00:00<00:00, 217.24it/s]

INFO:llama_index.token_counter.token_counter:> [retrieve] Total LLM token usage: 0 tokens
> [retrieve] Total LLM token usage: 0 tokens
INFO:llama_index.token_counter.token_counter:> [retrieve] Total embedding token usage: 24 tokens
> [retrieve] Total embedding token usage: 24 tokens





INFO:llama_index.token_counter.token_counter:> [get_response] Total LLM token usage: 2122 tokens
> [get_response] Total LLM token usage: 2122 tokens
INFO:llama_index.token_counter.token_counter:> [get_response] Total embedding token usage: 0 tokens
> [get_response] Total embedding token usage: 0 tokens
根据上下文信息，可以看出作者在谈论自己的旅行经历和在日本的经历。在藤野先生的段落中，作者提到了东京的樱花烂熳，但同时也提到了留学生的速成班。因此，可以推断藤野先生所在的段落讨论的并非樱花，而是留学生。此外，在藤野先生的段落中，作者提到了仙台医学专门学校，并在此讲述了自己的旅行经历。因此，可以得出结论，作者并没有提到海南或任何与海南相关的事物，因此，回答是：不能。
