# 金刚经

## 基本
本文使用[Google Gemini API](https://gemini.google.com/app)来翻译和解读金刚经。原文来自于[HanYouyang](https://github.com/HanYouyang/Diamond-Sutra)。 
然而，Gemini在金刚经翻译上面的表现很一般。不建议使用。

## 实现细节
- 需要自己申请Google API key，并放到目录之下.env文件里面
-

In [1]:
# env
import getpass
import os

from dotenv import load_dotenv
load_dotenv()

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("Provide your Google API Key")

# proxy - comment out if not needed
os.environ['http_proxy'] = 'http://127.0.0.1:7890' 
os.environ['https_proxy'] = 'http://127.0.0.1:7890'
os.environ['all_proxy'] = 'socks5://127.0.0.1:7890'

In [2]:
from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(
    model="gemini-pro"
)

In [3]:
input_file = "./DiamondSutra/DiamondSutra-cn.md"
output_file = "./DiamondSutra/cn-to-cn.txt"

# input_file = "./DiamondSutra/DiamondSutra-en.md"
# output_file = "./DiamondSutra/en-to-cn.txt"

In [4]:
# 因为每一章大小比较合适，直接按照这个来分
# 如果每个块太大的话，超过token限制，可能出现问题
# 从结果来看，正好每一节都没有超过token的限制
from langchain.document_loaders import TextLoader

textLoader = TextLoader(input_file)
docs = textLoader.load()
print(docs)

from langchain.text_splitter import MarkdownHeaderTextSplitter

headers_to_split_on = [
    ("#", "Header 1"),
    ("##", "Header 2")
]

markdown_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on)
md_header_splits = markdown_splitter.split_text(docs[0].page_content)
md_header_splits

[Document(page_content='# 金刚经\n## 法会因由分第一\n如是我闻：\n\n一时佛在舍卫国祈树给孤独园，与大比丘众千二百五十人俱。尔时世尊，食时着衣持钵，入舍卫大城乞食。于其城中次第乞已，还至本处，饭食讫，收衣钵，洗足已，敷座而坐。\n\n## 善现启请分第二\n时长老须菩提，在大众中，即从座起，偏袒右肩，右膝着地，合掌恭敬而白佛言：“希有，世尊，如来善护念诸菩萨，善付嘱诸菩萨。世尊，善男子、善女人发阿耨多罗三藐三菩提心，云何应住？云何降伏其心？”\n\n佛言：“善哉，善哉，须菩提，如汝所说，如来善护念诸菩萨，善付嘱诸菩萨。汝今谛听，当为汝说。善男子、善女人，发阿耨多罗三藐三菩提心，应如是住，如是降伏其心。”\n\n“唯然，世尊，愿乐欲闻。”\n\n## 大乘正宗分第三\n佛告须菩提：”诸菩萨摩诃萨，应如是降伏其心：若有一切众生之类，若卵生，若胎生，若湿生，若化生，若有色，若无色，若有想，若无想，若非有想非无想，我皆令入无余涅槃而灭度之。如是灭度无量无数无边众生，实无众生得灭度者。何以故？须菩提，若菩萨有我相、人相、众生相、寿者相，即非菩萨。“\n\n## 妙行无住分第四\n“复次，须菩提，菩萨于法应无所住，行于布施。所谓不住色布施，不住声、香、味、触、法布施。须菩提，菩萨应如是布施，不住于相。何以故？若菩萨不住相布施，其福德不可思量。须菩提，于意云何？东方虚空可思量不？”\n\n“不也，世尊。”\n\n“须菩提，南西北方，四维上下虚空可思量不？”\n\n“不也，世尊。”\n\n“须菩提，菩萨无住相布施，福德亦复如是不可思量。须菩提，菩萨应如所教住。”\n\n## 如理实见分第五\n“须菩提，于意云何？可以身相见如来不？”\n\n“不也，世尊。不可以身相得见如来。何以故？如来所说身相，即非身相。”\n\n佛告须菩提：“凡所有相，皆是虚妄。若见诸相非相，即见如来。”\n\n## 正信希有分第六\n须菩提白佛言：“世尊，颇有众生，得闻如是言说章句，生实信不？”\n\n佛告须菩提：“莫作是说。如来灭后，后五百岁，有持戒修福者，于此章句能生信心，以此为实。当知是人，不于一佛、二佛、三四五佛而种善根，已于无量千万佛所种诸善根。闻是章句，乃至一念生净信者，须菩提，如来悉知悉见，是诸众生得如是无量福德。何以故？是诸众生，无复我相、人相、众生相、寿者相，

[Document(page_content='如是我闻：  \n一时佛在舍卫国祈树给孤独园，与大比丘众千二百五十人俱。尔时世尊，食时着衣持钵，入舍卫大城乞食。于其城中次第乞已，还至本处，饭食讫，收衣钵，洗足已，敷座而坐。', metadata={'Header 1': '金刚经', 'Header 2': '法会因由分第一'}),
 Document(page_content='时长老须菩提，在大众中，即从座起，偏袒右肩，右膝着地，合掌恭敬而白佛言：“希有，世尊，如来善护念诸菩萨，善付嘱诸菩萨。世尊，善男子、善女人发阿耨多罗三藐三菩提心，云何应住？云何降伏其心？”  \n佛言：“善哉，善哉，须菩提，如汝所说，如来善护念诸菩萨，善付嘱诸菩萨。汝今谛听，当为汝说。善男子、善女人，发阿耨多罗三藐三菩提心，应如是住，如是降伏其心。”  \n“唯然，世尊，愿乐欲闻。”', metadata={'Header 1': '金刚经', 'Header 2': '善现启请分第二'}),
 Document(page_content='佛告须菩提：”诸菩萨摩诃萨，应如是降伏其心：若有一切众生之类，若卵生，若胎生，若湿生，若化生，若有色，若无色，若有想，若无想，若非有想非无想，我皆令入无余涅槃而灭度之。如是灭度无量无数无边众生，实无众生得灭度者。何以故？须菩提，若菩萨有我相、人相、众生相、寿者相，即非菩萨。“', metadata={'Header 1': '金刚经', 'Header 2': '大乘正宗分第三'}),
 Document(page_content='“复次，须菩提，菩萨于法应无所住，行于布施。所谓不住色布施，不住声、香、味、触、法布施。须菩提，菩萨应如是布施，不住于相。何以故？若菩萨不住相布施，其福德不可思量。须菩提，于意云何？东方虚空可思量不？”  \n“不也，世尊。”  \n“须菩提，南西北方，四维上下虚空可思量不？”  \n“不也，世尊。”  \n“须菩提，菩萨无住相布施，福德亦复如是不可思量。须菩提，菩萨应如所教住。”', metadata={'Header 1': '金刚经', 'Header 2': '妙行无住分第四'}),
 Document(page_content='“须菩提，于意云何？可以身相见如来不？”  \n“不也，世尊。不可以身相得见如来。何

In [5]:
len(md_header_splits)

32

In [6]:
# test
# try to use langchain - gemini
# it will invoke safe error, sometimes
for index, chapter in enumerate(md_header_splits[:5]):
    prompt = f""" Translate the following classic Chinese to morden Chinese: \ ```{chapter.page_content}``` """ 

    print(f"Chapter {index+1}")
    result = llm.invoke(prompt)
    print(result.content)

Chapter 1
**原文：**

一时疏忽，二百五十钵乞次乞讫迭乞钵次乞讫

**现代文：**

一时疏忽，二百五十个乞丐一个接着一个地讨饭，一直讨到最后。
Chapter 2
当时年老的须菩提，在大众之中，从座位上起来，袒露右肩、右膝着地，合掌恭敬地向佛说：“稀有啊，世尊，如来善于爱护诸菩萨，善于嘱咐诸菩萨。世尊，善男子、善女人发阿耨多罗三藐三菩提心，应当如何安住？如何降伏自己的心？”

佛陀说：“善哉，善哉，须菩提，就像你所说的一样，如来善于爱护诸菩萨，善于嘱咐诸菩萨。你现在仔细听，我将为你解说。善男子、善女人，发阿耨多罗三藐三菩提心，应当这样安住，这样降伏自己的心。”

“是，世尊，我愿意乐意听闻。”
Chapter 3
 佛陀对须菩提说：“诸位菩萨摩诃萨，应当这样降伏自己的心：如果有一切种类的众生，无论是卵生、胎生、湿生、化生，有形色、无形色，有思想、无思想，既非有思想也非无思想，我都引导他们进入无余涅槃，使他们获得解脱。即使这样解脱了无数无边众生，实际上并没有众生真正获得解脱。为什么呢？须菩提，如果菩萨还有我执、人执、众生执、寿者执，那么他就不是真正的菩萨。”
Chapter 4
“再来，须菩提，菩萨对于佛法应该无所执着，行布施的时候。所谓不执着于色相而布施，不执着于声音、香气、味道、触觉、意念而布施。须菩提，菩萨应当像这样布施，不执着于外相。为什么呢？如果菩萨不执着于外相而布施，他的福德是无法想象的。须菩提，你觉得怎么样？东方虚空的大小可以想象吗？”

“不可以，世尊。”

“须菩提，南方、西方、北方，以及四面八方、上下虚空的大小可以想象吗？”

“不可以，世尊。”

“须菩提，菩萨不执着外相而布施，他的福德也是如此，无法想象。须菩提，菩萨应当按照我所说的教导而修行。”
Chapter 5
“须菩提，依你的看法，可以用身体形象来认识佛陀么？”“不能，世尊。不能用身体形象来认识佛陀。为什么呢？佛陀所说的身体形象，本来就不是身体形象。”佛告诉须菩提：“凡是所有的一切现象，都是虚幻的。如果你能看到现象不是现象，那么你就能看到佛陀。”


In [7]:
# Generation config
config = {"max_output_tokens": 2048, "temperature": 0.4, "top_p": 1, "top_k": 32}

# Safety config
# safety_config = {
#    generative_models.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: generative_models.HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
#    generative_models.HarmCategory.HARM_CATEGORY_HARASSMENT: generative_models.HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
#}

safety_config = [
    {
        "category": "HARM_CATEGORY_DANGEROUS",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_HARASSMENT",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_HATE_SPEECH",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
        "threshold": "BLOCK_NONE",
    },
    {
        "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
        "threshold": "BLOCK_NONE",
    },
]


In [8]:
# 直接使用 Gemini而不是langchain
import google.generativeai as genai
import os

genai.configure(
    api_key=os.environ.get("GOOGLE_API_KEY")
)
llm_gemini = genai.GenerativeModel(
    model_name = "gemini-pro",
    safety_settings=safety_config
)

In [22]:
f = open(output_file, "a")

for index, chapter in enumerate(md_header_splits[:]):
    prompt = f""" Suppose you are a translator, and your target language is modern Chinese, 
    not traditional Chinese. Your audience is Chinese native young students in Junior school about 13 years old. 
    Translate the following classic Chinese text to modern Chinese: \ ```{chapter.page_content}``` """ 
    
    prompt = f"""Translate the following English text to modern Chinese: \ ```{chapter.page_content}``` """ 

    print(f"Chapter {index+1}")
    f.write(f"\nChapter {index+1}\n")
    response = llm_gemini.generate_content(
        prompt,
        safety_settings=safety_config
    )

    # The `response.text` quick accessor only works for simple (single-`Part`) text responses. This response is not simple text
    # print(response.text)
    for p in response.parts:
        print(p.text)
        f.write(p.text.strip())

f.close()

Chapter 1
如是我聞：一時，佛住舍衛城祇樹給孤獨園，與大比丘眾千二百五十人俱。時，佛於夜半，著衣持鉢，入城乞食，迴來食已，洗足已，敷座而坐。正身正意，端坐念。時，諸比丘皆來詣佛所，恭敬頂禮，於一面坐。
Chapter 2
 这时一位名叫须菩提的出家弟子，从座位上站起来，他是出家中最受人尊敬的。他露出右肩，将右膝放在地上，然后双手合十，恭敬地鞠躬，然后对佛说：“世尊，您教导您的僧和居士们有那么多知识和智慧，这真是令人钦佩！您无私地并非常完美地照料我们的福利，这真是令人敬佩。”  
“世尊，我有一个问题要问您。如果善男信女们想要发展最高、最充实和最觉悟的心智，如果他们想要获得最高的圆满智慧，他们应该怎么做去帮助平息他们漂浮不定的心境并帮助降伏自己贪求的想法？”  
佛陀回答道：  
“如你所说的那样，须菩提。僧和居士们很幸运得到佛陀的支持和最崇高的教导。佛陀随时在关注着他的追随者的福利。聚精会神地听我讲话，我会回答你的问题。”  
“如果善男信女们想要发展最高、最充分和最觉悟的心智，如果他们希望获得最高的圆满智慧，平息他们漂浮不定的心境和降伏他们贪求的想法，那么他们应该按照我接下来要告诉你们的内容去做。遵照我接下来要告诉你们的内容去做的人，将能够降伏他们的分别心和贪欲。通过吸收和思考我接下来要教你们的教义，你们可以获得内心的完美平静和清晰。”  
然后，佛对大会讲话。
Chapter 3
“所有众生，无论生于卵生、胎生、湿生、化生；无论色、无色、有想、无想、非有想非无想，皆由我最终引导至寂静涅槃，彻底结束生与死的轮回。当所有不可胜数、无穷无尽的众生皆得解脱时，实则连一个众生都没有真正被解脱。”“何以故，须菩提？因若一个弟子仍执着于像自我、个性、自身、独立个体或遍在的自我亘古存在之类的任意幻觉，那么此人并非一个真正的弟子。”
Chapter 4
“此外，须菩提，在慈悲和布施的实践中，一个弟子应该超脱。也就是说，他在行慈悲和布施时，无需关注外表、无需关注形式、无需关注声音、气味、味道、触觉或任何形式的品质。须菩提，弟子们应这样行慈悲和布施。为什么？因为不执著地行慈悲和布施，是通向最高完美智慧的途径，是成为活佛的途径。”
“须菩提，你认为你可以丈量出东天所有的空间吗？”
“不，尊者。一个人不可能丈量出东天所有的空间。”
“须菩提，东西南北天，乃至上下所有的空间，都可以