In [1]:
import akasha
import os
# import PyPDF2
from time import time
import requests
from bs4 import BeautifulSoup
import json

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model = "openai:gpt-4o"

In [3]:
QA = akasha.Doc_QA(model=model, max_doc_len=8000)
summary = akasha.Summary(chunk_size=1000, max_doc_len=7000)

In [4]:
system_prompt = "你是一個非常擅長寫報告的電池產業專業人員，你會根據指定的格式來生成報告，且內容會完全符合指定的主題。若你無法回答會告訴我原因。"
titles = {
    "全球電池市場概況": [
        "市場規模與增長趨勢",
        "主要市場區域分析",
        "主要企業概況",
    ],
    "技術發展趨勢": [
        "鋰離子電池技術進展",
        "固態電池技術",
        "其他新興電池技術",
    ],
    "應用領域與市場機會": [
        "電動車市場",
        "消費電子產品",
        "能源儲存系統",
        "工業及其他應用",
        "市場需求預測",
        "市場挑戰與機遇",
    ],
    "政策與供應鏈分析": [
        "各國政策支持與法規要求",
        "環保與回收政策",
        "供應鏈與原材料供應",
        "產業佈局與投資趨勢",
    ]
}

links = [
    "https://www.maonline.com.tw/article_inside.php?i=798",
    "https://www.materialsnet.com.tw/DocView.aspx?id=53579",
    "https://ic.tpex.org.tw/introduce.php?ic=E000",
    "https://ieknet.iek.org.tw/ieknews/news_open.aspx?actiontype=ieknews&indu_idno=5&nsl_id=1039fffa4a7d408cb3f5c579762637e1",
    "https://yez.one/post/batterycell",
    "https://www.thenewslens.com/article/181546"
]

theme = "電池產業的發展趨勢"
# titles = ["企業前瞻"]

In [5]:
def export_dict_to_json(dictionary, filename):
    with open(filename, 'w', encoding='utf-8') as f:
        json.dump(dictionary, f, ensure_ascii=False, indent=4)

def import_dict_from_json(filename):
    with open(filename, 'r', encoding='utf-8') as f:
        return json.load(f)

In [6]:
result = import_dict_from_json("result.json")

In [20]:
start_time = time()

def generate_report(theme, titles, links, rerun_process=False):
    result = {}
    contexts = []
    for title, subtitle in titles.items():
        format_prompt = f"以{theme}為主題，請你總結撰寫出與\"{title}\"相關的內容，其中需包含{subtitle}，不需要結論，不需要回應要求。"
        for link in links:
            str_len = len("Processing link: " + link) + 1
            print("#" * str_len)
            print("Processing link: ", link)
            print("#" * str_len)

            try:
                response = requests.get(link)
                response.raise_for_status()
                soup = BeautifulSoup(response.content, 'html.parser')
                texts = soup.get_text()
            except requests.exceptions.RequestException as e:
                print(f"An error occurred: {e}")
                texts = ''

            contexts.append(
                summary.summarize_articles(
                    articles=texts,
                    format_prompt=format_prompt,
                )
            )

        response = QA.ask_self(
            prompt=f"將此內容以客觀角度進行融合，避免使用\"報告中提到\"相關詞彙，避免修改專有名詞，避免做出總結，\
                        直接撰寫內容，避免回應要求。",
            info=contexts,
            model="openai:gpt-4"
        )
        if rerun_process:
            return response
        result[title] = response
        contexts = []

        print(f"----------integrated summary of {title}----------")
        print(response + "\n")
    return result


result = generate_report(theme, titles, links)
previous_result = ""
for value in result.values():
    previous_result += value

result["內容摘要"] = summary.summarize_articles(
    articles=previous_result,
    format_prompt=f"將內容以{theme}為主題進行摘要，將用字換句話說，意思不變，不需要結論，不需要回應要求。",
    summary_len=500
)

export_dict_to_json(result, "result.json")

total_time = time() - start_time

######################################################################
Processing link:  https://www.maonline.com.tw/article_inside.php?i=798
######################################################################


Reduce_map Summary: 100%|██████████| 1/1 [00:03<00:00,  3.49s/it]


根據全球電池市場的概況，市場規模與增長趨勢顯示鋰電池市場將保持快速增長。主要市場區域分析指出臺灣的鋰電池供應鏈市場發展與全球一致，但產品發展速度已經落後。主要企業概況則提到了臺灣三大集團投入巨資興建電池芯廠的計劃，同時也指出臺灣在鋰電池市場上面臨著技術不夠成熟、應用市場規模太小等限制因素。 




#######################################################################
Processing link:  https://www.materialsnet.com.tw/DocView.aspx?id=53579
#######################################################################


KeyboardInterrupt: 

In [13]:
result["內容摘要"] = summary.summarize_articles(
    articles=previous_result,
    format_prompt=f"將內容以{theme}為主題進行摘要，將用字換句話說，意思不便，不需要結論，不需要回應要求。",
    summary_len=500
)

Reduce_map Summary: 100%|██████████| 1/1 [00:14<00:00, 14.05s/it]


全球電池市場正處於快速增長階段，2022年至2030年預計鋰電池市場將快速增長，市值將達到4000億美元，年增率達到33%。中國、歐洲和美國被認為是主要的成長區域，這些地區對於電動車、儲能系統和消費電子產品的需求持續增加，推動了電池市場的快速發展。在臺灣，三大集團投入巨資興建電池芯廠，但仍需加快腳步以應對市場需求。全球電池市場的競爭激烈，企業需要不斷提升技術和產能以滿足市場需求。

液流電池產業的活力和重要性，吸引了來自19個國家的300名與會者。預估液流電池在儲能技術中的應用將會增加，並且中國、南韓、澳大利亞、英國和美國等地的液流電池系統建置和投資計畫，顯示了這些國家在液流電池領域的活躍程度。釩液流公司近期發展狀況，以及非釩液流電池的發展和海報發表研發方向分析，突顯了液流電池領域的企業活動和技術發展。

全球電池市場正處於快速增長階段，主要受到電動車和可再生能源的推動。預計未來幾年全球電池市場將保持穩健增長，預計到2025年將達到數千億美元的規模。全球電池市場的主要市場區域包括亞太地區、歐洲和北美。亞太地區在全球電池市場中佔有主導地位，這主要是由於中國和日本等國家在電動車和儲能系統方面的快速發展。歐洲市場則受到政府對可再生能源和電動交通的支持，預計將成為未來的增長引擎。而北美市場則受到電動車市場的快速擴大和對清潔能源的需求推動。全球電池市場的競爭格局主要由幾家主要企業主導，包括特斯拉、東芝、LG化學、三星SDI、寧德時代等。此外，許多新興企業也在積極進入電池市場，推動了市場的競爭和創新。

全球電池市場的發展趨勢與市場機會主要集中在電動車市場、消費電子產品、能源儲存系統、工業及其他應用等領域。隨著電動車和能源儲存系統的快速發展，對鋰電池等產品的需求將持續增加。然而，市場挑戰與機遇並存，鋰電池供應鏈面臨著技術不成熟、市場規模小、原材料供應等挑戰，但也有機會通過加快技術研發和擴大市場規模來應對全球市場的需求。

政策與供應鏈分析對於鋰電池產業的發展至關重要，企業需要密切關注各國政策和法規的變化，並且積極應對供應鏈中的挑戰，以確保產業的持續健康發展。 






In [21]:
print("----------Complete report----------")
# print("Total time: ", total_time, "s")
for key, value in result.items():
    print(key, ":\n\n\t", value, "\n")

----------Complete report----------
全球電池市場概況 :

	 全球電池市場正在快速增長，預計2022年到2030年間，鋰電池市場的市值將達到4000億美元。這種增長趨勢主要受到綠色能源和儲能領域的推動。特別是在中國、歐洲和美國，這些地區的電池技術和應用需求持續增加，並且積極推動可再生能源和電動車等領域的發展。

然而，臺灣的鋰電池供應鏈雖然完整，但規模偏小，技術不夠成熟，限制了產品研發和產出。臺灣的綠色能源和儲能備援需求也急迫增加，但臺灣廠商的發展速度已經落後於其他國家。臺灣三大集團投入巨資興建電池芯廠，但產能仍然不足以應付需求。

液流電池市場在2023年的發展受到了國際關注，預示著這個領域的潛力和重要性。論壇討論了液流電池在長時間持續儲能方面的應用，這顯示了市場對於長效能源儲存解決方案的需求。美國能源部對儲能持續時間的分類和市場預估也凸顯了市場對於儲能技術的關注和發展。

來自19個國家的300名與會者，顯示了液流電池市場具有全球性的參與和關注。中國大連融科和南韓H2的液流電池系統建置和投入生產計畫，突顯了亞洲地區在液流電池市場的重要性。

中國大連融科和南韓H2等公司在液流電池領域的重要發展，這些公司的投資和計畫反映了企業對於液流電池市場的重視和投入。釩液流公司和其他非釩液流電池公司的發展狀況和研發方向分析，顯示了市場中不同類型液流電池技術的競爭和發展情況。

全球電池市場正處於快速增長階段，主要受到電動車和可再生能源的需求推動。預計未來幾年，電池市場將持續擴大，特別是鋰電池和固態電池等新興技術的應用將成為市場增長的主要動力。

亞太地區是全球電池市場的主要區域，其中包括中國、日本和韓國等國家。這些地區擁有龐大的電動車市場和可再生能源市場，因此成為電池需求的主要來源地。此外，歐洲和北美地區也在電動車和儲能系統方面有著積極的發展，因此也是重要的電池市場。

全球電池市場上，包括東芝、LG化學、三星SDI、CATL、特斯拉、寧德時代等企業在內的大型電池製造商，佔據著市場的主導地位。這些企業在鋰電池、固態電池等領域具有技術優勢，並積極參與電動車和儲能系統等領域的合作與競爭。

全球電池市場正在快速增長，臺灣的電芯產業正處於快速發展階段，並且正積極擴大產能以滿足未來能源轉型的需求。然而，中國電池產業的快速崛起和供過於求導致價格下跌

In [None]:
generate_report_tool = akasha.akashas.create_tool(
    "Generate Report",
    """
    Generate a report based on a given theme, titles, and links.

    Parameters:
    - theme (str): The main theme of the report
    - titles (Dict[str, str]): A dictionary of titles and subtitles
    - links (List[str]): A list of links to process

    Returns:
    - Dict[str, str]: A dictionary containing each title and its corresponding content
    """,
    func = generate_report
)

titles_input_tool = akasha.akashas.create_tool(
    "Titles Input",
    """
    Input the titles and subtitles of the report.

    Parameters:
    - theme (str): The main theme of the report

    Returns:
    - Dict[str, str]: A dictionary of titles and subtitles
    """,
    func = lambda theme: titles
)

## 修改文句工具

In [18]:
part = input("想要修改哪一部分的內容? (輸入標題或\"結束\")\n")
while part != "結束":
    if part in result:
        previous_context = result[part]
        print(f"----------目前內容----------\n\n{previous_context}\n\n------------------------")
        new_prompt = input("想要如何修改:\n")
        new_response = QA.ask_self(
            prompt=f"""將此內容根據以下要求進行修改，若無法達成則不要修改任何內容直接輸出原始內容，不要亂撰寫內容:
            ----------------
            {new_prompt}
            ----------------

            範例:
            <原始內容>
            台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。
            <要求>
            加入非洲市場區域分析。
            (無法達成)
            <修改後內容>
            "無法達成要求，因此不做任何修改"     <----- 這句話連同引號是必要的，以示未達成要求
            (空一行)                        <----- 這行是必要的，用來分隔原始內容和修改後內容
            台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。
            """,
            info=previous_context,
            model="openai:gpt-4"
        )
        print(f"----------修改後內容----------\n\n{new_response}\n\n--------------------------")
        save_or_not = input("是否要儲存修改? (y/n)\n")
        if save_or_not == "y":
            result[part] = new_response
    else:
        print("找不到對應的標題")
    part = input("想要修改哪一部分的內容? (輸入標題或\"結束\")\n")

找不到對應的標題


## 重新擷取網路文字工具

In [25]:
command = input("請輸入修改要求")
new_request= QA.ask_self(
    prompt=f"""使用者輸入了以下修改要求:
    ----------------
    {command}
    ----------------
    從給定的list和使用者的修改要求中找出使用者要求修改的部分為何，以及要如何修改，前面不須加上"回覆:"。

    範例:
    <給定的list>
    ["全球電池市場概況", "技術發展趨勢", "應用領域與市場機會", "政策與供應鏈分析"]
    <要求>
    技術發展趨勢的部分我覺得不夠完整，請加入更多新興電池技術的內容。
    <回覆>
    修改部分: 技術發展趨勢
    修改內容: 加入更多新興電池技術的內容

    若要求的部分不在給定的list當中，請回覆"報告中無此部分，請確認後再提出修改要求"，前面不須加上"回覆:"。

    範例:
    <給定的list>
    ["全球電池市場概況", "技術發展趨勢", "應用領域與市場機會", "政策與供應鏈分析"]
    <要求>
    我覺得動物園的部分不夠完整，請幫我修改。
    <回覆>
    報告中無此部分，請確認後再提出修改要求。    <----- 只需回覆這句話，前面不須加上"回覆:"

    若修改要求中雖然有錯別字或文法錯誤，但仍能理解要求，也請回覆"修改部分: <修改部分> 修改內容: <修改內容>"，前面不須加上"回覆:"。

    範例:
    <給定的list>
    ["全球電池市場概況", "技術發展趨勢", "應用領域與市場機會", "政策與供應鏈分析"]
    <要求>
    我覺得全球電池試場概況的部分不夠完整，請加入更多市場規模與增長趨勢的內容。
    <回覆>
    修改部分: 全球電池市場概況
    修改內容: 加入更多市場規模與增長趨勢的內容

    若無法擷取出修改部分和修改內容，請回覆"不知道您想要修改哪一部分，請提供更多資訊"或"無法理解您的修改要求，請提供更多資訊"。若修改內容不夠清楚，
    也請回覆"無法理解您的修改要求，請提供更多資訊"，前面不須加上"回覆:"。

    範例:
    <給定的list>
    ["全球電池市場概況", "技術發展趨勢", "應用領域與市場機會", "政策與供應鏈分析"]
    <要求>
    我覺得報告不夠完整，請幫我修改。
    <回覆>
    不知道您想要修改哪一部分，請提供更多資訊    <----- 只需回覆這句話，前面不須加上"回覆:"

    或者

    <要求>
    我覺得技術發展趨勢的部分有問題。
    <回覆>
    無法理解您的修改要求，請提供更多資訊    <----- 只需回覆這句話，前面不須加上"回覆:"
    """,
    info=[key for key in result.keys()],
    model="openai:gpt-4"
)

print(new_request)

try:
    part = new_request.split("修改部分: ")[1].split("\n修改內容: ")[0]
    mod_command = new_request.split("修改部分: ")[1].split("\n修改內容: ")[1]
    if part in result:
        previous_context = result[part]

        modification = QA.ask_self(
                prompt=f"""從以下修改要求和提供的內容判斷是否需要重新爬取資料，若需要請回覆"y"，否則回覆"n"。
                ----------------
                {mod_command}
                ----------------
                y的範例:
                <修改要求>
                加入非洲市場區域分析。
                <提供的內容>
                台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。
                <回覆>
                y

                n的範例:
                <修改要求>
                消去亞洲市場區域分析。
                <提供的內容>
                台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。
                <回覆>
                n
                """,
                info=previous_context,
                model="openai:gpt-4"
            )
        if modification == "y":
            print("需重新爬取資料")
            new_response = generate_report(theme=theme, titles={part:[titles[part]]}, links=links, rerun_process=True)
        elif modification == "n":
            print("不需重新爬取資料，嘗試直接修改內容中......")
            new_response = QA.ask_self(
                prompt=f"""將此內容根據以下要求進行修改，若無法達成則不要修改任何內容直接輸出原始內容，不要亂撰寫內容:
                ----------------
                {mod_command}
                ----------------

                範例:
                <原始內容>
                台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。
                <要求>
                加入非洲市場區域分析。
                (無法達成)
                <修改後內容>
                "無法達成要求，因此不做任何修改"     <----- 這句話連同引號是必要的，以示未達成要求
                (空一行)                        <----- 這行是必要的，用來分隔原始內容和修改後內容
                台灣的電池產業發展迅速，主要市場區域包括亞洲、美洲和歐洲。(輸出與原始內容相同的內容)
                """,
                info=previous_context,
                model="openai:gpt-4"
            )

        print(f"----------原本內容----------\n\n{previous_context}\n\n---------------------------")
        print(f"----------修改後內容----------\n\n{new_response}\n\n-----------------------------")
        save_or_not = input("是否要儲存修改? (y/n)\n")
        if save_or_not == "y":
            result[part] = new_response
except:
    print("new_request")

修改部分: 全球電池市場概況
修改內容: 刪除跟中國有關的資訊
不需重新爬取資料，嘗試直接修改內容中
----------原本內容----------

全球電池市場正在快速增長，預計2022年到2030年間，鋰電池市場的市值將達到4000億美元。這種增長趨勢主要受到綠色能源和儲能領域的推動。特別是在中國、歐洲和美國，這些地區的電池技術和應用需求持續增加，並且積極推動可再生能源和電動車等領域的發展。

然而，臺灣的鋰電池供應鏈雖然完整，但規模偏小，技術不夠成熟，限制了產品研發和產出。臺灣的綠色能源和儲能備援需求也急迫增加，但臺灣廠商的發展速度已經落後於其他國家。臺灣三大集團投入巨資興建電池芯廠，但產能仍然不足以應付需求。

液流電池市場在2023年的發展受到了國際關注，預示著這個領域的潛力和重要性。論壇討論了液流電池在長時間持續儲能方面的應用，這顯示了市場對於長效能源儲存解決方案的需求。美國能源部對儲能持續時間的分類和市場預估也凸顯了市場對於儲能技術的關注和發展。

來自19個國家的300名與會者，顯示了液流電池市場具有全球性的參與和關注。中國大連融科和南韓H2的液流電池系統建置和投入生產計畫，突顯了亞洲地區在液流電池市場的重要性。

中國大連融科和南韓H2等公司在液流電池領域的重要發展，這些公司的投資和計畫反映了企業對於液流電池市場的重視和投入。釩液流公司和其他非釩液流電池公司的發展狀況和研發方向分析，顯示了市場中不同類型液流電池技術的競爭和發展情況。

全球電池市場正處於快速增長階段，主要受到電動車和可再生能源的需求推動。預計未來幾年，電池市場將持續擴大，特別是鋰電池和固態電池等新興技術的應用將成為市場增長的主要動力。

亞太地區是全球電池市場的主要區域，其中包括中國、日本和韓國等國家。這些地區擁有龐大的電動車市場和可再生能源市場，因此成為電池需求的主要來源地。此外，歐洲和北美地區也在電動車和儲能系統方面有著積極的發展，因此也是重要的電池市場。

全球電池市場上，包括東芝、LG化學、三星SDI、CATL、特斯拉、寧德時代等企業在內的大型電池製造商，佔據著市場的主導地位。這些企業在鋰電池、固態電池等領域具有技術優勢，並積極參與電動車和儲能系統等領域的合作與競爭。

全球電池市場正在快速增長，臺灣的電芯產業正處於快速發展階段，並且正積極擴大產能以滿足未來能源轉型的需