In [31]:
import os
from dotenv import load_dotenv
from neo4j import GraphDatabase
from neo4j import Driver
from neo4j import Record
from neo4j.graph import Node


load_dotenv("../../.env")

True

In [32]:
user = os.environ["neo4j_user"]
pswd = os.environ["neo4j_pswd"]
driver: Driver = GraphDatabase.driver(
    uri="bolt://neo4j", auth=(user, pswd), database="neo4j"
)

In [33]:
def _select(tx, query: str, **props):
    results = tx.run(query, **props)
    return list(results)

In [34]:
def select_query(query: str, **props):
    results = []
    with driver.session() as session:
        results = session.execute_read(_select, query, **props)
    return results

In [35]:
query = """
match (pr:ProjectRoot)--(dr:ProjectDataRoot) 
with pr, count(dr.execution_id) as cnt
where cnt >= 10
match (pr)-[*]->(pj:Project)-->(pd:ProjectDetails)
return cnt, pr, pj, pd
order by cnt desc, pj.project_id, pj.sortby
"""

In [36]:
results: list[Record] = select_query(query)

In [37]:
len(results)

4400

In [38]:
import datetime

In [39]:
def nvl(val, default):
    return val if val is not None else default

In [40]:
records = []

for rec in results:
    # return の順番で取得 ('*' の場合は、アルファベット順)
    n_dates, pr, pj, pd = rec.values()
    created_at = datetime.datetime.strptime(pj["created_at"], "%Y-%m-%d")
    record = dict(
        execution_id=pj["execution_id"],
        project_id=pj["project_id"],
        project_url=pj["project_url"],
        title=pj["title"],
        data_brand=pj["data_brand"],
        data_category=pj["data_category"],
        data_dimension=pj["data_dimension"],
        sortby=pj["sortby"],
        data_position=int(pj["data_position"]),
        current_funding=int(nvl(pj["current_funding"], 0)),
        current_supporters=int(nvl(pj["current_supporters"], 0)),
        success_rate=int(nvl(pj["success_rate"], 0)),  # %
        remaining_days=int(nvl(pj["remaining_days"], -1)),
        created_at=created_at,
    )
    records.append(record)

In [41]:
len(records)

4400

In [11]:
dict(pj.items())

{'data_list': 'projects_popular_page4',
 'project_type': 'ビューティー・ヘルスケア',
 'fetch_id': 'FCH01HTAN9C1N09YE7S0NV58HKPH1',
 'prefecture': '愛知県',
 'created_at': '2024-04-01',
 'data_category': 'category_beauty',
 'project_url': 'https://camp-fire.jp/projects/view/745680',
 'data_brand': 'sp_gadget',
 'title': '新時代到来！寝ながら本格マッサージ！下からほぐす仰向けマッサージベッド 雅夢寝',
 'current_funding': 837600,
 'execution_id': '20240401010001',
 'project_data_id': 'PRJ01HTANBBGR2RZ87J1Q795JQ03D',
 'data_position': '6',
 'user_id': 'Primedirect_21',
 'img_url': 'https://static.camp-fire.jp/uploads/project_version/image/1170347/aabe2dfc-b448-4855-841a-55921bf78702.jpeg?ixlib=rails-2.1.4&fit=max&auto=format&w=600',
 'project_id': '745680',
 'current_supporters': 12,
 'data_dimension': 'project',
 'sortby': 'popular',
 'source_id': 'Campfire',
 'success_rate': 837,
 'remaining_days': 7,
 'status': 'OPEN'}

In [12]:
import pandas as pd

df = pd.DataFrame(records)
df.head()

Unnamed: 0,execution_id,project_id,project_url,title,data_brand,data_category,data_dimension,sortby,data_position,current_funding,current_supporters,success_rate,remaining_days,created_at
0,20240319003003,735372,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,most_funded,14,61053067,1521,1221,12,2024-03-19
1,20240320010001,735372,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,most_funded,14,61366887,1530,1227,11,2024-03-20
2,20240321010001,735372,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,most_funded,14,61519507,1534,1230,10,2024-03-21
3,20240322010002,735372,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,most_funded,14,61627007,1536,1232,9,2024-03-22
4,20240324010002,735372,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,most_funded,9,65584727,2093,1311,7,2024-03-24


In [13]:
"project_data_id" in df.columns

False

In [14]:
# set index
keys = ["project_id", "execution_id", "sortby"]
df.index = [df[k] for k in keys]
df.drop(columns=keys, inplace=True)
df.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,project_url,title,data_brand,data_category,data_dimension,data_position,current_funding,current_supporters,success_rate,remaining_days,created_at
project_id,execution_id,sortby,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
735372,20240319003003,most_funded,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,14,61053067,1521,1221,12,2024-03-19
735372,20240320010001,most_funded,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,14,61366887,1530,1227,11,2024-03-20
735372,20240321010001,most_funded,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,14,61519507,1534,1230,10,2024-03-21
735372,20240322010002,most_funded,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,14,61627007,1536,1232,9,2024-03-22
735372,20240324010002,most_funded,https://camp-fire.jp/projects/view/735372,元特殊部隊員が考案したタクティカルライト『CRISIS 01』,customer_success,category_product,project,9,65584727,2093,1311,7,2024-03-24


In [15]:
from sqlalchemy import create_engine, Engine

engine: Engine = create_engine(
    "postgresql://postgres:postgres@postgresql:5432/campfire_db"
)
df.to_sql(
    "projects",
    engine,
    if_exists="replace",
    index=True,
    index_label=keys,
)

400

# Design Note

- data at pj.remaining_days -> pj.success_rate, pj.current_funding, pj.current_supporters
    - data: pj.data_position, pj.project_type, pj.data_category, pj.data_brand, pj.prefecture, pj.sortby, pd.title, pd.article_text, pd.type, pd.profile_text, pd.project_experience
- cypher では、明示的に GROUP BY でグルーピングできないので、pandas に変換してから グループ化してグループ単位で処理をする


In [16]:
from collections import namedtuple


def to_nt(dict_obj, typename="MyNamedTuple", defaults: dict = {}):
    dct = dict(dict_obj.items())
    # 辞書のキーをフィールド名として、名前付きタプルの型を定義
    for k, v in defaults.items():
        dct[k] = v
    NT = namedtuple(typename, dct.keys())
    # 名前付きタプルのインスタンスを生成して返す
    return NT(*dct.values())

In [17]:
# defaults = dict(prefecture="未設定")
# npj = to_nt(pj, "Project", defaults)
# npj.data_position, npj.project_type, npj.data_category, npj.data_brand, npj.prefecture, npj.sortby

In [18]:
# defaults = dict(project_exprience="未設定")
# npjd = to_nt(pjd, "ProjectDetails", defaults=defaults)
# npjd.title, npjd.article_text, npjd.type, npjd.profile_text, npjd.project_exprience

In [19]:
# npj.project_id, npj.execution_id, npj.sortby
# npj.data_position, npj.project_type, npj.data_category, npj.data_brand, npj.prefecture
# npd.title, npd.article_text, npd.type, npd.profile_text, npd.project_exprience
# npj.success_rate, npj.current_funding, npj.current_supporters

# NOTE: using project_id, project_data_id, to get the return_boxes nodes by Cypher query

In [20]:
# query = """
# match (n:ProjectDataRoot)
# with max(distinct n.execution_id) as eid
# match (pr: ProjectRoot) --> (dr: ProjectDataRoot {execution_id: eid}) --> (pj:Project) --> (pjd:ProjectDetails)
# return pr, dr, pj, pjd
# """

In [21]:
query = """
match (pr: ProjectRoot) --> (dr: ProjectDataRoot) --> (pj:Project) --> (pjd:ProjectDetails)
return pr, dr, pj, pjd
"""

In [22]:
results: list[Record] = select_query(query)

In [23]:
len(results)

9800

In [24]:
import pandas as pd


records = []
for idx, rec in enumerate(results):
    record = {}
    [record.update(d) for d in rec.data("pr", "dr", "pj", "pjd").values()]
    records.append(record)

df = pd.DataFrame.from_records(records)

In [25]:
df.columns

Index(['project_id', 'project_url', 'source_id', 'execution_id', 'data_list',
       'project_type', 'fetch_id', 'data_category', 'created_at', 'data_brand',
       'title', 'current_funding', 'project_data_id', 'data_position',
       'user_id', 'img_url', 'current_supporters', 'sortby', 'data_dimension',
       'status', 'prefecture', 'profile_url', 'user_name', 'backer_amount',
       'article_text', 'abstract', 'type', 'article_html', 'profile_text',
       'project_exprience', 'icon_url', 'success_rate', 'remaining_days',
       'readmore'],
      dtype='object')

In [26]:
df.head(3)

Unnamed: 0,project_id,project_url,source_id,execution_id,data_list,project_type,fetch_id,data_category,created_at,data_brand,...,article_text,abstract,type,article_html,profile_text,project_exprience,icon_url,success_rate,remaining_days,readmore
0,722442,https://camp-fire.jp/projects/view/722442,Campfire,20240408010001,projects_most_funded_page4,書籍・雑誌出版,FCH01HTWVT1SXYZ4XS277HRV5MGPQ,category_publishing,2024-04-08,faavo_campfire_local,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
1,722442,https://camp-fire.jp/projects/view/722442,Campfire,20240407012401,projects_most_funded_page4,書籍・雑誌出版,FCH01HTTAP2ZX71J37EHRG6FV1NJQ,category_publishing,2024-04-07,faavo_campfire_local,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
2,722442,https://camp-fire.jp/projects/view/722442,Campfire,20240406010002,projects_most_funded_page4,書籍・雑誌出版,FCH01HTQQ6NHPMDJH6NHQCW5TNQEP,category_publishing,2024-04-06,faavo_campfire_local,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,


In [27]:
df.shape

(9800, 34)

In [28]:
# set index
keys = ["project_id", "execution_id", "sortby", "project_data_id"]
df.index = [df[k] for k in keys]
df.drop(columns=keys, inplace=True)
df.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,project_url,source_id,data_list,project_type,fetch_id,data_category,created_at,data_brand,title,current_funding,...,article_text,abstract,type,article_html,profile_text,project_exprience,icon_url,success_rate,remaining_days,readmore
project_id,execution_id,sortby,project_data_id,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1
722442,20240408010001,most_funded,PRJ01HTWVWBCEXPQ7RKDTQG4J4BC2,https://camp-fire.jp/projects/view/722442,Campfire,projects_most_funded_page4,書籍・雑誌出版,FCH01HTWVT1SXYZ4XS277HRV5MGPQ,category_publishing,2024-04-08,faavo_campfire_local,初出版記念！ネイリストのミライを豊かにする！「ネイルサロン満席予祝まつり」,54969230.0,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
722442,20240407012401,most_funded,PRJ01HTTAR7N9S90Y5C81ZWB7GJ4E,https://camp-fire.jp/projects/view/722442,Campfire,projects_most_funded_page4,書籍・雑誌出版,FCH01HTTAP2ZX71J37EHRG6FV1NJQ,category_publishing,2024-04-07,faavo_campfire_local,初出版記念！ネイリストのミライを豊かにする！「ネイルサロン満席予祝まつり」,54969230.0,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
722442,20240406010002,most_funded,PRJ01HTQQ8WRY1H3F85X1DFCA0WW8,https://camp-fire.jp/projects/view/722442,Campfire,projects_most_funded_page4,書籍・雑誌出版,FCH01HTQQ6NHPMDJH6NHQCW5TNQEP,category_publishing,2024-04-06,faavo_campfire_local,初出版記念！ネイリストのミライを豊かにする！「ネイルサロン満席予祝まつり」,54969230.0,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
722442,20240405010001,most_funded,PRJ01HTN4YYWM57ERXN2HF6E4P37R,https://camp-fire.jp/projects/view/722442,Campfire,projects_most_funded_page4,書籍・雑誌出版,FCH01HTN4WSEGJ0ZQA756MCFHVPZA,category_publishing,2024-04-05,faavo_campfire_local,初出版記念！ネイリストのミライを豊かにする！「ネイルサロン満席予祝まつり」,54969230.0,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,
722442,20240404010002,most_funded,PRJ01HTJJ9G3VYZ7RV54QXQ8C1KDX,https://camp-fire.jp/projects/view/722442,Campfire,projects_most_funded_page4,書籍・雑誌出版,FCH01HTJJ7JZBT83PHGWMNY9JNSMW,category_publishing,2024-04-04,faavo_campfire_local,初出版記念！ネイリストのミライを豊かにする！「ネイルサロン満席予祝まつり」,54969230.0,...,Play\nいつも見てくれてる方、いつもありがとうございます♡\n初めましての方は、はじめま...,品川あゆみです。3月15日にゼロワン出版社さんより、初の書籍【ネイリストの常識はお客様の非常...,project,"<h6><img class=""fr-fil fr-dib lazyload"" style=...",ayumi_nca\n日本\n初めてのプロジェクトです\n認証していません\nwww.ins...,初めてのプロジェクトです,,,,


In [29]:
df.to_sql(
    "project_details",
    engine,
    if_exists="replace",
    index=True,
    index_label=keys,
)

190

In [30]:
# for idx, grp in df.groupby(by=["project_id", "execution_id"]):
#     # print(grp.keys())
#     print(
#         grp[
#             [
#                 "project_id",
#                 "execution_id",
#                 "status",
#                 "sortby",
#                 "data_position",
#                 "current_funding",
#                 "current_supporters",
#                 "success_rate",
#             ]
#         ]
#     )
#     break