Skip to content
A dataset of PD-1 inhibitors
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
LICENSE
PD1_inhibitor_dataset.csv
README.md
check_compounds.ipynb

README.md

A dataset of PD-1 inhibitors

低分子PD-1阻害剤のデータセットです。

内容について

SureChEMBLに収録されている特許から低分子PD-1阻害剤と思われる 低分子化合物の構造を抽出しました。 各特許の記述に基づいて最も高活性とされる化合物を1例ずつ抽出しましたが、 活性が階級でしか与えられず最も高活性な化合物が特定できない場合は、 最も高活性な階級に属する化合物の中から代表実施例の番号が最も若いものを選びました。 構造情報がSureChEMBLに未収録の場合、収録されている構造に誤りがあると思われる場合には、 OCRを利用しつつ手動で構造を入力しました。

注意事項

  • データセットの正確性は保証されません。
  • このデータセットが公開された特許情報の網羅している保証はありません。
  • このデータセットの利用によって生じた損害について一切の責任をを負いかねます。
  • ライセンスは CC BY 4.0に従います。
  • 創薬レイドバトル 2018参加にこのデータセットを利用する場合には、主催者の案内に従い本データセットを利用したことを申告してください。

カラムの説明

カラム名 説明
compound_id 作業のために割り当てた化合物ID
patent_no 特許番号
example_no 代表実施例/化合物番号
schembl_id 当該化合物のSureChEMBLのID。見つからない場合は空欄
applicant 出願人の組織
smiles 化合物のSMILES

謝辞

特許データの収集、記載の解釈、一部の構造データの入力に関して、 rkakamilanさんのご助言とご協力を賜りました。ありがとうございました。

参考文献

You can’t perform that action at this time.