Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

コンペの概要 #1

Open
takapy0210 opened this issue Sep 6, 2020 · 3 comments
Open

コンペの概要 #1

takapy0210 opened this issue Sep 6, 2020 · 3 comments
Labels
documentation Improvements or additions to documentation
Projects

Comments

@takapy0210
Copy link
Contributor

takapy0210 commented Sep 6, 2020

Description

Biological activity (生物活性?) に基づいて薬物を分類するタスク.
医薬品の創薬は、特定の疾患に関連する特定のタンパク質を特定し、そのタンパク質を標的とする分子を開発することを目的としてい行っている。分子のMoAとはその生物活性をコードとして表しているもの。
薬物は複数のMoAを持つので、マルチラベル分類問題になっている。

MoA(mechanical-of-action)とは?

科学者は病気に関するprotein target(タンパク質の標的?)を特定し、そのprotein targetを調整できる分子を開発しようとしている.このとき、特定の分子の生物活性を説明するための略語としてMoAと呼ばれるラベルを使っている.

詳しいことはこちら #9

Evaluation

各薬物-MoAアノテーション のペアに適用される対数の平均値

image

N : テストデータ中の sig_idの数 (i=1,...,N)
M : スコアリングされたMoAターゲットの数(m=1,...,M)
ŷ i,m : sig_id に対する正の MoA 応答の予測確率
yi,m : 基底真理値. 正の応答の場合は1, そうでない場合は0
log() : 自然対数

注:実際に提出された予測確率は、max(min(p,1-10^-15),10^-15)に置き換えられる. loglossは小さい方が良い.

Timeline

  • November 23, 2020 - Entry deadline. You must accept the competition rules before this date in order to compete.
    • JST → 2020/11/24 AM:9:00
  • November 23, 2020 - Team Merger deadline. This is the last day participants may join or merge teams.
    • JST → 2020/11/24 AM:9:00
  • November 30, 2020 - Final submission deadline.
    • JST → 2020/12/1 AM:9:00

Data Description

  • 匿名のデータセット
  • 公開されているリーダーボードはテストデータの約25%
  • 関連issue#4

External Link

  • Connectopedia
    コネクトペディアは「コネクティビティマップ」(細胞生存率や遺伝子発現データの定義を含む)に関連する用語・概念のWebのフリー辞書

paper

  1. Corsello et al. “Discovering the anticancer potential of non-oncology drugs by systematic viability profiling,” Nature Cancer, 2020,
  2. Subramanian et al. “A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles,” Cell, 2017,

other

  • コードコンペ
  • submit: 3回 / 日
  • final submit: 2個
@takapy0210 takapy0210 added the documentation Improvements or additions to documentation label Sep 6, 2020
@takapy0210
Copy link
Contributor Author

takapy0210 commented Sep 6, 2020

とりあえずテキトーに翻訳した結果を何となく解釈して転載したので、間違ってる箇所あると思います!😇

完全な理解者の方、修正求ム🙏🙏🙏

@masatakashiwagi
Copy link
Contributor

マルチクラス分類とマルチラベル分類の違い
https://www.kaggle.com/c/lish-moa/discussion/180500

e.g.) クラスが3種類あった場合を考える。

  • 1つのサンプルにどれか1つのクラスが割り当てられるのがマルチクラス分類
  • 1つのサンプルに複数のクラス(ラベル)が割り当てられるのがマルチラベル分類

今回の問題はマルチラベル分類

@sinchir0
Copy link

sinchir0 commented Sep 9, 2020

マルチラベル分類

URL先のこの図分かりやすいですね
image

@masatakashiwagi masatakashiwagi added this to To do in MoA via automation Oct 18, 2020
@masatakashiwagi masatakashiwagi moved this from To do to Icebox in MoA Oct 18, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
documentation Improvements or additions to documentation
Projects
MoA
Icebox
Development

No branches or pull requests

3 participants