CHIP

Fumihiro Kato edited this page Jul 16, 2015 · 1 revision

Table of Contents

The CHIP (Cultural Heritage Information Presentation) project

Webサイト:http://chip-project.org

オランダの国立アムステルダム美術館(Rijksmuseum Amsterdam)において,以下の目的で Semantic Webの技術を用いて,美術館のデータの意味付け,ユーザモデリングや作品の推薦などを行っているプロジェクト.

  1. 美術館における語彙の充実化や,セマンティックな閲覧・検索・推薦をSemantic Webの技術でどのように達成できるか
  2. 実際の美術館内の空間と美術館のWebサイトの双方において,パーソナライゼーションやユーザモデリングがユーザの体験をどのように豊かにすることができるか

Survey

2010

Enhancing content-based recommendation with the task model of classification

Wang, Y., Wang, S., Stash, N., Aroyo, L. and Schreiber, G.

In Proc. International Conference on Knowledge Engineering and Management by the Masses (EKAW), Page 431-440, October, 2010

Semantic-Enhanced Recommendation Strategy

  • Realization
ユーザに評価された作品と,プロパティで明示的に繋がっているコンセプトを取得
例)作品"The Little Street"からcreatorで繋がっているコンセプト"Johannes Vermeer"を取得
  • Classification by concepts
ユーがに評価されたコンセプトと,プロパティで明示的に繋がっているコンセプトを取得
例)コンセプト"Rembrandt van Rijn"からstudentOfで繋がっているコンセプト"Pieter Lastman"(Rembrandtの師)を取得
  • Classification by instances
プロパティで明示的に繋がっている作品がユーザに評価されたコンセプトと類似している他のコンセプトを取得(暗黙的な繋がり)
例)ユーザに評価されたコンセプト"Venus"と明示的に繋がっている作品が多いコンセプト"Aphrodite"を取得
  • Retrieval
ユーザに評価されたコンセプトと,上記3ステップで取得できたコンセプトからプロパティで明示的に繋がっている作品を推薦
例)コンセプト"Johannes Vermeer"から作品"The kitchen maid"などを推薦
前提
  • 任意の作品 (artwork) とコンセプト (concept,作者や流派,主題などを含む)にユーザが5段階で評価(-1, -0.5, 0, 0.5, 1)
  • 作品とコンセプト,コンセプトとコンセプトを繋ぐプロパティには重みが与えられる(予備実験で得た値 ※要調査)
推薦プロセス
  • RetrievalとClassification by Conceptsで取得したコンセプトの評価を算出
ユーザに評価された作品やコンセプトの評価 x プロパティの重み(正規化)= 取得した新しいコンセプトの評価(正規化)
  • プロパティで繋がっている作品がユーザに評価されたコンセプトと類似しているコンセプトの評価を算出(IsaacのInstance-based Ontology Matchingがベース)
  • すべてのコンセプトの組合せで,プロパティで繋がっている作品の類似度を修正したJaccard係数で算出
  • 係数の値が閾値(論文内では0.20)以上であれば類似しているコンセプトとして抽出
  • 抽出されたコンセプトは最初のステップと同様に評価を算出
  • Retrievalでは,alphaというパラメータを用いて,コンセプトの評価値 = alpha x 明示的つながりによる関連コンセプト + (1-alpha) x 暗黙的つながりによる関連コンセプトを算出.alphaは0から1の実数.alphaが大きいほどSemanticな関係(RDFのプロパティによるつながり)の影響が大きい.
評価
  • alphaのみ検討
  • Leave-one-out cross validation(1つのサンプル以外でモデルを構築し,残ったサンプルの予測精度を検定する)
  • 平均絶対誤差(Mean Absolute Error, MAE)
  • 前の研究で使っていた手法と比較(RealizationとRetrievalのみ)
  • 前の手法より誤差は小さかったが,統計的に有意によいという結果は得られなかった
疑問点
  • Classification by Instances では繋がっている作品が類似しているコンセプト同士をつないでいる.例えば,"Hinduism"と"Hindu deities"だとそもそも単語が似ているが,そんなに類似した複数のコンセプトが同じ作品に繋がっているのだろうか?すべてのコンセプトの組合せの数は24,429だそうだが,そのうちどれだけの割合の組合せが類似していたのか?
  • 参考文献少ないのが気になる(6本うち2本はself-citaion)