# Qdrant

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/fuyu-quant/langchain/blob/main/examples/models.ipynb)

In [4]:
%%capture
!pip install langchain
!pip install openai
!pip install qdrant-client

In [5]:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Qdrant
from langchain.document_loaders import TextLoader

### Qdrantのin-memoryの実装
* 今回はメモリ上に一時的データを保持して実行するが，ストレージやオンプレサーバー，Qdrant Cloudに保存をすることもできる

In [6]:
loader = TextLoader('/home/jovyan/langchain/data/sample.txt')
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

embeddings = OpenAIEmbeddings()

In [10]:
qdrant = Qdrant.from_documents(
    docs, embeddings, 
    location=":memory:",  # Local mode with in-memory storage only
    collection_name="my_documents",
)

### 類似文章の検索

In [11]:
query = "kaggleについて"
found_docs = qdrant.similarity_search(query)

In [12]:
print(found_docs[0].page_content)

Kaggle社内Meet upとは？
「Kaggle」については、ご存知の方も多いと思いますが、企業や組織・団体から投稿された課題とデータをもとに、解決に適した機械学習のモデルを構築して精度を競い合うコンペ式のサービスを言います。
当社にはデータサイエンティストが約200名在籍していることもあり、データ分析の技術を研鑽するため、プライベートでKaggleに親しむKagglerが数多く在籍しています。

今回のMeet upは、「Kaggleに参加したことがある」「参加したことはないけれど興味がある」「Kaggleに限らず技術コンペについて情報収集したい」という社員同志が、交流できるように企画されたイベントです！

オフラインとオンラインの同時開催
感染症対策の考慮もしつつ、当日は本社オフィスの広い会場（セミナールーム）にて、オフラインとオンライン、どちらでも参加可能なハイブリッド形式で開催されました。

悪天候にも関わらずセミナールームには約30名が集合し、オンラインでは社員の他に新卒の内定者も加わって、総勢90名が参加する大きなイベントとなりました。
中には、懇親会を楽しみに、お客様先などから本社オフィスへ移動してくる参加者もいました。

当日のコンテンツ
前半は、Kaggle歴1年目からKaggle master（！）まで幅広い経歴の4名によるライトニングトークが行われました。

Kaggleに参加する動機、参加するコンペの選択方法、戦績、Kaggleの取り組み方、参加して得られたこと、苦しみ…など、幅広い話題が思い思いの形で発表され、笑いが起きる場面もしばしば。発表後には様々な質疑が飛び交いました。

後半は、ピザなどの軽食とドリンクなどを囲み、懇親会が開催されました。皆さん、和気あいあいと打ち解けていました。


参加者の感想

普段あまりKaggleの活動について話す機会がないため、とても充実した時間を過ごすことができた。
楽しそうに取り組んでいる様子が伝わってきて自分のモチベーションにもつながった。
まだKaggleに取り組んだことがなく、コンペの選び方などがさっぱり分からなかったので、ライトニングトークが非常に参考になった。
お客様への報告資料のようにまとめられていたところが、ブレインパッドっぽくて面白かったです。


### スコア付きの類似文章の検索

In [13]:
query = "kaggleについて"
found_docs = qdrant.similarity_search_with_score(query)

In [15]:
document, score = found_docs[0]
print(document.page_content)
print(f"\nScore: {score}")

Kaggle社内Meet upとは？
「Kaggle」については、ご存知の方も多いと思いますが、企業や組織・団体から投稿された課題とデータをもとに、解決に適した機械学習のモデルを構築して精度を競い合うコンペ式のサービスを言います。
当社にはデータサイエンティストが約200名在籍していることもあり、データ分析の技術を研鑽するため、プライベートでKaggleに親しむKagglerが数多く在籍しています。

今回のMeet upは、「Kaggleに参加したことがある」「参加したことはないけれど興味がある」「Kaggleに限らず技術コンペについて情報収集したい」という社員同志が、交流できるように企画されたイベントです！

オフラインとオンラインの同時開催
感染症対策の考慮もしつつ、当日は本社オフィスの広い会場（セミナールーム）にて、オフラインとオンライン、どちらでも参加可能なハイブリッド形式で開催されました。

悪天候にも関わらずセミナールームには約30名が集合し、オンラインでは社員の他に新卒の内定者も加わって、総勢90名が参加する大きなイベントとなりました。
中には、懇親会を楽しみに、お客様先などから本社オフィスへ移動してくる参加者もいました。

当日のコンテンツ
前半は、Kaggle歴1年目からKaggle master（！）まで幅広い経歴の4名によるライトニングトークが行われました。

Kaggleに参加する動機、参加するコンペの選択方法、戦績、Kaggleの取り組み方、参加して得られたこと、苦しみ…など、幅広い話題が思い思いの形で発表され、笑いが起きる場面もしばしば。発表後には様々な質疑が飛び交いました。

後半は、ピザなどの軽食とドリンクなどを囲み、懇親会が開催されました。皆さん、和気あいあいと打ち解けていました。


参加者の感想

普段あまりKaggleの活動について話す機会がないため、とても充実した時間を過ごすことができた。
楽しそうに取り組んでいる様子が伝わってきて自分のモチベーションにもつながった。
まだKaggleに取り組んだことがなく、コンペの選び方などがさっぱり分からなかったので、ライトニングトークが非常に参考になった。
お客様への報告資料のようにまとめられていたところが、ブレインパッドっぽくて面白かったです。

Score: 0.89160000

### Maximum marginal relevance search(MMR)
* 似たような文章だけでなく多様な文章を取得したいときに使う

In [16]:
query = "kaggleについて"
found_docs = qdrant.max_marginal_relevance_search(query, k=2, fetch_k=10)

In [17]:
for i, doc in enumerate(found_docs):
    print(f"{i + 1}.", doc.page_content, "\n")


1. Kaggle社内Meet upとは？
「Kaggle」については、ご存知の方も多いと思いますが、企業や組織・団体から投稿された課題とデータをもとに、解決に適した機械学習のモデルを構築して精度を競い合うコンペ式のサービスを言います。
当社にはデータサイエンティストが約200名在籍していることもあり、データ分析の技術を研鑽するため、プライベートでKaggleに親しむKagglerが数多く在籍しています。

今回のMeet upは、「Kaggleに参加したことがある」「参加したことはないけれど興味がある」「Kaggleに限らず技術コンペについて情報収集したい」という社員同志が、交流できるように企画されたイベントです！

オフラインとオンラインの同時開催
感染症対策の考慮もしつつ、当日は本社オフィスの広い会場（セミナールーム）にて、オフラインとオンライン、どちらでも参加可能なハイブリッド形式で開催されました。

悪天候にも関わらずセミナールームには約30名が集合し、オンラインでは社員の他に新卒の内定者も加わって、総勢90名が参加する大きなイベントとなりました。
中には、懇親会を楽しみに、お客様先などから本社オフィスへ移動してくる参加者もいました。

当日のコンテンツ
前半は、Kaggle歴1年目からKaggle master（！）まで幅広い経歴の4名によるライトニングトークが行われました。

Kaggleに参加する動機、参加するコンペの選択方法、戦績、Kaggleの取り組み方、参加して得られたこと、苦しみ…など、幅広い話題が思い思いの形で発表され、笑いが起きる場面もしばしば。発表後には様々な質疑が飛び交いました。

後半は、ピザなどの軽食とドリンクなどを囲み、懇親会が開催されました。皆さん、和気あいあいと打ち解けていました。


参加者の感想

普段あまりKaggleの活動について話す機会がないため、とても充実した時間を過ごすことができた。
楽しそうに取り組んでいる様子が伝わってきて自分のモチベーションにもつながった。
まだKaggleに取り組んだことがなく、コンペの選び方などがさっぱり分からなかったので、ライトニングトークが非常に参考になった。
お客様への報告資料のようにまとめられていたところが、ブレインパッドっぽくて面白かったです。 

2. などなど…。これらの