# John Snow Labs | John Snow Labs

> [John Snow Labs](https://nlp.johnsnowlabs.com/)のNLPおよびLLMエコシステムには、スケールでの最先端AI、責任あるAI、ノーコードAIのためのソフトウェアライブラリ、およびヘルスケア、法律、金融などの分野で20,000以上のモデルへのアクセスが含まれています。
>
> > [John Snow Labs](https://nlp.johnsnowlabs.com/) NLP & LLM ecosystem includes software libraries for state-of-the-art AI at scale, Responsible AI, No-Code AI, and access to over 20,000 models for Healthcare, Legal, Finance, etc.
>
> モデルは [nlp.load](https://nlp.johnsnowlabs.com/docs/en/jsl/load_api) で読み込まれ、内部的に [nlp.start()](https://nlp.johnsnowlabs.com/docs/en/jsl/start-a-sparksession) を使用してSparkセッションが開始されます。24,000以上のすべてのモデルについては、[John Snow Labs Model Hub](https://nlp.johnsnowlabs.com/models)をご覧ください。
>
> > Models are loaded with [nlp.load](https://nlp.johnsnowlabs.com/docs/en/jsl/load_api) and spark session is started >with [nlp.start()](https://nlp.johnsnowlabs.com/docs/en/jsl/start-a-sparksession) under the hood.
> > For all 24.000+ models, see the [John Snow Labs Model Models Hub](https://nlp.johnsnowlabs.com/models)



## Setting up | セットアップ



In [None]:
! pip install johnsnowlabs

In [None]:
# If you have a enterprise license, you can run this to install enterprise features
# from johnsnowlabs import nlp
# nlp.install()

## Example | 例



In [None]:
from langchain.embeddings.johnsnowlabs import JohnSnowLabsEmbeddings

Johnsnowlabsの埋め込みとSparkセッションを初期化します

> Initialize Johnsnowlabs Embeddings and Spark Session



In [None]:
embedder = JohnSnowLabsEmbeddings("en.embed_sentence.biobert.clinical_base_cased")

いくつかの例文を定義してください。これらは、分析したい任意の文書である可能性があります - たとえば、ニュース記事、ソーシャルメディアの投稿、または製品レビューなどです。

> Define some example texts . These could be any documents that you want to analyze - for example, news articles, social media posts, or product reviews.



In [None]:
texts = ["Cancer is caused by smoking", "Antibiotics aren't painkiller"]

テキストの埋め込みを生成して出力します。JohnSnowLabsEmbeddingsクラスは、各ドキュメントの内容を数値で表現した埋め込みを生成します。これらの埋め込みは、ドキュメントの類似性比較やテキスト分類など、さまざまな自然言語処理タスクに利用できます。

> Generate and print embeddings for the texts . The JohnSnowLabsEmbeddings class generates an embedding for each document, which is a numerical representation of the document's content. These embeddings can be used for various natural language processing tasks, such as document similarity comparison or text classification.



In [None]:
embeddings = embedder.embed_documents(texts)
for i, embedding in enumerate(embeddings):
    print(f"Embedding for document {i+1}: {embedding}")

単一のテキストの埋め込みを生成して表示することができます。例えば、検索クエリのような単一のテキストの埋め込みを生成することもできます。この機能は、与えられたクエリに似たドキュメントを見つけたい情報検索のタスクに特に有用です。

> Generate and print an embedding for a single piece of text. You can also generate an embedding for a single piece of text, such as a search query. This can be useful for tasks like information retrieval, where you want to find documents that are similar to a given query.



In [None]:
query = "Cancer is caused by smoking"
query_embedding = embedder.embed_query(query)
print(f"Embedding for query: {query_embedding}")