## Embeddings

In [4]:
from dotenv import load_dotenv

In [23]:
from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
import json
from langchain.schema import Document


In [24]:
embedding_model = OpenAIEmbeddings(model="text-embedding-3-small")

In [19]:
medical_codes = []
with open('data/ciselniky/vykon.jsonl', 'r', encoding='utf-8') as f:
    for line in f:
        data = str(json.loads(line))
        medical_codes.append(data)

In [None]:
code_embeddings = embedding_model.embed_documents(medical_codes)

In [25]:
# Wrap medical codes in Documents
code_docs = [Document(page_content=code) for code in medical_codes]

# Create FAISS index
vector_store = FAISS.from_documents(code_docs, embedding_model)

In [40]:
# Params
zprava = """
MUDr. Kryštofová Dominika
C163 
Pacientka se dostavila na 2.lůžkovou stanici k podání transfuzí - na Hb 80g/l. V čase od 11.25 do 13.00 podány 2 TU ERY, krevní skupiny AB Rh + - bez komplikací. 
Pacientka odchází bez známek dechové či oběhové nedostatečnosti.
"""
# zprava = "ODBĚR KRVE Z ARTERIE"

k=5

In [41]:

results = vector_store.similarity_search(zprava, k=k)
print(f"Zprava: {zprava}")
print(f"Matched Codes:")
for i in range(k):
    print(results[i].page_content)

Zprava: 
MUDr. Kryštofová Dominika
C163 
Pacientka se dostavila na 2.lůžkovou stanici k podání transfuzí - na Hb 80g/l. V čase od 11.25 do 13.00 podány 2 TU ERY, krevní skupiny AB Rh + - bez komplikací. 
Pacientka odchází bez známek dechové či oběhové nedostatečnosti.

Matched Codes:
{'code': 9113, 'name': 'ODBĚR KRVE Z ARTERIE', 'description': 'U pacientů s respirační insuficiencí před indikací DDOT lze vykázat 6/1 den.', 'odbornost': '999'}
{'code': 9119, 'name': 'ODBĚR KRVE ZE ŽÍLY U DOSPĚLÉHO NEBO DÍTĚTE NAD 10 LET', 'description': 'Jde o odběr krve ze žíly vpichem. Krev slouží k diagnostickým vyšetřením v laboratoři. Jen vyjímečně může jít o výkon léčebný. V případě kombinace s výkonem č. 81443 (oGTT) lze vykázat 3/1 den.', 'odbornost': '999'}
{'code': 22365, 'name': 'ODBĚR PERIFERNÍCH KMENOVÝCH BUŇEK', 'description': 'Odběr periferních kmenových hemopoetických buněk (pro jejich transplantaci) technikou průtokové separace na separátoru krevních elementů.', 'odbornost': '222'}
{'co