In [1]:
import os
from dotenv import load_dotenv
load_dotenv(dotenv_path='../.env')


True

In [2]:
GEMINI_API_KEY = os.getenv('GEMINI_API_KEY')

In [3]:
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex, ServiceContext, StorageContext, load_index_from_storage
from llama_index.llms.gemini import Gemini
from IPython.display import Markdown, display
import google.generativeai as genai
from llama_index.embeddings.gemini import GeminiEmbedding
from llama_index.core import Settings

In [4]:
genai.configure(api_key=GEMINI_API_KEY)

In [5]:
documents = SimpleDirectoryReader(input_dir='../data/')

In [6]:
doc = documents.load_data()

In [7]:
print(doc[0].text)

Apa itu Machine Learning? Beserta Pengertian dan Cara Kerjanya
 Dicoding Intern 19 August 2020

Di tengah pesatnya perkembangan teknologi kecerdasan buatan atau artificial intelligence (AI) saat ini. Belum banyak orang yang mengetahui bahwa kecerdasan buatan itu terdiri dari beberapa cabang, salah satunya adalah machine learning atau pembelajaran mesin. Teknologi machine learning (ML) ini merupakan salah satu cabang dari AI yang sangat menarik perhatian, kenapa? Karena machine learning merupakan mesin yang bisa belajar layaknya manusia.

Kembali pada kecerdasan buatan. Kecerdasan buatan pada pengaplikasiannya secara garis besar terbagi tujuh cabang, yaitu machine learning, natural language processing, expert system, vision, speech, planning dan robotics. Percabangan dari kecerdasan buatan tersebut dimaksudkan untuk mempersempit ruang lingkup saat pengembangan atau belajar AI, karena pada dasarnya kecerdasan buatan memiliki ruang lingkup yang sangat luas.

Cabang AI

Penjelasan lebih le

In [8]:
for model in genai.list_models():
  print(model.name, model.supported_generation_methods)

models/chat-bison-001 ['generateMessage', 'countMessageTokens']
models/text-bison-001 ['generateText', 'countTextTokens', 'createTunedTextModel']
models/embedding-gecko-001 ['embedText', 'countTextTokens']
models/gemini-1.0-pro-latest ['generateContent', 'countTokens']
models/gemini-1.0-pro ['generateContent', 'countTokens']
models/gemini-pro ['generateContent', 'countTokens']
models/gemini-1.0-pro-001 ['generateContent', 'countTokens', 'createTunedModel']
models/gemini-1.0-pro-vision-latest ['generateContent', 'countTokens']
models/gemini-pro-vision ['generateContent', 'countTokens']
models/gemini-1.5-pro-latest ['generateContent', 'countTokens']
models/gemini-1.5-pro-001 ['generateContent', 'countTokens', 'createCachedContent']
models/gemini-1.5-pro-002 ['generateContent', 'countTokens', 'createCachedContent']
models/gemini-1.5-pro ['generateContent', 'countTokens']
models/gemini-1.5-pro-exp-0801 ['generateContent', 'countTokens']
models/gemini-1.5-pro-exp-0827 ['generateContent', 'c

In [9]:
model = Gemini(model='models/gemini-pro', api_key=GEMINI_API_KEY)

In [10]:
gemini_embed_model = GeminiEmbedding(model_name="models/text-embedding-004")

In [11]:
# Configure Service Context

# service_context = ServiceContext.from_defaults(llm=model, embed_model=gemini_embed_model, chunk_size=800, chunk_overlap=20)
# service context is deprecated, use Settings
Settings.llm = model
Settings.embed_model = gemini_embed_model
Settings.chunk_size = 800
Settings.chunk_overlap = 20

In [12]:
index = VectorStoreIndex.from_documents(documents=doc, embed_model=gemini_embed_model)

In [13]:
index

<llama_index.core.indices.vector_store.base.VectorStoreIndex at 0x7f3b289607d0>

In [14]:
index.storage_context.persist()

In [15]:
query_engine = index.as_query_engine(llm=model)

In [16]:
response = query_engine.query("jelaskan tentang tv digital")

In [17]:
response.response

'Informasi yang Anda berikan tidak berisi penjelasan tentang TV digital.'