llm-evaluation

For the purposes of familiarization and learning. Consists of utilizing LangChain framework, LangSmith for tracing, OpenAI LLM models, Pinecone serverless vectorDB using Jupyter Notebook and Python.

models prompt parsers pinecone rag llm langchain-python langchain-chains langchain-agent llm-evaluation llmchain

Updated Mar 29, 2024
Jupyter Notebook

prompt-foundry / dotnet-sdk

Star

The prompt engineering, prompt management, and prompt evaluation tool for C# and .NET

csharp dotnet prompt prompt-engineering prompt-manager prompt-management llm-eval llm-evaluation prompt-evaluation

Updated Jun 16, 2024

euskoog / openai-assistants-evals

Star

Visualize LLM Evaluations for OpenAI Assistants

openai tailwindcss llms llm-evaluation openai-assistants

Updated Mar 27, 2024
TypeScript

awesome-software / ray-summit-2023-training

Star

llm-evaluation

Updated Sep 21, 2023
Jupyter Notebook

j0st / PoliticalLLM

Star

A framework for automatically manipulating and evaluating the political ideology of LLMs with two ideology tests: Wahl-O-Mat and Political Compass Test.

german pct manifesto-project rag wahlomat political-ideology-detection llms llm-evaluation

Updated May 1, 2024
Python

innerNULL / summary-evaluator

Star

Summary Evaluation Tool

nlp deep-learning text-summarization model-evaluation model-evaluation-metrics llm bertscore llm-evaluation

Updated Jun 18, 2024
Python

prompt-foundry / typescript-sdk

Star

The prompt engineering, prompt management, and prompt evaluation tool for TypeScript, JavaScript, and NodeJS.

typescript gpt open-ai gpt-3 gpt-4 llm prompt-engineering llmops prompt-testing prompt-manager prompt-management llm-eval llm-test llm-ops llm-evaluation prompt-evaluation

Updated Jun 18, 2024
TypeScript

Improve this page

Add a description, image, and links to the llm-evaluation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the llm-evaluation topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

llm-evaluation

Here are 69 public repositories matching this topic...

fuxiAIlab / CivAgent

prompt-foundry / ruby-sdk

nagababumo / Automated-Testing-for-LLMOps

prompt-foundry / java-sdk

gretelai / navigator-helpers

IteraLabs / knowledge-benchmarks

prompt-foundry / go-sdk

SharathHebbar / eval_llms

wittyicon29 / Custom-Evaluate-LLM

nagababumo / Building-and-Evaluating-Advanced-RAG

prompt-foundry / kotlin-sdk

awesome-software / lm-evaluation-harness

aknvictor / calibrationgame

DavidGir / LangChain-Familiarization

prompt-foundry / dotnet-sdk

euskoog / openai-assistants-evals

awesome-software / ray-summit-2023-training

j0st / PoliticalLLM

innerNULL / summary-evaluator

prompt-foundry / typescript-sdk

Improve this page

Add this topic to your repo