OLMO-eval | LLMWay – The Way To LLM

Evaluation

OLMO-eval

a repository for evaluating open language models.

GitHub

a repository for evaluating open language models.

a unified platform from LangChain framework for: evaluation, collaboration HITL (Human In The Loop), logging and monitoring LLM applications.

Ragas 11,585

a framework that helps you evaluate your Retrieval Augmented Generation (RAG) pipelines.

Giskard 4,997

Testing & evaluation library for LLM applications, in particular RAGs

lm-evaluation-harness 10,787

A framework for few-shot evaluation of language models.

MixEval 253

A reliable click-and-go evaluation suite compatible with both open-source and proprietary models, supporting MixEval and other benchmarks.

simple-evals 4,195

Eval tools by OpenAI.