Modelos Ranking Hardware Marketplace Evals Treinar Aluguéis Docs da API

Idioma

Lucebox Hub campaign banner

Suítes de eval

Suítes de benchmark da comunidade para avaliar a qualidade de LLMs locais. Envie resultados pela API.

Todos Oficial LM-Eval runs Custom / rated coding knowledge writing

v1.0 · LM-Eval run

Massive Multitask Language Understanding via EleutherAI lm-evaluation-harness task mmlu, 5-shot, exact-match/accuracy style scoring.

knowledge0 execuções

v1.0 · LM-Eval run

knowledge1 execução