ローカルLLMの品質を評価するためのコミュニティベンチマークスイート。APIから結果を送信してください。
A lightweight 10-question sanity check for locally served models. Designed for the trusted /api/evals/execute path.