Run Benchmark

Test LLM vision models on hot dog classification and compare accuracy

Models

Free vision models from OpenRouter — pick up to 4

0 active

OpenRouter API Key

Optional — leave blank to use the server default from .env. Get a key at openrouter.ai/keys

Image Data Set

Images per category. Each model gets N hot dog + N not hot dog images.