wojcik. Research
SEO LLM Benchmark
How good are language models at real-world SEO tasks? 142 challenges across all SEO categories.
Der SEO LLM Benchmark testet Sprachmodelle an praktischen SEO-Aufgaben – keine Multiple-Choice-Fragen, sondern echte Herausforderungen wie das Erzeugen von robots.txt-Dateien, Schema-Markup, Meta-Tags oder die Klassifizierung von Suchintentionen.
Jede Antwort wird deterministisch validiert (robots.txt-Parser, JSON Schema, HTML-Validator, Regex) oder bei semantisch variablen Ausgaben von einem LLM-as-Judge bewertet. Getestete Kategorien: Technical SEO, On-Page SEO, Structured Data, Content SEO, Local SEO und Off-Page SEO.
Methodik
Der Benchmark nutzt einen statischen Snapshot – alle Modelle werden gegen exakt dieselben Eingabedaten getestet. Das garantiert faire, reproduzierbare Ergebnisse, die nicht durch Website-Änderungen beeinflusst werden. Aufgaben mit variablen Ausgabeformaten (z. B. Redirect-Chain-Analysen) bewertet ein LLM-as-Judge, der die semantische Korrektheit unabhängig vom Format prüft.