Output Quality Evaluator (LLM-as-a-Judge)

Model: GPT-4

Difficulty: Intermediate

Likes: 0

Copies: 0

evaluationLLM-as-a-judgequality

Evaluate the following output [output text] for [criteria such as accuracy, clarity, relevance], and provide a score and reasoning.

Provides structured evaluation metrics, improving feedback quality.

Score: 8/10 — Accurate but lacks detail in explaining cause-effect relationships.