feat: changed marking params to be in answer, not params, for easier frontend config

ashwin6-dev · ashwin6-dev · commit f08d8002a1ec · 2026-02-19T06:00:22.000Z
diff --git a/docs/dev.md b/docs/dev.md
@@ -9,32 +9,34 @@ Select the sort of evlauation you want to using the check box. Make sure to only
 
 ```json
 {
-  "response":"<str>",
-  "answer":"<str>",
-  "params": {
-    "truthTable": "<bool>",
-    "equivalence": "<bool>",
-    "tautology": "<bool>",
-    "satisfiability": "<bool>",
-  }
+  "response": { "formula": "<str>", "truthTable": null | { "variables": ["<str>"], "cells": [[ "<str>" ]] } },
+  "answer": {
+    "satisability": true | false,
+    "tautology": true | false,
+    "equivalent": null | "<str>",
+    "truthTable": null | { }
+  },
+  "params": { }
 }
 ```
 
+Exactly one of `satisability`, `tautology`, `equivalent` (non-null), or `truthTable` (non-null) must be set in `answer` to choose the evaluation mode.
+
 ### `truthTable`
 
-uses the evaluation for truth tables
+When `answer.truthTable` is not null, uses truth table evaluation (response must include `truthTable` with `variables` and `cells`).
 
-### `equivalence`
+### `equivalent`
 
-checks if response formula and answer formula are equivalent
+When `answer.equivalent` is a string, checks if response formula and that formula are equivalent.
 
 ### `tautology`
 
-checks if response formula is a tautology
+When `answer.tautology` is true, checks if response formula is a tautology.
 
-### `satisfiability`
+### `satisability`
 
-checks if response formula is satisfiabiable
+When `answer.satisability` is true, checks if response formula is satisfiable.
 
 ## Outputs
 
diff --git a/evaluation_function/evaluation.py b/evaluation_function/evaluation.py
@@ -41,7 +41,7 @@ def evaluation_function(
 
 
     try:
-        if not isinstance(answer, str):
+        if not isinstance(answer, dict):
             return Result(
                 is_correct=False,
                 feedback_items=[("incorrect input", "missing answer object")]
@@ -66,50 +66,64 @@ def evaluation_function(
 
         formula = formula_parser(response_formula)
 
-        # check if input is a truth table
-        truth_table = response.get("truthTable", None)
-        if truth_table is not None and isinstance(truth_table, dict):
-            variables = truth_table.get("variables", [])
-            cells = truth_table.get("cells", [])
+        # Answer shape: satisability (bool), tautology (bool), equivalent (None|str), truthTable (None|dict)
+        satisability = answer.get("satisability", False) is True
+        tautology = answer.get("tautology", False) is True
+        equivalent = answer.get("equivalent")
+        if equivalent is not None and not isinstance(equivalent, str):
+            equivalent = None
+        elif equivalent is not None and isinstance(equivalent, str) and equivalent.strip() == "":
+            equivalent = None
+        answer_truth_table = answer.get("truthTable")
 
-            if not isinstance(variables, list) or not isinstance(cells, list):
-                return Result(
-                    is_correct=False,
-                    feedback_items=[("incorrect input", "truthTable must contain 'variables' and 'cells' arrays")]
-                )
+        has_equivalence = equivalent is not None
+        has_truth_table = answer_truth_table is not None
 
-            answer_formula = formula_parser(answer)
-            num_atoms = len(_extract_atoms(answer_formula))
-
-            truth_table_result = evaluate_truth_table(variables, cells, num_atoms)
-            if not truth_table_result.is_correct:
-                return truth_table_result
-
-        equivalence = params.get("equivalence", False)
-        tautology = params.get("tautology", False)
-        satisfiability = params.get("satisfiability", False)
-
-        num_selected = sum([equivalence, tautology, satisfiability])
+        num_selected = sum([satisability, tautology, has_equivalence, has_truth_table])
 
         if num_selected == 0:
             return Result(
                 is_correct=False,
                 feedback_items=[("invalid param", "please select a param")]
             )
-        elif num_selected > 1:
+        if num_selected > 1:
             return Result(
                 is_correct=False,
                 feedback_items=[("invalid param", "please only select 1 param")]
             )
 
+        # Truth table mode: validate response truth table if present
+        response_truth_table = response.get("truthTable", None)
+        if has_truth_table:
+            if response_truth_table is None or not isinstance(response_truth_table, dict):
+                return Result(
+                    is_correct=False,
+                    feedback_items=[("incorrect input", "truthTable required when answer expects truth table")]
+                )
+            variables = response_truth_table.get("variables", [])
+            cells = response_truth_table.get("cells", [])
+
+            if not isinstance(variables, list) or not isinstance(cells, list):
+                return Result(
+                    is_correct=False,
+                    feedback_items=[("incorrect input", "truthTable must contain 'variables' and 'cells' arrays")]
+                )
+
+            num_atoms = len(_extract_atoms(formula))
+            truth_table_result = evaluate_truth_table(variables, cells, num_atoms)
+            if not truth_table_result.is_correct:
+                return truth_table_result
+
         is_correct = False
-        if equivalence:
-            answer_formula = formula_parser(answer)
+        if has_equivalence:
+            answer_formula = formula_parser(equivalent)
             is_correct = EquivalenceEvaluator(formula, answer_formula).evaluate()
         elif tautology:
             is_correct = TautologyEvaluator(formula).evaluate()
-        elif satisfiability:
+        elif satisability:
             is_correct = SatisfiabilityEvaluator(formula).evaluate()
+        elif has_truth_table:
+            is_correct = True  # already validated above
 
         return Result(is_correct=is_correct)
 
diff --git a/evaluation_function/evaluation_test.py b/evaluation_function/evaluation_test.py
@@ -23,7 +23,7 @@ class TestEvaluationFunction(unittest.TestCase):
 
     def test_evaluation_default(self):
         response = {"formula": "Hello, World"}
-        answer = "Hello, World"
+        answer = "Hello, World"  # invalid: answer must be dict
         params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
@@ -32,53 +32,53 @@ def test_evaluation_default(self):
 
     def test_check_tautology(self):
         response = {"formula": "p ∨ ¬p"}
-        answer = ""
-        params = {"tautology": True}
+        answer = {"satisability": False, "tautology": True, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
 
     def test_check_tautology_fail(self):
         response = {"formula": "p ∧ ¬p"}
-        answer = ""
-        params = {"tautology": True}
+        answer = {"satisability": False, "tautology": True, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
     def test_check_satisfiability(self):
         response = {"formula": "p ∧ q"}
-        answer = ""
-        params = {"satisfiability": True}
+        answer = {"satisability": True, "tautology": False, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
-    
+
     def test_check_satisfiability_fail(self):
         response = {"formula": "p ∧ ¬p"}
-        answer = ""
-        params = {"satisfiability": True}
+        answer = {"satisability": True, "tautology": False, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
     def test_check_equivalence(self):
         response = {"formula": "p ∧ q"}
-        answer = "p ∧ (q ∨ q)"
-        params = {"equivalence": True}
+        answer = {"satisability": False, "tautology": False, "equivalent": "p ∧ (q ∨ q)", "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertTrue(result.get("is_correct"))
-    
+
     def test_check_equivalence_fail(self):
         response = {"formula": "p ∧ q"}
-        answer = "p"
-        params = {"equivalence": True}
+        answer = {"satisability": False, "tautology": False, "equivalent": "p", "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
@@ -97,8 +97,8 @@ def test_truth_table_valid(self):
                 ]
             }
         }
-        answer = "p ∧ q"
-        params = {"equivalence": True}
+        answer = {"satisability": False, "tautology": False, "equivalent": None, "truthTable": {}}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
@@ -117,17 +117,17 @@ def test_truth_table_invalid(self):
                 ]
             }
         }
-        answer = "p ∧ q"
-        params = {"equivalence": True}
+        answer = {"satisability": False, "tautology": False, "equivalent": None, "truthTable": {}}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
     def test_invalid_response_type(self):
         response = "just a string"  # Invalid type
-        answer = "p"
-        params = {"tautology": True}
+        answer = {"satisability": False, "tautology": True, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
@@ -136,26 +136,26 @@ def test_invalid_response_type(self):
 
     def test_missing_formula_field(self):
         response = {"wrongField": "p"}
-        answer = "p"
-        params = {"tautology": True}
+        answer = {"satisability": False, "tautology": True, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
     def test_no_params_selected(self):
         response = {"formula": "p"}
-        answer = "p"
-        params = {}
+        answer = {"satisability": False, "tautology": False, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
         self.assertFalse(result.get("is_correct"))
 
     def test_multiple_params_selected(self):
         response = {"formula": "p"}
-        answer = "p"
-        params = {"tautology": True, "satisfiability": True}
+        answer = {"satisability": True, "tautology": True, "equivalent": None, "truthTable": None}
+        params = Params()
 
         result = evaluation_function(response, answer, params).to_dict()