added tests for evlauation_functoin()

HarrySu123 · HarrySu123 · commit 6dd182c1dd54 · 2026-01-16T16:00:17.000Z
diff --git a/config.json b/config.json
@@ -1,3 +1,3 @@
 {
-  "EvaluationFunctionName": ""
+  "EvaluationFunctionName": "evaluatePropositionalLogic"
 }
diff --git a/evaluation_function/evaluation.py b/evaluation_function/evaluation.py
@@ -1,9 +1,10 @@
 from typing import Any
 from lf_toolkit.evaluation import Result, Params
 
+from evaluation_function.domain.evaluators import *
 from evaluation_function.domain.formula import *
-from parsing.tokenizer import *
-from parsing.tree_builder import *
+from evaluation_function.parsing.tokenizer import *
+from evaluation_function.parsing.tree_builder import *
 
 
 # def parse_response(response: str) -> tuple[bool, Formula | str]:
@@ -138,7 +139,7 @@ def evaluation_function(
     if not isinstance(response, str):
         return Result(
             is_correct=False,
-            feedback="Please enter a string/text."
+            feedback_items=[("incorrect input", "resposne must be type String")]
         )
 
     
@@ -163,7 +164,7 @@ def evaluation_function(
     except ValueError as e:
         return Result(
             is_correct=False,
-            feedback=str(e)
+            feedback_items=[(ValueError, str(e))]
         )
 
 
@@ -175,7 +176,7 @@ def evaluation_function(
     except BuildError as e:
         return Result(
             is_correct=False,
-            feedback=str(e)
+            feedback_items=[(BuildError, str(e))]
         )
 
     #swtich on action
diff --git a/evaluation_function/evaluation_test.py b/evaluation_function/evaluation_test.py
@@ -21,10 +21,43 @@ class TestEvaluationFunction(unittest.TestCase):
     as it should.
     """
 
-    def test_evaluation(self):
+    def test_evaluation_default(self):
         response, answer, params = "Hello, World", "Hello, World", Params()
 
         result = evaluation_function(response, answer, params).to_dict()
 
-        self.assertEqual(result.get("is_correct"), True)
-        self.assertFalse(result.get("feedback", False))
+        self.assertEqual(result.get("is_correct"), False)
+        self.assertFalse(len(result.get("feedback", [])) == 0)
+
+    def test_check_tautology(self):
+        
+        response, answer, params = "p ∨ ¬p", "", {"action": "tautology"}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertTrue(result.get("is_correct"))
+
+    def test_check_tautology_fail(self):
+        
+        response, answer, params = "p ∧ ¬p", "", {"action": "tautology"}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))
+
+    
+    def test_check_satisfiability(self):
+        
+        response, answer, params = "p ∧ q", "", {"action": "satisfiability"}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertTrue(result.get("is_correct"))
+    
+    def test_check_satisfiability_fail(self):
+        
+        response, answer, params = "p ∧ ¬p", "", {"action": "satisfiability"}
+
+        result = evaluation_function(response, answer, params).to_dict()
+
+        self.assertFalse(result.get("is_correct"))

Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,3 @@`
`1`	`1`	`{`
`2`		`- "EvaluationFunctionName": ""`
	`2`	`+ "EvaluationFunctionName": "evaluatePropositionalLogic"`
`3`	`3`	`}`