updated tests to ensure eval works with reasonable subset of python operations, and classes

kiranandcode · kiranandcode · commit 4f1e2921efb6 · 2026-01-28T12:02:10.000-05:00
diff --git a/effectful/handlers/llm/evaluation.py b/effectful/handlers/llm/evaluation.py
@@ -4,7 +4,12 @@
 from types import CodeType
 from typing import Any
 
-from RestrictedPython import compile_restricted, safe_globals
+from RestrictedPython import (
+    Eval,
+    Guards,
+    compile_restricted,
+    safe_globals,
+)
 
 from effectful.ops.syntax import ObjectInterpretation, defop, implements
 
@@ -117,9 +122,24 @@ def exec(
         # Build restricted globals from RestrictedPython's defaults, then layer `env` on top
         # (without letting callers replace the restricted builtins).
         rglobals = safe_globals.copy()
+
+        # Enable class definitions (required for Python 3)
+        rglobals["__metaclass__"] = type
+        rglobals["__name__"] = "restricted"
+
+        # Layer `env` on top (without letting callers replace the restricted builtins).
         for k, v in env.items():
             if k != "__builtins__":
                 rglobals[k] = v
 
+        # Enable for loops and comprehensions
+        rglobals["_getiter_"] = Eval.default_guarded_getiter
+
+        # Enable sequence unpacking in comprehensions and for loops
+        rglobals["_iter_unpack_sequence_"] = Guards.guarded_iter_unpack_sequence
+        rglobals["getattr"] = Guards.safer_getattr
+        rglobals["setattr"] = Guards.guarded_setattr
+        rglobals["_write_"] = lambda x: x
+
         # Execute with locals=env so top-level defs land in `env` (like your UnsafeEvalProvider).
         builtins.exec(bytecode, rglobals, env)
diff --git a/tests/test_handlers_llm_encoding.py b/tests/test_handlers_llm_encoding.py
@@ -829,16 +829,7 @@ def bar():
                 encodable.decode(source, {})
 
     @pytest.mark.parametrize(
-        "eval_provider",
-        [
-            UnsafeEvalProvider,
-            pytest.param(
-                RestrictedEvalProvider,
-                marks=pytest.mark.skip(
-                    reason="RestrictedPython doesn't support class definitions"
-                ),
-            ),
-        ],
+        "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
     )
     def test_decode_class(self, eval_provider):
         from collections.abc import Callable
@@ -858,6 +849,80 @@ def greet(self):
         instance = decoded("World")
         assert instance.greet() == "Hello, World!"
 
+    @pytest.mark.parametrize(
+        "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
+    )
+    def test_decode_function_with_for_loop(self, eval_provider):
+        from collections.abc import Callable
+
+        encodable = type_to_encodable_type(Callable)
+        # Test function with for loop
+        source = """def sum_list(items):
+    total = 0
+    for item in items:
+        total = total + item
+    return total"""
+
+        with handler(eval_provider()):
+            decoded = encodable.decode(source, {})
+        assert callable(decoded)
+        assert decoded([1, 2, 3, 4]) == 10
+        assert decoded([5, 10]) == 15
+
+    @pytest.mark.parametrize(
+        "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
+    )
+    def test_decode_function_with_list_comprehension(self, eval_provider):
+        from collections.abc import Callable
+
+        encodable = type_to_encodable_type(Callable)
+        # Test function with list comprehension
+        source = """def double_items(items):
+    return [x * 2 for x in items]"""
+
+        with handler(eval_provider()):
+            decoded = encodable.decode(source, {})
+        assert callable(decoded)
+        assert decoded([1, 2, 3]) == [2, 4, 6]
+        assert decoded([5, 10, 15]) == [10, 20, 30]
+
+    @pytest.mark.parametrize(
+        "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
+    )
+    def test_decode_function_with_dict_comprehension(self, eval_provider):
+        from collections.abc import Callable
+
+        encodable = type_to_encodable_type(Callable)
+        # Test function with dict comprehension
+        source = """def square_dict(items):
+    return {x: x * x for x in items}"""
+
+        with handler(eval_provider()):
+            decoded = encodable.decode(source, {})
+        assert callable(decoded)
+        assert decoded([1, 2, 3]) == {1: 1, 2: 4, 3: 9}
+        assert decoded([5, 10]) == {5: 25, 10: 100}
+
+    @pytest.mark.parametrize(
+        "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
+    )
+    def test_decode_function_with_unpacking(self, eval_provider):
+        from collections.abc import Callable
+
+        encodable = type_to_encodable_type(Callable)
+        # Test function with tuple unpacking
+        source = """def process_pairs(pairs):
+    results = []
+    for a, b in pairs:
+        results.append(a + b)
+    return results"""
+
+        with handler(eval_provider()):
+            decoded = encodable.decode(source, {})
+        assert callable(decoded)
+        assert decoded([(1, 2), (3, 4)]) == [3, 7]
+        assert decoded([(10, 20)]) == [30]
+
     @pytest.mark.parametrize(
         "eval_provider", [UnsafeEvalProvider, RestrictedEvalProvider]
     )