Wenbobobo · Wenbobobo · Apr 17, 2026 · Copilot · Apr 17, 2026 · Copilot
diff --git a/.jules/bolt.md b/.jules/bolt.md
@@ -0,0 +1,4 @@
+
+## 2024-05-18 - Eager instantiation with dict.setdefault
+**Learning:** `dict.setdefault(key, expensive_default)` inside hot loops eagerly evaluates `expensive_default` on *every* iteration, which is a major performance bottleneck for Python loops where defaults are objects or lists.
+**Action:** Always replace `setdefault` with an explicit `if key not in dict: dict[key] = ...` membership check to prevent eager evaluation.
-**Action:** Always replace `setdefault` with an explicit `if key not in dict: dict[key] = ...` membership check to prevent eager evaluation.
+**Action:** When the default is expensive to construct or allocates new objects—especially in hot loops—avoid `setdefault(...)` and use lazy initialization instead, for example with `value = d.get(key)` followed by initialize-on-miss logic (or an explicit `if key not in d: d[key] = ...`). For cheap or constant defaults, `setdefault` can still be acceptable.
-**Action:** Always replace `setdefault` with an explicit `if key not in dict: dict[key] = ...` membership check to prevent eager evaluation.
+**Action:** When the default is expensive to construct or allocates new objects—especially in hot loops—avoid `setdefault(...)` and use lazy initialization instead, for example with `value = d.get(key)` followed by initialize-on-miss logic (or an explicit `if key not in d: d[key] = ...`). For cheap or constant defaults, `setdefault` can still be acceptable.
diff --git a/src/geometry/hull_kv.py b/src/geometry/hull_kv.py
@@ -17,7 +17,6 @@
     HardmaxResult,
     NumberLike,
     ValueLike,
-    _as_fraction,
     _coerce_key,
     _coerce_value,
     _normalize_number,
@@ -205,10 +204,12 @@ def _rebuild_if_needed(self) -> None:
         total_value_sum = [Fraction(0) for _ in range(self._value_width or 0)]
 
         for index, (key, value) in enumerate(self._entries):
-            bucket = aggregates.setdefault(
-                key,
-                {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []},
-            )
+            # Avoid eager instantiation of expensive default dict/list for every iteration
+            # by using an explicit membership check instead of setdefault.
+            if key not in aggregates:
+                aggregates[key] = {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []}
+            bucket = aggregates[key]
-            # by using an explicit membership check instead of setdefault.
-            if key not in aggregates:
-                aggregates[key] = {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []}
-            bucket = aggregates[key]
+            # by initializing the bucket lazily only when the key is first seen.
+            bucket = aggregates.get(key)
+            if bucket is None:
+                bucket = {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []}
+                aggregates[key] = bucket
-            # by using an explicit membership check instead of setdefault.
-            if key not in aggregates:
-                aggregates[key] = {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []}
-            bucket = aggregates[key]
+            # by initializing the bucket lazily only when the key is first seen.
+            bucket = aggregates.get(key)
+            if bucket is None:
+                bucket = {"value_sum": [Fraction(0) for _ in value], "count": 0, "entry_indices": []}
+                aggregates[key] = bucket
+
             for coord_index, coord in enumerate(value):
                 bucket["value_sum"][coord_index] += coord
                 total_value_sum[coord_index] += coord

diff --git a/src/model/free_running_executor.py b/src/model/free_running_executor.py
@@ -697,14 +697,14 @@ def evaluate_free_running_programs(
 
         outcomes.append(outcome)
         bucket = bucket_name(outcome.program_steps)
-        bucket_state = per_bucket.setdefault(
-            bucket,
-            {
+        # Avoid eager instantiation of default dict on every iteration
+        if bucket not in per_bucket:
+            per_bucket[bucket] = {
                 "program_count": 0,
                 "exact_trace_count": 0,
                 "exact_final_state_count": 0,
-            },
-        )
+            }
+        bucket_state = per_bucket[bucket]
         bucket_state["program_count"] += 1
         bucket_state["exact_trace_count"] += int(outcome.exact_trace_match)
         bucket_state["exact_final_state_count"] += int(outcome.exact_final_state_match)

diff --git a/src/model/induced_causal.py b/src/model/induced_causal.py
@@ -455,7 +455,10 @@ def fit_transition_library(
     examples = build_transition_examples(programs, interpreter=interpreter)
     by_opcode: dict[Opcode, list[TransitionExample]] = {}
     for example in examples:
-        by_opcode.setdefault(example.opcode, []).append(example)
+        # Avoid eager instantiation of default list on every iteration
+        if example.opcode not in by_opcode:
+            by_opcode[example.opcode] = []
+        by_opcode[example.opcode].append(example)
-        # Avoid eager instantiation of default list on every iteration
-        if example.opcode not in by_opcode:
-            by_opcode[example.opcode] = []
-        by_opcode[example.opcode].append(example)
+        examples_for_opcode = by_opcode.get(example.opcode)
+        if examples_for_opcode is None:
+            examples_for_opcode = []
+            by_opcode[example.opcode] = examples_for_opcode
+        examples_for_opcode.append(example)
-        # Avoid eager instantiation of default list on every iteration
-        if example.opcode not in by_opcode:
-            by_opcode[example.opcode] = []
-        by_opcode[example.opcode].append(example)
+        examples_for_opcode = by_opcode.get(example.opcode)
+        if examples_for_opcode is None:
+            examples_for_opcode = []
+            by_opcode[example.opcode] = examples_for_opcode
+        examples_for_opcode.append(example)
 
     rules = tuple(_fit_rule_for_opcode(by_opcode[opcode], opcode) for opcode in sorted(by_opcode, key=str))
     return InducedTransitionLibrary(rules=rules)

diff --git a/src/model/softmax_baseline.py b/src/model/softmax_baseline.py
@@ -582,15 +582,15 @@ def evaluate_teacher_forced_model(
                 total_correct += correct
 
                 bucket = baseline_bucket_name(example.program_steps)
-                bucket_state = per_bucket.setdefault(
-                    bucket,
-                    {
+                # Avoid eager instantiation of default dict on every iteration
+                if bucket not in per_bucket:
+                    per_bucket[bucket] = {
                         "example_count": 0,
                         "token_count": 0,
                         "correct_tokens": 0,
                         "weighted_loss": 0.0,
-                    },
-                )
+                    }
+                bucket_state = per_bucket[bucket]
                 bucket_state["example_count"] = int(bucket_state["example_count"]) + 1
                 bucket_state["token_count"] = int(bucket_state["token_count"]) + token_count
                 bucket_state["correct_tokens"] = int(bucket_state["correct_tokens"]) + correct
@@ -753,7 +753,10 @@ def evaluate_free_running_rollout(
             )
 
             bucket = baseline_bucket_name(example.program_steps)
-            bucket_state = per_bucket.setdefault(bucket, {"example_count": 0, "exact_count": 0})
+            # Avoid eager instantiation of default dict on every iteration
+            if bucket not in per_bucket:
+                per_bucket[bucket] = {"example_count": 0, "exact_count": 0}
+            bucket_state = per_bucket[bucket]
             bucket_state["example_count"] = int(bucket_state["example_count"]) + 1
             bucket_state["exact_count"] = int(bucket_state["exact_count"]) + int(exact)
 

diff --git a/src/model/trainable_latest_write.py b/src/model/trainable_latest_write.py
@@ -171,7 +171,10 @@ def exact_program_accuracy(scorer: TrainableLatestWriteScorer, samples: Sequence
         return 0.0
     per_program: dict[str, list[bool]] = {}
     for sample in samples:
-        per_program.setdefault(sample.program_name, []).append(scorer.predict_index(sample) == sample.target_index)
+        # Avoid eager instantiation of default list on every iteration
+        if sample.program_name not in per_program:
+            per_program[sample.program_name] = []
+        per_program[sample.program_name].append(scorer.predict_index(sample) == sample.target_index)
     exact = sum(1 for outcomes in per_program.values() if all(outcomes))
     return exact / len(per_program)
 
@@ -198,12 +201,21 @@ def evaluate_scorer(
         correct_samples += int(correct)
 
         bucket = bucket_name(sample.program_steps)
-        bucket_state = per_bucket.setdefault(bucket, {"sample_count": 0, "sample_correct": 0, "programs": {}})
+        # Avoid eager instantiation of default dict on every iteration
+        if bucket not in per_bucket:
+            per_bucket[bucket] = {"sample_count": 0, "sample_correct": 0, "programs": {}}
+        bucket_state = per_bucket[bucket]
-        if bucket not in per_bucket:
-            per_bucket[bucket] = {"sample_count": 0, "sample_correct": 0, "programs": {}}
-        bucket_state = per_bucket[bucket]
+        bucket_state = per_bucket.get(bucket)
+        if bucket_state is None:
+            bucket_state = {"sample_count": 0, "sample_correct": 0, "programs": {}}
+            per_bucket[bucket] = bucket_state
-        if bucket not in per_bucket:
-            per_bucket[bucket] = {"sample_count": 0, "sample_correct": 0, "programs": {}}
-        bucket_state = per_bucket[bucket]
+        bucket_state = per_bucket.get(bucket)
+        if bucket_state is None:
+            bucket_state = {"sample_count": 0, "sample_correct": 0, "programs": {}}
+            per_bucket[bucket] = bucket_state
         bucket_state["sample_count"] = int(bucket_state["sample_count"]) + 1
         bucket_state["sample_correct"] = int(bucket_state["sample_correct"]) + int(correct)
-        bucket_state["programs"].setdefault(sample.program_name, []).append(correct)
 
-        per_program.setdefault(sample.program_name, []).append(correct)
+        programs_dict = bucket_state["programs"]
+        if sample.program_name not in programs_dict:
+            programs_dict[sample.program_name] = []
+        programs_dict[sample.program_name].append(correct)
-        if sample.program_name not in programs_dict:
-            programs_dict[sample.program_name] = []
-        programs_dict[sample.program_name].append(correct)
+        program_outcomes = programs_dict.get(sample.program_name)
+        if program_outcomes is None:
+            program_outcomes = []
+            programs_dict[sample.program_name] = program_outcomes
+        program_outcomes.append(correct)
-        if sample.program_name not in programs_dict:
-            programs_dict[sample.program_name] = []
-        programs_dict[sample.program_name].append(correct)
+        program_outcomes = programs_dict.get(sample.program_name)
+        if program_outcomes is None:
+            program_outcomes = []
+            programs_dict[sample.program_name] = program_outcomes
+        program_outcomes.append(correct)
+
+        if sample.program_name not in per_program:
+            per_program[sample.program_name] = []
+        per_program[sample.program_name].append(correct)
         program_steps[sample.program_name] = sample.program_steps
 
     exact_programs = sum(1 for outcomes in per_program.values() if all(outcomes))