feat(learning): FU-5 — מדידת לולאת-הלמידה מול הכרעות-היו"ר (#133) #225

Merged
chaim merged 1 commits from worktree-halacha-active-learning-fu5 into main 2026-06-12 07:20:18 +00:00
Owner

מה

FU-5 — המדידה שסוגרת את 5 ה-FU של #133. מרחיב את halacha_panel_calibrate.py כדי למדוד את לולאת-הלמידה לאורך-זמן ולשמור על בריאותה מול echo-chamber.

איך

  • --source captured (חדש, אפס-עלות): מצליב סבבי-פאנל שמורים (FU-1) מול הכרעות-היו"ר (FU-2) דרך db.panel_rounds_vs_chair, ומדווח split-rate + auto-precision + false-keep/false-drop לכל סבב (per round-day) מול ה-gold-set הגדל. כך רואים את הלולאה עובדת: ככל שהרובריקה משתפרת (FU-4 → אימוץ-יו"ר), precision נשמר ו-split יורד. בלי re-vote, בלי LLM.
  • summarize_calibration() + bucket_by_round() — עוזרים טהורים (offline-testable). משתפים את analyze_pairs של FU-4 → "מה נכשל" מחושב במקום אחד (בלי drift, G2).
  • anon-stability: שתי המדידות מדווחות את שיעור-יציבות מבחן-האנונימיזציה (#81.7) כמטריקת-בריאות נגד echo-chamber — נפילה = שינון במקום היגיון.
  • --source live (הקיים): נוסף עמודת split-rate מפורשת + שורת anon-stability.

בדיקות

tests/test_panel_calibrate_captured.py — 5 בדיקות offline (split-rate/precision; ריק בטוח; pairs לא-מתויגים מסוננים; מגמת per-round ממוינת; round_ts חסר→unknown). smoke read-only עבר (0 זוגות → nothing-to-measure). רגרסיה FU-2/3/4 + goldset (30) עברה.

Invariants

  • read-only מדידה — הסקריפט לא כותב כלום.
  • INV-G10 / anti-echo-chamber — האמת היחידה היא הכרעת-היו"ר; anon-stability שומר מפני סחיפה.
  • G2analyze_pairs מקור-יחיד לסטטיסטיקת-הכשל (משותף עם FU-4).

הלולאה — הושלמה

5/5 FU של #133: FU-1 לכידת-סבבים → FU-2 seed מהכרעת-יו"ר → FU-3 מיון-לפי-מחלוקת → FU-4 הצעת-rubric (propose-only) → FU-5 מדידה. הסגירה עוברת דרך שער-היו"ר האנושי בכל שלב; אין auto-commit.

הערה: ה-captured-mode יתחיל להראות מגמה רק כשיצטברו seeds (FU-2) — היו"ר סוקרת הלכות שהפאנל שפט. כרגע 0.

🤖 Generated with Claude Code

## מה FU-5 — המדידה ש**סוגרת את 5 ה-FU של #133**. מרחיב את `halacha_panel_calibrate.py` כדי למדוד את לולאת-הלמידה לאורך-זמן ולשמור על בריאותה מול echo-chamber. ## איך - **`--source captured`** (חדש, **אפס-עלות**): מצליב סבבי-פאנל שמורים (FU-1) מול הכרעות-היו"ר (FU-2) דרך `db.panel_rounds_vs_chair`, ומדווח `split-rate` + `auto-precision` + false-keep/false-drop **לכל סבב (per round-day)** מול ה-gold-set הגדל. כך רואים את הלולאה עובדת: ככל שהרובריקה משתפרת (FU-4 → אימוץ-יו"ר), precision נשמר ו-split יורד. בלי re-vote, בלי LLM. - **`summarize_calibration()` + `bucket_by_round()`** — עוזרים **טהורים** (offline-testable). משתפים את `analyze_pairs` של FU-4 → "מה נכשל" מחושב **במקום אחד** (בלי drift, G2). - **anon-stability**: שתי המדידות מדווחות את שיעור-יציבות מבחן-האנונימיזציה (#81.7) כמטריקת-בריאות נגד echo-chamber — נפילה = שינון במקום היגיון. - **`--source live`** (הקיים): נוסף עמודת `split-rate` מפורשת + שורת anon-stability. ## בדיקות `tests/test_panel_calibrate_captured.py` — 5 בדיקות **offline** (split-rate/precision; ריק בטוח; pairs לא-מתויגים מסוננים; מגמת per-round ממוינת; round_ts חסר→unknown). ✅ smoke read-only עבר (0 זוגות → nothing-to-measure). רגרסיה FU-2/3/4 + goldset (30) עברה. ## Invariants - **read-only מדידה** — הסקריפט לא כותב כלום. - **INV-G10 / anti-echo-chamber** — האמת היחידה היא הכרעת-היו"ר; anon-stability שומר מפני סחיפה. - **G2** — `analyze_pairs` מקור-יחיד לסטטיסטיקת-הכשל (משותף עם FU-4). ## הלולאה — הושלמה 5/5 FU של #133: FU-1 לכידת-סבבים → FU-2 seed מהכרעת-יו"ר → FU-3 מיון-לפי-מחלוקת → FU-4 הצעת-rubric (propose-only) → **FU-5 מדידה**. הסגירה עוברת דרך שער-היו"ר האנושי בכל שלב; אין auto-commit. > הערה: ה-captured-mode יתחיל להראות מגמה רק כשיצטברו seeds (FU-2) — היו"ר סוקרת הלכות שהפאנל שפט. כרגע 0. 🤖 Generated with [Claude Code](https://claude.com/claude-code)
chaim added 1 commit 2026-06-12 07:20:13 +00:00
feat(learning): FU-5 — מדידת לולאת-הלמידה מול הכרעות-היו"ר (#133)
All checks were successful
G12 Leak-Guard / leak-guard (pull_request) Successful in 6s
d246fb85fc
מרחיב את halacha_panel_calibrate.py כדי למדוד את הלולאה לאורך-זמן ולשמור
על בריאותה — סוגר את 5 ה-FU של #133.

- --source captured (חדש, אפס-עלות): מצליב סבבי-פאנל שמורים (FU-1) מול
  הכרעות-היו"ר (FU-2) דרך db.panel_rounds_vs_chair, ומדווח split-rate +
  auto-precision + false-keep/false-drop **לכל סבב (per round-day)** מול
  ה-gold-set הגדל. כך רואים את הלולאה עובדת: ככל שהרובריקה משתפרת
  (FU-4 → אימוץ-יו"ר) — precision נשמר ו-split יורד. בלי re-vote, בלי LLM.
- summarize_calibration() + bucket_by_round() — עוזרים טהורים (offline-
  testable). משתפים את analyze_pairs של FU-4 → "מה נכשל" מחושב במקום אחד
  (בלי drift, G2).
- anon-stability: שתי המדידות מדווחות את שיעור-יציבות מבחן-האנונימיזציה
  (#81.7) כמטריקת-בריאות נגד echo-chamber — נפילה = שינון במקום היגיון.
- --source live (קיים): נוסף עמוד split-rate מפורש + anon-stability.
- tests/test_panel_calibrate_captured.py — 5 בדיקות offline. SCRIPTS.md
  עודכן. smoke read-only עבר (0 זוגות → nothing-to-measure).

Invariants: read-only מדידה · INV-G10 (האמת=הכרעת-יו"ר) · anti-echo-
chamber (anon-stability) · G2 (analyze_pairs מקור-יחיד). רגרסיה 30 עברו.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
chaim merged commit a0b3c17381 into main 2026-06-12 07:20:18 +00:00
chaim deleted branch worktree-halacha-active-learning-fu5 2026-06-12 07:20:18 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: ezer-mishpati/legal-ai#225