feat(halacha): multi-judge approval panel + policy calibration (Trust-or-Escalate) #130
Reference in New Issue
Block a user
Delete Branch "worktree-halacha-panel"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
הרעיון
היו"ר לא יכול לסקור כל הלכה ממתינה. שלושה שופטים בלתי-תלויי-לינאז' (Opus/claude_session · DeepSeek · Gemini-2.5-flash, ה-#1 ב-LegalBench) מצביעים על הציר-הגס שהוכחנו אמין חוצה-מודלים (92%): "האם זו הלכה אמיתית לשמירה?". רק ורדיקט-מוסכם פועל; כל פיצול מוסלם ליו"ר (INV-G10). הפאנל מכווץ את התור — לא מסיר את השער.
כלים
halacha_panel_approve.py— 3 שופטים, 3 דליים: נקיות→KEEP? ·nli_unsupported→שיפוט-מחדש של ההיסק · פגומות→re-extraction. dry-run;--applyהפיך (גיבויreview_status+flags תחילה).halacha_panel_calibrate.py— מכייל מדיניות-הצבעה עלis_holdingשל הזהב (Trust-or-Escalate).כיול (100 פריטי-זהב)
אפס false-drop — הפאנל אף פעם לא דוחה הלכה טובה. מדיניות שאושרה: נקיות→רוב-2/3, nli→א-סימטרי (דחייה-ברוב/אישור-בפה-אחד), פגומות→re-extraction. + לולאת-ביטחון: ביקורת-מדגמית תקופתית.
מקורות (≥3)
Trust or Escalate (ICLR 2025, arXiv:2407.18370) · Panel of LLM Evaluators (PoLL) · selective-prediction / learning-to-defer.
Invariants
reviewerמתעד פאנל+מדיניות).--applyהפיך עם גיבוי.🤖 Generated with Claude Code