feat(agents): שער anti-hallucination משותף מעוגן-מקור (INV-AH) + ידע CEO על שטן-מליץ #171

Merged
chaim merged 1 commits from worktree-anti-hallucination-gate into main 2026-06-09 17:05:57 +00:00
Owner

מה

מחלץ את דיסציפלינת מניעת-ההזיות לבלוק קנוני אחד (docs/anti-hallucination-gate.md) ומחיל אותו אחיד על כל הסוכנים — במקום שכל סוכן ימציא אותה מחדש ad-hoc (G2).

5 טכניקות, כל אחת מעוגנת במקור מקצועי:

מקור
AH-1 עיגון-מקור (אפס ציטוט מהזיכרון) Stanford RegLab / Magesh et al., JELS 2025
AH-2 quote-or-retract · AH-3 abstention Anthropic Reduce hallucinations
AH-4 תיוג-ודאות NIST AI RMF GenAI Profile + RAGAS
AH-5 Chain-of-Verification Dhuliawala et al., arXiv:2309.11495

הפצה (DRY)

  • הפניה ב-HEARTBEAT.md (נקרא ע"י כל סוכני Paperclip).
  • שורה אחידה בבלוק "קרא לפני פעולה" של כל 8 הסוכנים, עם הערת-יישום לכל תפקיד (writer=צרכן read-only, qa=אוכף, proofreader=אל תתקן לכיוון מונח-משפטי, exporter=אפס מהות, curator=הצעות G10).
  • שורה באינדקס-המסמכים ב-CLAUDE.md.

בנוסף

legal-ceo.md מקבל ידע על "שטן מליץ (Gemini)" עם מדיניות on-demand טהורה — לא בפייפליין, מופעל רק לבקשת חיים/דפנה, הפלט = לידים ליו"ר (לא לכותב; human-in-the-loop, NIST).

Invariants

  • G1 (נרמול במקור) · G2 (בלי מסלולים מקבילים — בלוק אחד במקום שכפול) · G11 / INV-LRN5 (read-only, לא מזין קול).

🤖 Generated with Claude Code

## מה מחלץ את דיסציפלינת מניעת-ההזיות ל**בלוק קנוני אחד** (`docs/anti-hallucination-gate.md`) ומחיל אותו **אחיד על כל הסוכנים** — במקום שכל סוכן ימציא אותה מחדש ad-hoc (G2). 5 טכניקות, כל אחת מעוגנת במקור מקצועי: | | מקור | |---|---| | AH-1 עיגון-מקור (אפס ציטוט מהזיכרון) | Stanford RegLab / Magesh et al., JELS 2025 | | AH-2 quote-or-retract · AH-3 abstention | Anthropic *Reduce hallucinations* | | AH-4 תיוג-ודאות | NIST AI RMF GenAI Profile + RAGAS | | AH-5 Chain-of-Verification | Dhuliawala et al., arXiv:2309.11495 | ## הפצה (DRY) - הפניה ב-`HEARTBEAT.md` (נקרא ע"י כל סוכני Paperclip). - שורה אחידה בבלוק "קרא לפני פעולה" של כל 8 הסוכנים, עם **הערת-יישום לכל תפקיד** (writer=צרכן read-only, qa=אוכף, proofreader=אל תתקן לכיוון מונח-משפטי, exporter=אפס מהות, curator=הצעות G10). - שורה באינדקס-המסמכים ב-`CLAUDE.md`. ## בנוסף `legal-ceo.md` מקבל ידע על **"שטן מליץ (Gemini)"** עם **מדיניות on-demand טהורה** — לא בפייפליין, מופעל רק לבקשת חיים/דפנה, הפלט = לידים ליו"ר (לא לכותב; human-in-the-loop, NIST). ## Invariants - G1 (נרמול במקור) · G2 (בלי מסלולים מקבילים — בלוק אחד במקום שכפול) · G11 / INV-LRN5 (read-only, לא מזין קול). 🤖 Generated with [Claude Code](https://claude.com/claude-code)
chaim added 1 commit 2026-06-09 17:05:51 +00:00
מחלץ את דיסציפלינת מניעת-ההזיות לבלוק קנוני אחד (docs/anti-hallucination-gate.md)
ומחיל אותו אחיד על כל הסוכנים — במקום שכל סוכן ימציא אותה מחדש ad-hoc (G2: בלי מסלולים מקבילים).

5 טכניקות, כל אחת מעוגנת במקור מקצועי:
- AH-1 עיגון-מקור (אפס ציטוט מהזיכרון) — Stanford RegLab/Magesh JELS 2025 (כלי-RAG משפטיים הוזים 17-33%)
- AH-2 quote-or-retract + AH-3 abstention — Anthropic Reduce-hallucinations
- AH-4 תיוג-ודאות — NIST AI RMF GenAI Profile + RAGAS
- AH-5 Chain-of-Verification — Dhuliawala et al. arXiv:2309.11495

הפצה DRY: הפניה ב-HEARTBEAT.md (נקרא ע"י כל סוכני Paperclip) + שורה אחידה בבלוק
'קרא לפני פעולה' של כל 8 הסוכנים, עם הערת-יישום לכל תפקיד (writer=read-only, qa=אוכף,
proofreader=אל תתקן לכיוון מונח משפטי, exporter=אפס מהות חדשה).

בנוסף: legal-ceo.md מקבל ידע על 'שטן מליץ (Gemini)' עם מדיניות on-demand טהורה —
לא בפייפליין, מופעל רק לבקשת חיים/דפנה, הפלט=לידים ליו"ר (לא לכותב, human-in-the-loop).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
chaim merged commit 81171983e4 into main 2026-06-09 17:05:57 +00:00
chaim deleted branch worktree-anti-hallucination-gate 2026-06-09 17:05:57 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: ezer-mishpati/legal-ai#171