feat(agents): שטן מליץ (Gemini) — red-team מוגבל עם שער anti-hallucination #169

Merged
chaim merged 1 commits from worktree-gemini-critique into main 2026-06-09 16:16:13 +00:00
Owner

ממסד את סוכן-Gemini מחדש מ"מנתח מקביל" לשכבת דעה-שנייה (devil's advocate) שרצה אחרי Opus ומפיקה מזכר-לידים לא-סמכותי ליו"ר (לא ניתוח מתחרה). read-only — פלט ל-critique-gemini.md בלבד.

9 אילוצי anti-hallucination — מעוגנים במקורות מקצועיים

כלל מקור
עיגון-קורפוס מוחלט (אפס ציטוט מהזיכרון) Stanford RegLab / Magesh et al., JELS 2025 — כלי-RAG משפטיים הוזים 17–33%
Quote-or-retract + abstention ("לא יודע") Anthropic Reduce hallucinations
Chain-of-Verification לפני סיום Dhuliawala et al., arXiv:2309.11495 (2023)
atomic-claim grounding RAGAS faithfulness (Es et al., arXiv:2309.15217)
לידים-לא-הכרעות, human-in-the-loop NIST AI RMF GenAI Profile (NIST-AI-600-1, 2024)

מתחיל בכותרת # (לא ---) למניעת כשל yargs ב-gemini --prompt (ראה #168).

Invariants

  • INV-LRN5 / G11 — read-only, לא מזין שכבת-קול/ידע; benchmark/דעה-שנייה בלבד.

🤖 Generated with Claude Code

ממסד את סוכן-Gemini מחדש מ"מנתח מקביל" ל**שכבת דעה-שנייה (devil's advocate)** שרצה אחרי Opus ומפיקה **מזכר-לידים לא-סמכותי ליו"ר** (לא ניתוח מתחרה). read-only — פלט ל-`critique-gemini.md` בלבד. ## 9 אילוצי anti-hallucination — מעוגנים במקורות מקצועיים | כלל | מקור | |---|---| | עיגון-קורפוס מוחלט (אפס ציטוט מהזיכרון) | Stanford RegLab / Magesh et al., JELS 2025 — כלי-RAG משפטיים הוזים 17–33% | | Quote-or-retract + abstention ("לא יודע") | Anthropic *Reduce hallucinations* | | Chain-of-Verification לפני סיום | Dhuliawala et al., arXiv:2309.11495 (2023) | | atomic-claim grounding | RAGAS faithfulness (Es et al., arXiv:2309.15217) | | לידים-לא-הכרעות, human-in-the-loop | NIST AI RMF GenAI Profile (NIST-AI-600-1, 2024) | מתחיל בכותרת `#` (לא `---`) למניעת כשל yargs ב-`gemini --prompt` (ראה #168). ## Invariants - INV-LRN5 / G11 — read-only, לא מזין שכבת-קול/ידע; benchmark/דעה-שנייה בלבד. 🤖 Generated with [Claude Code](https://claude.com/claude-code)
chaim added 1 commit 2026-06-09 16:16:08 +00:00
ממסד את סוכן-Gemini מחדש כשכבת דעה-שנייה (devil's advocate) שרצה אחרי Opus
ומפיקה מזכר-לידים לא-סמכותי ליו"ר — לא ניתוח מתחרה. read-only (critique-gemini.md בלבד).

9 אילוצי anti-hallucination קשיחים, מעוגנים במקורות מקצועיים:
- Stanford RegLab/Magesh JELS 2025 (כלי-RAG משפטיים הוזים 17-33%) → עיגון-קורפוס מוחלט
- Anthropic Reduce-hallucinations → quote-or-retract + abstention
- Chain-of-Verification (Dhuliawala 2023, arXiv:2309.11495) → מעבר-אימות חובה
- RAGAS faithfulness → atomic-claim grounding
- NIST AI RMF GenAI Profile 2024 → human-in-the-loop, לידים-לא-הכרעות

מתחיל בכותרת # (לא ---) למניעת כשל yargs ב-gemini --prompt.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
chaim merged commit f1d6f5dafc into main 2026-06-09 16:16:13 +00:00
chaim deleted branch worktree-gemini-critique 2026-06-09 16:16:14 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: ezer-mishpati/legal-ai#169