ספ חדש לשכבת citator פנימית — תיקוף הלכות לפי טיפול-שיפוטי מצטבר (ציטוטים נכנסים), לצמצום היקף האישור-הידני של היו"ר: - docs/spec/X11-citation-corroboration.md — 6 invariants (INV-COR1–COR6), כל אחד עם ≥3 מקורות מקצועיים (Shepard's/KeyCite, Hellyer LLJ 2018, UNC Law, NCSC/JTC, CEPEJ). - docs/spec/00-constitution.md — תיקון מבוקר ל-INV-G10: השער מסופק ע"י טיפול-שיפוטי-מצטבר לתת-הקבוצה החיובית, שער-היו"ר נשאר חובה לזנב ולשלילי. + X11 באינדקס. - Opus 4.8 @ xhigh כמודל חילוץ הלכות (config HALACHA_EXTRACT_MODEL/EFFORT, env-tunable; claude_session model/effort params; halacha_extractor מחווט). מבוסס A/B 2026-05-31: פחות חילוץ-יתר, 100% quote-verified, ביטחון מכויל. - scripts/ab_halacha_opus48.py — harness A/B לא-הרסני להשוואת מודל/effort בחילוץ הלכות. - .taskmaster #70 (FU-2c-b) — תיעוד dedup שפר + סריקת-קורפוס (0 stubs תקועים נותרו). תנאי-קדם (זהות נקייה) הושלם: שפר מוזג לרשומה קנונית + סריקת 128 רשומות. audit-findings גלויים ב-X11 §7: קישור הלכה↔ציטוט + סיווג-טיפול = greenfield, ל-implementation plan. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
13 KiB
X11 — תיקוף-הלכות בציטוטים (Citation Corroboration / Internal Citator)
קובץ-תחום זה כפוף ל-חוקת המערכת. הוא מגדיר שכבת citator פנימית: שימוש בציטוטים-הנכנסים לפסיקה (איך ערכאות וועדות מאוחרות טיפלו בה) כדי לתקף ולחדד את ההלכות שחולצו ממנה, וכך לצמצם את היקף האישור-הידני של היו"ר. הוא אוכף את INV-G10 (כפי שתוקן — ראה §6), נשען על INV-G9 (עקיבוּת-מקור), ומעמיק את מודל-הציטוטים של 02-data-model.md.
TARGET, לא תיאור-מצב. המנגנון כאן הוא היעד. רכיבים שטרם נבנו מסומנים מפורשות כ-audit-finding (§7), ולא כהתנהגות קיימת. כל טענה על הקוד מצוטטת
file:line.
1. הרעיון — citator פנימי
בעולם המשפטי, הכלים שמאמתים פסיקה לפי הציטוטים-הנכנסים אליה הם citators (Shepard's של LexisNexis, KeyCite של Westlaw, BCite של Bloomberg). הם עונים על שתי שאלות: האם הפסק עדיין "good law"? ו-איך ערכאות מאוחרות טיפלו בו? — לפי סיווג-טיפול (treatment) של כל ציטוט-נכנס.
המערכת שלנו מחזיקה כבר את חומר-הגלם: גרף-ציטוטים פנימי (§2). מה שחסר הוא השכבה שמחברת אותו להלכות — לתקף הלכה ספציפית לפי כך שערכאות/ועדות מאוחרות אימצו אותה בפועל. הלכה שאומצה שוב-ושוב ע"י פאנלים אחרים אינה "ניחוש של מודל" — היא טיפול שיפוטי אנושי מצטבר, וזה הבסיס שמאפשר אישור-אוטומטי בלי לפגוע בשיקול-הדעת האנושי (ראה תיקון INV-G10, §6).
2. חומר-הגלם הקיים — שני גרפי-ציטוט
| טבלה | קושר | הקשר נשמר | סיווג-טיפול |
|---|---|---|---|
case_law_citations (db.py:382) |
פסיקה ← החלטת-ועדה פנימית (decisions) |
context_text |
citation_type (support/distinguish/overrule/obiter) |
precedent_internal_citations (db.py:938) |
פסיקה ← פסיקה אחרת (case_law) |
match_context |
— (אין שדה-טיפול) |
audit-finding (קיים): ב-precedent_internal_citations אין שדה סיווג-טיפול, ו-ב-
case_law_citations שדה citation_type קיים אך ברירת-המחדל 'support' (db.py:387) —
כלומר רוב הרשומות לא סווגו בפועל. סיווג-הטיפול הוא רכיב שיש לבנות (§4, INV-COR2).
3. תנאי-קדם — גרף-זהות נקי
ה-corroboration מצרף ציטוטים להלכות דרך רשומת ה-case_law. אם אותו תקדים מיוצג בשתי
רשומות (stub cited_only + רשומת-תוכן), הציטוטים יושבים על האחת וההלכות על האחרת — וה-join
נשבר. לכן INV-G1/INV-ID1
הם תנאי-קדם קשיח ל-X11.
הפרה ידועה (תוקנה 2026-05-31): אהוד שפר עע"מ 317/10 הוחזק בשתי רשומות — external_upload
עם ציטוט-מלא כ-case_number (הפרת INV-ID2) + cited_only stub שתפס את 7 הציטוטים-הנכנסים בנפרד
מ-53 ההלכות. מוזג לרשומה קנונית אחת; סריקת-קורפוס מלאה (128 רשומות) אישרה 0 stubs עם
ציטוטים-תקועים שנותרו. ראה #70 / FU-2c-b. הניקוי השוטף של 49 ה-cited_only
(הרחבת _DOCKET_RE, ציטוטים-משולבים) ממשיך תחת #70.
4. המנגנון (TARGET)
לכל הלכה h של תקדים P:
1. אסוף ציטוטים-נכנסים ל-P (שני הגרפים, §2).
2. סווג טיפול לכל ציטוט (followed / distinguished / criticized / overruled / explained)
מתוך ההקשר (context_text / match_context) — Opus 4.8 @ xhigh. [INV-COR2]
3. התאם כל ציטוט להלכה הספציפית: דמיון סמנטי בין ההקשר לבין rule_statement של h,
מעל רף; הציטוט נספר ל-h רק אם הוא נוגע *לאותה הלכה*, לא לפסק כולו. [INV-COR3]
4. ספֵר corroboration של h = מספר ציטוטים חיוביים בלתי-תלויים שהותאמו אליה.
5. אישור:
אם ≥N חיוביים בלתי-תלויים ∧ 0 שליליים → אישור-אוטומטי (corroborated). [INV-COR4]
אם יש טיפול שלילי (distinguished/criticized/overruled) → אסור אוטו;
דגל ליו"ר, ואף הדחה אם overruled. [INV-COR2]
אחרת (לא-מצוטט) → נשאר בשער-היו"ר הרגיל (סף-confidence). [INV-COR5]
6. העשרה (משני): נסח-מחדש/חדד את rule_statement לפי המסגור של הפאנל המצטט.
N (סף-corroboration) ייקבע אמפירית (≥2 ברירת-מחדל; ציטוט יחיד אינו מספיק — INV-COR4).
5. Invariants של התחום
INV-COR1: corroboration = טיפול שיפוטי אנושי מצטבר, לא שיפוט-AI
כלל: אישור-הלכה מבוסס-ציטוט נשען על כך שערכאות/ועדות אנושיות אימצו את ההלכה בפועל — לא על ציון-ביטחון של מודל. ה-AI רק מזהה ומסווג את הטיפול הקיים; ההכרעה הערכית שההלכה תקפה ניתנה ע"י השופטים המצטטים. זהו הבסיס לתיקון INV-G10 (§6). מקורות: Shepard's Citations (LexisNexis) — citator + treatment analysis · KeyCite (Westlaw) — good-law/treatment flags · Hellyer, Evaluating Shepard's, KeyCite, and BCite (Law Library Journal 110:4, 2018) | סטטוס: verified אכיפה: מנגנון §4 — corroboration נספר רק מטיפול שיפוטי מתועד, לא מ-confidence. הפרה ידועה: —
INV-COR2: סיווג-טיפול חובה לפני ספירה — שלילי לעולם לא מאשר
כלל: כל ציטוט-נכנס מסווג לטיפול (followed/explained = חיובי-נייטרלי;
distinguished/criticized/questioned/overruled = שלילי) לפני שהוא נספר. טיפול שלילי לעולם אינו
תורם ל-corroboration ואינו מאשר אוטומטית; overruled → הדחת ההלכה לבדיקת-יו"ר.
מקורות: Shepard's editorial treatment phrases (human-assigned depth-of-treatment) · KeyCite
flag system (red/yellow/green) · UNC Law, Describing Negative Legal Precedent in Citators
(Faculty Publications) | סטטוס: verified
אכיפה: שלב 2+5 ב-§4; סכֵמת-טיפול ב-precedent_internal_citations (שדה חדש) +
case_law_citations.citation_type (לא להישען על ברירת-המחדל 'support').
הפרה ידועה: סיווג-טיפול לא קיים בפועל (§2) — רכיב לבנייה.
INV-COR3: התאמה להלכה הספציפית — לא לפסק כולו
כלל: ציטוט נספר ל-corroboration של הלכה h רק אם ההקשר המצטט נוגע לאותה הלכה (דמיון סמנטי מעל רף). פסק מצוטט לעניין A אינו מתקף הלכה B שחולצה מאותו פסק. מקורות: Hellyer (2018) — "a 'followed' tag might refer to a different legal point than the one you care about" · UChicago Library, Citators research guide (treatment ≠ point-specific) · Northwestern Pritzker, Determining Whether Cases Are Still Good Law | סטטוס: verified אכיפה: שלב 3 ב-§4 — רף-דמיון סמנטי בין ההקשר ל-rule_statement; Opus 4.8 כשופט-התאמה. הפרה ידועה: —
INV-COR4: סף ≥N ציטוטים בלתי-תלויים — ציטוט יחיד אינו מספיק
כלל: אישור-אוטומטי דורש ≥N ציטוטים חיוביים בלתי-תלויים — כלומר מ-מקורות-מצטטים
מובחנים (החלטות/פסקים שונים; שני אזכורים באותה החלטה = ציטוט אחד). ברירת-מחדל N=2. מקור יחיד
אינו ראיה מספקת; citators עצמם מפספסים 23–25% מהטיפול — לכן נדרשת חזרתיות חוצת-מקורות.
מקורות: Hellyer (2018) — citator coverage gaps (Shepard's miss 23%, KeyCite 25%) · Manning,
Raghavan & Schütze, Introduction to Information Retrieval (CUP 2008) — aggregation of weak
signals · KeyCite/Shepard's depth-of-treatment (multiple citing refs) | סטטוס: verified
אכיפה: שלב 4-5 ב-§4; HALACHA_CORROBORATION_MIN_CITES (env-tunable, ברירת-מחדל 2).
הפרה ידועה: —
INV-COR5: השער האנושי נשמר לזנב הלא-מצוטט ולשלילי
כלל: corroboration מצמצם את היקף האישור-הידני; הוא אינו מבטל את שער-היו"ר. הלכות לא-מצוטטות, וכל הלכה עם טיפול שלילי, נשארות בשער-היו"ר. גם ה-citators המקצועיים קובעים ש"human review remains essential". מקורות: Hellyer (2018) — "There's no substitute for reading the actual citing case" · NCSC/JTC, Principles & Practices for AI Use in Courts (human-in-the-loop) · CEPEJ (2018, user-control) | סטטוס: verified אכיפה: שלב 5 ב-§4; שער-היו"ר הקיים (05-qa-review.md) נשאר על הזנב. הפרה ידועה: —
INV-COR6: עקיבוּת — כל אישור-אוטומטי שומר את ראיית-הציטוט
כלל: הלכה שאושרה ב-corroboration שומרת את הציטוטים המתקפים (מזהי-המקור + ההקשר +
הטיפול) כ-provenance הניתן לביקורת — מי אישר, על סמך אילו פסקים, ובאיזה טיפול.
מקורות: INV-G9 · ISO 15489-1:2016
(records authenticity) · CEPEJ (2018, transparency) | סטטוס: verified (נגזר מ-G9)
אכיפה: halachot.reviewer = corroborated (≥N judicial citations) + טבלת-קישור
הלכה↔ציטוטים-מתקפים; מוצג ביו"ר-UI.
הפרה ידועה: —
6. תיקון INV-G10 (מבוקר)
INV-G10 קובע ששער אישור-ההלכה הוא invariant אנושי-חובה. התיקון (החלטת-יו"ר 2026-05-31) אינו מבטל את השער אלא מרחיב את מקור-הסמכות האנושית שלו: השער מסופק ע"י טיפול שיפוטי מצטבר (ערכאות/ועדות מצטטות) עבור תת-הקבוצה ה-corroborated החיובית, בעוד שער-היו"ר נשאר חובה לזנב הלא-מצוטט ולכל טיפול-שלילי. הנוסח המתוקן + המקורות נכתבים ב- 00-constitution.md INV-G10. עיקרון-העל (INV-COR1) שומר על רוח G10: זהו שיפוט אנושי (של המצטטים), לא שיפוט-AI.
7. מצב קיים מול יעד — audit-findings
- קישור הלכה↔ציטוט לא קיים. אין טבלה/שאילתה שמצרפת ציטוט-נכנס להלכה ספציפית — רכיב-ליבה לבנייה (§4 שלב 3).
- סיווג-טיפול חסר.
precedent_internal_citationsללא שדה-טיפול;case_law_citations.citation_typeעל ברירת-מחדל'support'(db.py:387) — לא מסווג בפועל (§2, INV-COR2). - אישור-אוטומטי כיום מבוסס-confidence בלבד.
db.store_halachotמאשר ב-confidence ≥ HALACHA_AUTO_APPROVE_THRESHOLD(db.py:3221, ברירת-מחדל 0.80) — לא מבוסס-ציטוט. X11 מוסיף מסלול-אישור שני (corroboration) לצד/מעל סף-ה-confidence. - גרף-זהות. תוקן לשפר + dedup content-affecting (§3); המשך ניקוי ב-#70.
8. הפניות-אחיות
- 00-constitution.md — INV-G9 (provenance), INV-G10 (שער אנושי, מתוקן §6), פרוטוקול ≥3-מקורות.
- 02-data-model.md — טבלות הציטוטים (
case_law_citations,precedent_internal_citations) + ישותhalachot. - 05-qa-review.md — שער אישור-ההלכה הקיים (נשאר על הזנב, INV-COR5).
- 07-learning.md — צמיחת-קורפוס + לולאת-הלכות.
- X1-identifiers.md — תנאי-הקדם: זהות קנונית (INV-ID1/ID2).
- #70 / FU-2c-b — dedup של
cited_only(תנאי-קדם, §3).