Files
legal-ai/docs/precedent-corpus-redesign/00-final-synthesis-INTERIM.md

66 lines
5.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 00 — סינתזה (זמנית / INTERIM) — קורפוס-הפסיקה
> **זמנית.** מאחדת את קלטי 0105 להחלטת-ארכיטקטורה ראשונה, לבדיקה על תיק-אמת לפני נעילה.
> אילוץ-העל: **אפס-ביקורת-אנושית**. שאלת-העל: לבנות-מחדש או לתקן.
## העיקרון המכריע — שתי רמות נפרדות
מקור-הבלבול הוא ערבוב של שתי שאלות שונות:
```text
רמה A — "אילו עקרונות לשמור מתוך החלטה נתונה" → quality-at-source (פאנל) + cap
רמה B — "אילו עקרונות לצוף באחזור לכתיבה" → importance ranking (ציטוט/קאנון)
```
8508-03-24 מפיק 70 עקרונות = בעיית **רמה A** (חילוץ-יתר). איזה תקדים לצטט בבלוק-דיון = **רמה B**.
**שתי הרמות נפתרות בכלים שונים — וזה לב הסינתזה.**
## ההחלטה (5 עמודים)
### 1. אל תבנה-מחדש את הסכמה · אל תחתוך הרסני
01 מוכיח שהסכמה תקינה; 02/03 (מחקר) מוכיח שגיזום-holding מבוסס-ציון-פרשני הוא **בדיוק** המקום
שהאוטומציה נכשלת (citators מסחריים טועים 1/32/3). → **שומרים את הקורפוס שלם והפיך.**
### 2. רמה A — תיקון-במקור (going-forward), לא ניקוי-רטרואקטיבי הרסני
משטר-החילוץ התלת-מודלי + cap (PR#304, [legal-principles-redesign §3](legal-principles-redesign.md))
**מונע** חילוץ-יתר חדש: החלטת-ועדה → ≤5 כללים-פרשניים חדשים; פס"ד → ≤5 הלכות. **8508 עתידי = ≤5, לא 70.**
לקורפוס-הקיים: **לא מוחקים** — מסמנים `quality_tier` (ציון-פאנל לא-הרסני) שמשמש לרמה B.
### 3. רמה B — דירוג-בזמן-אחזור (הלב החדש)
`importance` מוזרק כ-boost ב-RRF ([03-retrieval](spec-X11-citation-corroboration.md) → RRF):
```text
importance(עיקרון) = f( קאנון-ידני[max, מיידי] ← 04, ground-truth
, תדירות-ציטוט-מדורגת ← דפנה≫יו"ר-אחר≫כללי
, יומון ← X12
, סמכות(עליון/מחוזי/ועדה)
, penalty(overruled) )
× quality_tier(פאנל) ← רמה A, לא-הרסני
```
**רעש שוקע ולא צץ; שום הלכה לא אובדת.** הרלוונטיות-להקשר נקבעת בזמן-שאילתה (ICAIL 2021), לא ב-cull.
### 4. אפס-ביקורת
אין תור-`pending_review`. עקרונות לא-מאושרים פשוט **מדורגים-לפי-איכות** ולא צצים — לא צריך לאשר אותם.
שער-conformal (SCRC) זמין אם אי-פעם נרצה ערבון-חסם, אבל **ברירת-המחדל = אוטו-מלא**.
**Active-learning:** ציטוטי-דפנה החדשים מעדכנים את ה-importance אוטומטית (job רענון).
### 5. V41 canonical — לעקוף (לא לתקן עכשיו)
05 מראה ש-V41 **100% תקוע** (כל 5,472 ב-pending_synthesis) ובנוי-על-אישור-יו"ר → מתנגש עם אפס-ביקורת.
**האחזור מדרג ישירות על `halachot`** (לא תלוי בקנוני). V41 נשאר אופציונלי/נדחה; הסינתזה-שלו (PR#304)
לא מופעלת במסה. (החלטה הפיכה — אפשר להחיות מאוחר עם שער-conformal.)
## תיקוני-תשתית (תנאי-מקדים, רמה A במקור)
- **חוזה-קליטה חיצוני:** 87% בלי practice_area → אכיפה/חילוץ-אוטומטי ב-`precedent_library_upload`
(תיקון-במקור, G1). cited_only stubs נשארים (לא שבורים).
- **לצופף את גרף-הציטוטים:** להריץ citator (X11) על כל 363 (לא רק 42 של דפנה) → PageRank משמעותי.
- **להטמיע פסיקת-קאנון-חסרה** (חוף-השרון, הרמלין) דרך X13.
## איך 8508-03-24 נראה אחרי הסינתזה (הצפי, לבדיקה למטה)
- **רמה A (going-forward):** ריצה-מחדש דרך הפאנל → 70 → ≤5 כללים-פרשניים.
- **רמה B (קיים):** 8508 = החלטת-ועדה של יו"ר-אחר, **0 ציטוטים נכנסים, לא בקאנון** → importance≈רצפה →
70 העקרונות **שוקעים** באחזור ולא מזהמים את הכתיבה, **בלי למחוק ובלי לאשר**.
- **הלקח הצפוי:** הבעיה נפתרת בשני הכלים — cap-במקור (להבא) + שקיעה-בדירוג (קיים) — ו**אין צורך לגעת
ב-70 ידנית**.
## פתוח לנעילה (אחרי הבדיקה)
- משקלי-ה-importance (קאנון מול ציטוט מול סמכות) — כיול מול הקאנון.
- האם לצופף-גרף עכשיו או להישען על קאנון+דפנה בשלב-ראשון.
- האם להפוך את הקאנון לטבלה מובנית (04 §5א).