Files
legal-ai/docs/precedent-corpus-redesign/00-final-synthesis-INTERIM.md

5.1 KiB
Raw Blame History

00 — סינתזה (זמנית / INTERIM) — קורפוס-הפסיקה

זמנית. מאחדת את קלטי 0105 להחלטת-ארכיטקטורה ראשונה, לבדיקה על תיק-אמת לפני נעילה. אילוץ-העל: אפס-ביקורת-אנושית. שאלת-העל: לבנות-מחדש או לתקן.

העיקרון המכריע — שתי רמות נפרדות

מקור-הבלבול הוא ערבוב של שתי שאלות שונות:

רמה A — "אילו עקרונות לשמור מתוך החלטה נתונה"   → quality-at-source (פאנל) + cap
רמה B — "אילו עקרונות לצוף באחזור לכתיבה"        → importance ranking (ציטוט/קאנון)

8508-03-24 מפיק 70 עקרונות = בעיית רמה A (חילוץ-יתר). איזה תקדים לצטט בבלוק-דיון = רמה B. שתי הרמות נפתרות בכלים שונים — וזה לב הסינתזה.

ההחלטה (5 עמודים)

1. אל תבנה-מחדש את הסכמה · אל תחתוך הרסני

01 מוכיח שהסכמה תקינה; 02/03 (מחקר) מוכיח שגיזום-holding מבוסס-ציון-פרשני הוא בדיוק המקום שהאוטומציה נכשלת (citators מסחריים טועים 1/32/3). → שומרים את הקורפוס שלם והפיך.

2. רמה A — תיקון-במקור (going-forward), לא ניקוי-רטרואקטיבי הרסני

משטר-החילוץ התלת-מודלי + cap (PR#304, legal-principles-redesign §3) מונע חילוץ-יתר חדש: החלטת-ועדה → ≤5 כללים-פרשניים חדשים; פס"ד → ≤5 הלכות. 8508 עתידי = ≤5, לא 70. לקורפוס-הקיים: לא מוחקים — מסמנים quality_tier (ציון-פאנל לא-הרסני) שמשמש לרמה B.

3. רמה B — דירוג-בזמן-אחזור (הלב החדש)

importance מוזרק כ-boost ב-RRF (03-retrieval → RRF):

importance(עיקרון) = f( קאנון-ידני[max, מיידי]   ← 04, ground-truth
                        , תדירות-ציטוט-מדורגת     ← דפנה≫יו"ר-אחר≫כללי
                        , יומון                    ← X12
                        , סמכות(עליון/מחוזי/ועדה)
                        , penalty(overruled) )
   ×  quality_tier(פאנל)                          ← רמה A, לא-הרסני

רעש שוקע ולא צץ; שום הלכה לא אובדת. הרלוונטיות-להקשר נקבעת בזמן-שאילתה (ICAIL 2021), לא ב-cull.

4. אפס-ביקורת

אין תור-pending_review. עקרונות לא-מאושרים פשוט מדורגים-לפי-איכות ולא צצים — לא צריך לאשר אותם. שער-conformal (SCRC) זמין אם אי-פעם נרצה ערבון-חסם, אבל ברירת-המחדל = אוטו-מלא. Active-learning: ציטוטי-דפנה החדשים מעדכנים את ה-importance אוטומטית (job רענון).

5. V41 canonical — לעקוף (לא לתקן עכשיו)

05 מראה ש-V41 100% תקוע (כל 5,472 ב-pending_synthesis) ובנוי-על-אישור-יו"ר → מתנגש עם אפס-ביקורת. → האחזור מדרג ישירות על halachot (לא תלוי בקנוני). V41 נשאר אופציונלי/נדחה; הסינתזה-שלו (PR#304) לא מופעלת במסה. (החלטה הפיכה — אפשר להחיות מאוחר עם שער-conformal.)

תיקוני-תשתית (תנאי-מקדים, רמה A במקור)

  • חוזה-קליטה חיצוני: 87% בלי practice_area → אכיפה/חילוץ-אוטומטי ב-precedent_library_upload (תיקון-במקור, G1). cited_only stubs נשארים (לא שבורים).
  • לצופף את גרף-הציטוטים: להריץ citator (X11) על כל 363 (לא רק 42 של דפנה) → PageRank משמעותי.
  • להטמיע פסיקת-קאנון-חסרה (חוף-השרון, הרמלין) דרך X13.

איך 8508-03-24 נראה אחרי הסינתזה (הצפי, לבדיקה למטה)

  • רמה A (going-forward): ריצה-מחדש דרך הפאנל → 70 → ≤5 כללים-פרשניים.
  • רמה B (קיים): 8508 = החלטת-ועדה של יו"ר-אחר, 0 ציטוטים נכנסים, לא בקאנון → importance≈רצפה → 70 העקרונות שוקעים באחזור ולא מזהמים את הכתיבה, בלי למחוק ובלי לאשר.
  • הלקח הצפוי: הבעיה נפתרת בשני הכלים — cap-במקור (להבא) + שקיעה-בדירוג (קיים) — ואין צורך לגעת ב-70 ידנית.

פתוח לנעילה (אחרי הבדיקה)

  • משקלי-ה-importance (קאנון מול ציטוט מול סמכות) — כיול מול הקאנון.
  • האם לצופף-גרף עכשיו או להישען על קאנון+דפנה בשלב-ראשון.
  • האם להפוך את הקאנון לטבלה מובנית (04 §5א).