d6608ce84972b5752ce9e0e6b2562c389e6edb43
הבעיה (#145): מחלץ-המטא ביקש מ-Gemini Flash *לעצב* את מראה-המקום המלא (citation_formatted). ב-JSON-mode חופשי (ללא responseSchema) המודל החזיר JSON תקין ומלא אך **השמיט בעקביות** דווקא את השדה הזה — אומת על 8070-05-25, 1194-12-25, 1200-12-25 (וגם כשהצדדים זוהו). השדה הקשה ביותר (עיצוב מחרוזת) + היתר-בפרומפט להשאיר ריק → Flash מפיל אותו. הפתרון: citation_formatted הוא **שדה-תצוגה נגזר** (X1 §3 / INV-ID2) — מורכב דטרמיניסטית מרכיבים מובְנים, לא מעוצב ע"י LLM. תפקיד ה-LLM מצטמצם לחילוץ רכיבים אמינים (שורת-הצדדים, קידומת-ההליך לפסקי-בית-משפט). - db.format_precedent_citation(record) — מרכיב לפי כללי-הציטוט-האחיד: ועדת-ערר (מחוזית/ארצית/בל"מ) מ-proceeding_type+district+source_kind; פסקי-בית-משפט מ-court_prefix(LLM)+district-abbrev. מוציא docket נקי מ-case_number מזוהם ("עע\"מ 683/13"→"683/13"). נמנע ('') כשחסר רכיב (צדדים/docket/תאריך/קידומת) — abstention על המצאה (INV-AH). - case_law.parties (V39) — שורת "עורר נ' משיב" כבסיס re-derivable. - מחלץ-המטא: הפרומפט מחלץ parties+citation_prefix (לא citation_formatted); apply_to_record מרכיב דטרמיניסטית מהרשומה-האפקטיבית וממלא רק שדה ריק (עריכות-יו"ר נשמרות). - scripts/backfill_precedent_citations.py — backfill 2-מעברים (דטרמיניסטי→LLM), מדווח שורות-נמנעות, idempotent. אומת: 3 הרשומות הידניות משוחזרות תו-בתו; פסק עליון אמיתי מולא end-to-end (עע"מ 683/13 ... נבו 3.9.2015). test_fu2b_reconcile ✓. Invariants: INV-ID2/X1§3 (ציטוט=תצוגה נגזר, לא מפתח) · INV-AH (abstention, אפס המצאה) · G1 (docket נקי) · G2 (מסלול-יחיד — מחליף את נתיב-ה-LLM, לא מקביל). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
Description
AI Legal Decision Drafting System — MCP server, web upload, RAG search
Languages
Python
64.1%
TypeScript
33.7%
JavaScript
1.2%
Shell
0.7%
CSS
0.2%