From 34d08365317a8f0c6929e37ecb6594da591bdf32 Mon Sep 17 00:00:00 2001 From: Chaim Date: Sat, 20 Jun 2026 09:59:42 +0000 Subject: [PATCH] =?UTF-8?q?docs(principles):=20importance=20layer=20plan?= =?UTF-8?q?=20=C2=A78=20=E2=80=94=203-tier=20citations,=20principle-level?= =?UTF-8?q?=20gold,=20protected=20cull=20(#152/#153)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Opus 4.8 (1M context) --- docs/legal-principles-redesign.md | 41 +++++++++++++++++++++++++++++++ 1 file changed, 41 insertions(+) diff --git a/docs/legal-principles-redesign.md b/docs/legal-principles-redesign.md index 5247fc5..0513115 100644 --- a/docs/legal-principles-redesign.md +++ b/docs/legal-principles-redesign.md @@ -79,3 +79,44 @@ מקיים: INV-G10/INV-LRN1 (שער-יו"ר על מקרי-גבול), INV-AH (עיגון-מקור בחילוץ), INV-G2 (מודל-הצבעות מקור-יחיד ל-B+C), INV-G9 (audit-trail להצבעות + לסינון), INV-G6 (רענון-embedding). מודל-הצבעות-היו"ר משתלב ב-active-learning הקיים (`halacha_panel_rounds`, [[project_active_learning_panel]]). + +--- + +## 8. שכבת-החשיבות (TaskMaster #153) — חוסם את מסה-ה-cull + +**הרקע (אבחון-ייצור 2026-06-20):** 49% מהעקרונות החיים (1,751/3,562) מקורם בפס"ד שדפנה +ציטטה או שמופיע ביומון. דירוג-קונצנזוס לבדו (A) עיוור-לחשיבות ועלול לקבור את ההלכה +שדפנה הסתמכה עליה. לכן **לפני מסה-cull** בונים שכבת-חשיבות שמגנה על הזהב ברמת-העיקרון. + +### 8.1 שלוש דרגות-חשיבות (לפי *מי* מצטט/מסמן) +| דרגה | סיגנל | מקור | התנהגות בסינון | +|------|-------|------|----------------| +| **1 — זהב** | דפנה ציטטה / יומון | `precedent_internal_citations` (source.chair_name='דפנה תמיר') · `digests` | **פטור-מגן**: שורד תמיד | +| **2 — הסתמכות-שיפוטית** | יו"ר-אחר ציטט | `precedent_internal_citations` (source.chair_name≠דפנה) | משקל-חשיבות גבוה (לא מגן) | +| **3 — מרכזיות** | ציטוט כללי/צד · instance_count · treatment | citator · `/graph` PageRank | משקל-בסיס | + +(אין טבלת bookmarks — היו עוגני-DOCX, לא רלוונטי.) + +### 8.2 זיהוי-זהב ברמת-עיקרון (לא ברמת-פסק — קריטי) +דפנה מצטטת פס"ד בשביל **הלכה אחת** ממנו, לא כל ~19 העקרונות. לכן: +- **gold_chair:** מטמיעים את `match_context` (טקסט סביב הציטוט, מאוכלס 100%) → cosine מול + עקרונות הפס"ד-המצוטט → ההתאמה-הטובה ≥ סף (~0.78) מקבלת `gold_chair`. +- **gold_digest:** מטמיעים `digests.headline_holding` → התאמה לעקרונות הפס"ד-המקושר. +- כל התאמה שומרת מקור-הזהב + ציון-התאמה (G9). **חובה להריץ את מחלץ-הציטוטים גם על ~45 + ההחלטות של יו"רים-אחרים** כדי לאכלס דרגה 2 (כיום רק 398 ציטוטי-דפנה חולצו). + +### 8.3 importance_score רציף (לדירוג + RAG) +`halachot.importance_score`∈[0,1] = משוקלל: דרגה-1 ≫ דרגה-2 ≫ דרגה-3 + סמכות +(עליון 1.0/מחוזי 0.7/ועדה 0.4) − penalty(overruled). `importance_signals` jsonb (שקיפות). +משקלים ב-config, ניתני-כיול-יו"ר. + +### 8.4 שילוב בסינון (הכרעת chaim: כל-הזהב + עד-5-לא-זהב) +זהב(דרגה-1) → מוגן, שורד ללא תקרה (gold+0-votes→pending_review, כי התאמה עלולה +false-positive). לא-זהב → דירוג `(importance_score, votes, score)`, שומרים עד 5. כלומר +החלטה עם 7 הלכות-זהב תשמור 7+; עם 0 זהב תשמור עד 5. + +### 8.5 RAG (הרווח הגדול) + רענון +`importance_score` מבוסט באחזור (`search_precedent_library`/halacha) → הלכות-דפנה+סמכותיות +צפות ראשונות בכתיבה. job רענון תקופתי (יומון/החלטה חדשים → re-match), כמו `corroboration_rebuild`. + +> **סדר-ביצוע:** 8 (שכבת-חשיבות) → 3+4 (cull-מוגן) → 5 (סינתזה על הניצולים).