From c1f92db2a0b3dee67ae420ece5a05674ad69ac36 Mon Sep 17 00:00:00 2001 From: Chaim Date: Sat, 20 Jun 2026 12:40:30 +0000 Subject: [PATCH] =?UTF-8?q?docs(principles):=20refine=20synthesis=20?= =?UTF-8?q?=E2=80=94=202nd=208508=20run=20(keep-when-in-doubt=20=E2=86=92?= =?UTF-8?q?=2070/70=20kept);=20no-cull=20triple-confirmed=20(#153)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Opus 4.8 (1M context) --- .../00-final-synthesis.md | 42 ++++++++++++------- 1 file changed, 27 insertions(+), 15 deletions(-) diff --git a/docs/precedent-corpus-redesign/00-final-synthesis.md b/docs/precedent-corpus-redesign/00-final-synthesis.md index 5727c17..69b047b 100644 --- a/docs/precedent-corpus-redesign/00-final-synthesis.md +++ b/docs/precedent-corpus-redesign/00-final-synthesis.md @@ -9,28 +9,40 @@ רמה B — אילו עקרונות לצוף באחזור לכתיבה → importance ranking (קאנון/ציטוט) ``` -## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24) -תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו עליו את משטר-החילוץ-החדש (פאנל + cap): -- **70 → 3.** ואז **אודיט-אובדן יריב:** **~22 עקרונות אמיתיים ונבדלים אבדו** (רק 16 מה-70 היו רעש). -- האבודים כללו את **הלכת לוסטרניק** (עיקרון-הליבה של חישוב היטל-השבחה!), קשר-סיבתי, סף-פוטנציאל, - וכל המסד הפרוצדורלי (מסלולי 14, נטלים, השתק, ריבית). -- **השורש:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך "אילו עקרונות - *בני-ציטוט שימושיים*" (~22), **כולל יישומי-דוקטרינה-מוכרת**. המסנן "רק-חדש/בלי-יישומים" סינן בדיוק - את מה שהכותב צריך. +## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24) — שתי הרצות +תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו **שני משטרים** על אותם 70: -**מסקנה אמפירית:** cap + סינון-novelty = **הרסני**. מאשש את אזהרת-המחקר: חיתוך-מבוסס-ציון מאבד הלכות. +```text +אגרסיבי (פאנל + cap/novelty): 70 → 3 ✗ אודיט-אובדן: ~22 עקרונות אמיתיים אבדו, + כולל הלכת לוסטרניק (ליבת חישוב היטל-השבחה!), + קשר-סיבתי, סף-פוטנציאל, כל המסד הפרוצדורלי (14/נטלים/ריבית) +מזוקק ("שמור-בספק", רעש בלבד): 70 → 70 ✓ "כולם בני-ציטוט; אין רעש-אמיתי; זוגות-קרובים + מוסיפים נדבך". כל עקרוני-הליבה נשמרו. +``` +- **השורש לקריסת-האגרסיבי:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך + "אילו עקרונות *בני-ציטוט שימושיים*" (~כל ה-70), **כולל יישומי-דוקטרינה-מוכרת**. מסנן "רק-חדש/בלי-יישומים" + סינן בדיוק את מה שהכותב צריך. + +**האסימטריה המכריעה:** +```text +לחתוך → סיכון לאבד את הליבה (לוסטרניק), בלתי-הפיך בפועל ← עלות עצומה +לשמור → עולה כמעט-כלום; הרעש/הכפילויות שוקעים בדירוג ← עלות אפסית +``` +**מסקנה (מחקר + 2 הרצות = משולש-אישוש):** **לא לחתוך בכלל.** "בעיית ה-70" לא היתה בעיית-RAG — אלא +בעיית **תור-אישור** + **היעדר-דירוג**. מתקנים את שניהם, ו-70 בלתי-מזיקים. ## 3. ההחלטה (מזוקקת) ### עמוד 1 — לא לבנות-מחדש, לא לחתוך הרסני, **לא לתחום** שומרים את הקורפוס שלם. **אין cap. אין סינון-"רק-חדש".** החלטה עשירה = ~22 עקרונות לגיטימית. -### עמוד 2 — רמה A: "איכות-במקור" = ניקוי-רעש + dedup בלבד -המשטר היחיד שמותר במקור: **להסיר רעש-אמיתי** (כפילות, ציטוט-קטוע, אמרת-אגב מפורשת, תיאור-עובדות-ללא-כלל) -**ולמזג כפילויות**. **לשמור כל עיקרון בר-ציטוט מובחן — כולל יישומי-דוקטרינה.** הפאנל התלת-מודלי -משמש ל-dedup/זיהוי-רעש, **לא** לחיתוך-לכמות. -> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה. -> משטר-הפאנל נשאר ל-dedup + ולידציית-עיגון (INV-AH), לא לתקרה. +### עמוד 2 — רמה A: כמעט-כלום במקור (dedup אופציונלי בלבד) +המבחן הראה ש-curator זהיר שומר ~כל ה-70 (כולם בני-ציטוט). לכן במקור: **לא מסננים תוכן.** +הפעולה היחידה המותרת = **dedup של כפילויות-קרובות** (מיזוג לקנוני אחד, לא מחיקת-עיקרון-מובחן) — +ואפילו זה לא קריטי (כפילויות מדורגות-יחד וצורכות אחסון בלבד). הפאנל התלת-מודלי, אם בכלל, ל-dedup ++ ולידציית-עיגון (INV-AH) — **לא** לחיתוך/תקרה/novelty. +> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה — +> הוכח אמפירית שהם משמידים עקרוני-ליבה (לוסטרניק). ### עמוד 3 — רמה B: דירוג-בזמן-אחזור (הלב) `importance` כ-boost ב-RRF: קאנון-ידני[max, מיידי] · תדירות-ציטוט-מדורגת (דפנה≫יו"ר-אחר≫כללי) ·