docs(principles): refine synthesis — 2nd 8508 run (keep-when-in-doubt → 70/70 kept); no-cull triple-confirmed (#153)

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-20 12:40:30 +00:00
parent 0f7549a137
commit c1f92db2a0

View File

@@ -9,28 +9,40 @@
רמה B — אילו עקרונות לצוף באחזור לכתיבה → importance ranking (קאנון/ציטוט)
```
## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24)
תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו עליו את משטר-החילוץ-החדש (פאנל + cap):
- **70 → 3.** ואז **אודיט-אובדן יריב:** **~22 עקרונות אמיתיים ונבדלים אבדו** (רק 16 מה-70 היו רעש).
- האבודים כללו את **הלכת לוסטרניק** (עיקרון-הליבה של חישוב היטל-השבחה!), קשר-סיבתי, סף-פוטנציאל,
וכל המסד הפרוצדורלי (מסלולי 14, נטלים, השתק, ריבית).
- **השורש:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך "אילו עקרונות
*בני-ציטוט שימושיים*" (~22), **כולל יישומי-דוקטרינה-מוכרת**. המסנן "רק-חדש/בלי-יישומים" סינן בדיוק
את מה שהכותב צריך.
## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24) — שתי הרצות
תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו **שני משטרים** על אותם 70:
**מסקנה אמפירית:** cap + סינון-novelty = **הרסני**. מאשש את אזהרת-המחקר: חיתוך-מבוסס-ציון מאבד הלכות.
```text
אגרסיבי (פאנל + cap/novelty): 70 → 3 ✗ אודיט-אובדן: ~22 עקרונות אמיתיים אבדו,
כולל הלכת לוסטרניק (ליבת חישוב היטל-השבחה!),
קשר-סיבתי, סף-פוטנציאל, כל המסד הפרוצדורלי (14/נטלים/ריבית)
מזוקק ("שמור-בספק", רעש בלבד): 70 → 70 ✓ "כולם בני-ציטוט; אין רעש-אמיתי; זוגות-קרובים
מוסיפים נדבך". כל עקרוני-הליבה נשמרו.
```
- **השורש לקריסת-האגרסיבי:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך
"אילו עקרונות *בני-ציטוט שימושיים*" (~כל ה-70), **כולל יישומי-דוקטרינה-מוכרת**. מסנן "רק-חדש/בלי-יישומים"
סינן בדיוק את מה שהכותב צריך.
**האסימטריה המכריעה:**
```text
לחתוך → סיכון לאבד את הליבה (לוסטרניק), בלתי-הפיך בפועל ← עלות עצומה
לשמור → עולה כמעט-כלום; הרעש/הכפילויות שוקעים בדירוג ← עלות אפסית
```
**מסקנה (מחקר + 2 הרצות = משולש-אישוש):** **לא לחתוך בכלל.** "בעיית ה-70" לא היתה בעיית-RAG — אלא
בעיית **תור-אישור** + **היעדר-דירוג**. מתקנים את שניהם, ו-70 בלתי-מזיקים.
## 3. ההחלטה (מזוקקת)
### עמוד 1 — לא לבנות-מחדש, לא לחתוך הרסני, **לא לתחום**
שומרים את הקורפוס שלם. **אין cap. אין סינון-"רק-חדש".** החלטה עשירה = ~22 עקרונות לגיטימית.
### עמוד 2 — רמה A: "איכות-במקור" = ניקוי-רעש + dedup בלבד
המשטר היחיד שמותר במקור: **להסיר רעש-אמיתי** (כפילות, ציטוט-קטוע, אמרת-אגב מפורשת, תיאור-עובדות-ללא-כלל)
**ולמזג כפילויות**. **לשמור כל עיקרון בר-ציטוט מובחן — כולל יישומי-דוקטרינה.** הפאנל התלת-מודלי
משמש ל-dedup/זיהוי-רעש, **לא** לחיתוך-לכמות.
> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה.
> משטר-הפאנל נשאר ל-dedup + ולידציית-עיגון (INV-AH), לא לתקרה.
### עמוד 2 — רמה A: כמעט-כלום במקור (dedup אופציונלי בלבד)
המבחן הראה ש-curator זהיר שומר ~כל ה-70 (כולם בני-ציטוט). לכן במקור: **לא מסננים תוכן.**
הפעולה היחידה המותרת = **dedup של כפילויות-קרובות** (מיזוג לקנוני אחד, לא מחיקת-עיקרון-מובחן) —
ואפילו זה לא קריטי (כפילויות מדורגות-יחד וצורכות אחסון בלבד). הפאנל התלת-מודלי, אם בכלל, ל-dedup
+ ולידציית-עיגון (INV-AH) — **לא** לחיתוך/תקרה/novelty.
> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה —
> הוכח אמפירית שהם משמידים עקרוני-ליבה (לוסטרניק).
### עמוד 3 — רמה B: דירוג-בזמן-אחזור (הלב)
`importance` כ-boost ב-RRF: קאנון-ידני[max, מיידי] · תדירות-ציטוט-מדורגת (דפנה≫יו"ר-אחר≫כללי) ·