docs(principles): refine synthesis — 2nd 8508 run (keep-when-in-doubt → 70/70 kept); no-cull triple-confirmed (#153)
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -9,28 +9,40 @@
|
||||
רמה B — אילו עקרונות לצוף באחזור לכתיבה → importance ranking (קאנון/ציטוט)
|
||||
```
|
||||
|
||||
## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24)
|
||||
תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו עליו את משטר-החילוץ-החדש (פאנל + cap):
|
||||
- **70 → 3.** ואז **אודיט-אובדן יריב:** **~22 עקרונות אמיתיים ונבדלים אבדו** (רק 16 מה-70 היו רעש).
|
||||
- האבודים כללו את **הלכת לוסטרניק** (עיקרון-הליבה של חישוב היטל-השבחה!), קשר-סיבתי, סף-פוטנציאל,
|
||||
וכל המסד הפרוצדורלי (מסלולי 14, נטלים, השתק, ריבית).
|
||||
- **השורש:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך "אילו עקרונות
|
||||
*בני-ציטוט שימושיים*" (~22), **כולל יישומי-דוקטרינה-מוכרת**. המסנן "רק-חדש/בלי-יישומים" סינן בדיוק
|
||||
את מה שהכותב צריך.
|
||||
## 2. ⚠️ מבחן-האמת ששינה את ההחלטה (8508-03-24) — שתי הרצות
|
||||
תיק היטל-השבחה (יו"ר אחר) שמפיק 70 עקרונות. הרצנו **שני משטרים** על אותם 70:
|
||||
|
||||
**מסקנה אמפירית:** cap + סינון-novelty = **הרסני**. מאשש את אזהרת-המחקר: חיתוך-מבוסס-ציון מאבד הלכות.
|
||||
```text
|
||||
אגרסיבי (פאנל + cap/novelty): 70 → 3 ✗ אודיט-אובדן: ~22 עקרונות אמיתיים אבדו,
|
||||
כולל הלכת לוסטרניק (ליבת חישוב היטל-השבחה!),
|
||||
קשר-סיבתי, סף-פוטנציאל, כל המסד הפרוצדורלי (14/נטלים/ריבית)
|
||||
מזוקק ("שמור-בספק", רעש בלבד): 70 → 70 ✓ "כולם בני-ציטוט; אין רעש-אמיתי; זוגות-קרובים
|
||||
מוסיפים נדבך". כל עקרוני-הליבה נשמרו.
|
||||
```
|
||||
- **השורש לקריסת-האגרסיבי:** החילוץ שאל "איזה דין *חדש* יצרה הוועדה" (~3) — אבל RAG-לכתיבה צריך
|
||||
"אילו עקרונות *בני-ציטוט שימושיים*" (~כל ה-70), **כולל יישומי-דוקטרינה-מוכרת**. מסנן "רק-חדש/בלי-יישומים"
|
||||
סינן בדיוק את מה שהכותב צריך.
|
||||
|
||||
**האסימטריה המכריעה:**
|
||||
```text
|
||||
לחתוך → סיכון לאבד את הליבה (לוסטרניק), בלתי-הפיך בפועל ← עלות עצומה
|
||||
לשמור → עולה כמעט-כלום; הרעש/הכפילויות שוקעים בדירוג ← עלות אפסית
|
||||
```
|
||||
**מסקנה (מחקר + 2 הרצות = משולש-אישוש):** **לא לחתוך בכלל.** "בעיית ה-70" לא היתה בעיית-RAG — אלא
|
||||
בעיית **תור-אישור** + **היעדר-דירוג**. מתקנים את שניהם, ו-70 בלתי-מזיקים.
|
||||
|
||||
## 3. ההחלטה (מזוקקת)
|
||||
|
||||
### עמוד 1 — לא לבנות-מחדש, לא לחתוך הרסני, **לא לתחום**
|
||||
שומרים את הקורפוס שלם. **אין cap. אין סינון-"רק-חדש".** החלטה עשירה = ~22 עקרונות לגיטימית.
|
||||
|
||||
### עמוד 2 — רמה A: "איכות-במקור" = ניקוי-רעש + dedup בלבד
|
||||
המשטר היחיד שמותר במקור: **להסיר רעש-אמיתי** (כפילות, ציטוט-קטוע, אמרת-אגב מפורשת, תיאור-עובדות-ללא-כלל)
|
||||
**ולמזג כפילויות**. **לשמור כל עיקרון בר-ציטוט מובחן — כולל יישומי-דוקטרינה.** הפאנל התלת-מודלי
|
||||
משמש ל-dedup/זיהוי-רעש, **לא** לחיתוך-לכמות.
|
||||
> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה.
|
||||
> משטר-הפאנל נשאר ל-dedup + ולידציית-עיגון (INV-AH), לא לתקרה.
|
||||
### עמוד 2 — רמה A: כמעט-כלום במקור (dedup אופציונלי בלבד)
|
||||
המבחן הראה ש-curator זהיר שומר ~כל ה-70 (כולם בני-ציטוט). לכן במקור: **לא מסננים תוכן.**
|
||||
הפעולה היחידה המותרת = **dedup של כפילויות-קרובות** (מיזוג לקנוני אחד, לא מחיקת-עיקרון-מובחן) —
|
||||
ואפילו זה לא קריטי (כפילויות מדורגות-יחד וצורכות אחסון בלבד). הפאנל התלת-מודלי, אם בכלל, ל-dedup
|
||||
+ ולידציית-עיגון (INV-AH) — **לא** לחיתוך/תקרה/novelty.
|
||||
> **תיקון ל-PR#304:** לבטל את `HALACHA_PANEL_MAX_NEW` (cap) ואת מסנן-ה-novelty בפרומפט-הוועדה —
|
||||
> הוכח אמפירית שהם משמידים עקרוני-ליבה (לוסטרניק).
|
||||
|
||||
### עמוד 3 — רמה B: דירוג-בזמן-אחזור (הלב)
|
||||
`importance` כ-boost ב-RRF: קאנון-ידני[max, מיידי] · תדירות-ציטוט-מדורגת (דפנה≫יו"ר-אחר≫כללי) ·
|
||||
|
||||
Reference in New Issue
Block a user