feat(halacha): #86.2 אודיט-זיהום נבו + backfill רציו · #86.3 benchmark כיסוי-רציו #194
Reference in New Issue
Block a user
Delete Branch "worktree-nevo-corpus-audit"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
#86.2 — אודיט הדלפת-preamble של נבו (
nevo_corpus_audit.py leak)סורק chunks + הלכות למרקרי-העריכה של נבו (מיובאים מ-
extractor._NEVO_MARKERS— מקור-אמת יחיד), ומבחין בין:ממצא חי (read-only): 70 פסקים עם מרקר כלשהו, 17 עם רציו-עריכה בצ'אנק, אך 0 הלכות מזוהמות — שכבת-הידע נקייה (שערי-האיכות של #81 מנעו זאת).
מסקנה: אין purge/re-ingest — (1) הווקטור המזיק (הלכות) ריק; (2) re-OCR retrofit נוגד-עיקרון (feedback_no_reocr_retrofit); (3) צ'אנקי-ציטוטים benign.
במקום זה —
leak --applyעושה backfill אדיטיבי בטוח: מחלץcase_law.nevo_ratioמ-full_textהשמור (extract_nevo_ratio, דטרמיניסטי, ללא re-OCR, לא נוגע בצ'אנקים/הלכות) — "לשמור במקום למחוק" (#86.3). הורץ בייצור: 16→32 פסקים עם רציו שמור.#86.3 — benchmark כיסוי-רציו (
benchmark)לפסקים עם
nevo_ratio, הפאנל התלת-מודלי (Opus+DeepSeek+Gemini) שופט אילו עקרונות-רציו מכוסים ע"י ההלכות שלנו → recall.Invariants
extractor; פאנל מיובא מ-halacha_panel_approve(אין כפילות).בדיקות
6 offline (
tests/test_nevo_corpus_audit.py:_has_marker/_has_editorial) +test_nevo_preambleקיים עובר. אומת חי (leak + backfill 16→32 + benchmark smoke).🤖 Generated with Claude Code