fix(extraction): סינון cited_only מתור/מוני החילוץ (#140) #263
Reference in New Issue
Block a user
Delete Branch "worktree-cited-only-skip-queue"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
הבעיה (#140)
31 שורות
case_lawעםsource_kind='cited_only'(ציטוט-בלבד, ללאfull_text/precedent_chunks) נושאותhalacha_extraction_status='pending'רק כברירת-מחדל ומזהמות את מונה ה-pending (במתזמר ובדף-התפעול). אין להן מה לחלץ.התיקון (G1 — תיקון-במקור · G2 — מסנן יחיד משותף)
db.EXTRACTION_ELIGIBLE_PREDICATE— מקור-אמת יחיד ל"שורה ברת-חילוץ":source_kind <> 'cited_only' AND EXISTS(precedent_chunks). מוחל ב-list_pending_extraction_requests. #139 יעשה בו שימוש-חוזר ל-reconcile — אותו כלל, לא מוגדר פעמיים.halacha_drain_supervisor.db_snapshot(GROUP BY status),web/app.pymeta+hal_ext.reconcile_metadata_status.pyמורחב לתור-ההלכות:cited_only → 'skipped'(אותו terminal-state כמו צד-המטא; תור-תאום, G2).תיקון-נתון (בוצע על ה-DB החי)
reconcile_metadata_status.pyהורץ: 31 cited_only halacha → 'skipped' (metadata כבר היה מיושב — אידמפוטנטי). התפלגות-אחרי: halachapending=9(עבודה אמיתית),skipped=31,completed=309. המונה במתזמר/בדף ירד מ-40 ל-9.בדיקות
test_extraction_queue_eligibility(חדש) — ה-predicate מחריג cited_only+דורש chunks;list_pending_extraction_requestsמחיל אותו לשני ה-kinds.undefined-names+leak-guardנקיים.Invariants
skipped), לא טלאי-בקריאה בלבד🤖 Generated with Claude Code