feat(halacha): #82.4 provenance-union על dedup-skip + #82.6 over-merge guard #192
Reference in New Issue
Block a user
Delete Branch "worktree-halacha-dedup-provenance-guard"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
מה
חילוץ החלטת-ה-dedup-on-insert ל-helper טהור ובדיק
halacha_quality.dedup_action()(skip/flag/keep), + שני שיפורים:#82.4 — merge-with-provenance, לא blind-drop
כשמדלגים על כפילות-סמנטית (cosine ≥ 0.93), מאחדים את ה-
citesשל השורה הנכנסת אל השכן-הקנוני ששורד, במקום לאבד אותם. זהו שדה-ה-provenance היחיד שקיים בהכנסה; בחירת-קנוני + מיזוג-corroboration מלא שייכים למסלול ה-reconciliation הלא-מקוון (#82.7 / #84.2, שם לשורות כבר יש provenance מצטבר) — מתועד בקוד.#82.6 — over-merge guard
ההחלטה PAIRWISE מול שכן יחיד הקרוב ביותר, ורק השורה הנכנסת מודלגת אי-פעם (אף שורה קיימת לא ממוזגת/נמחקת). אין connected-components closure בהכנסה → שרשרת A
BC לא קורסת לשורה אחת גם כש-A,C מובחנים (הסיכון המרכזי ב-entity-resolution). מתועד ב-dedup_action+ נבדק.Invariants
near_duplicate→סקירת-יו"ר.בדיקות
6 חדשות:
tests/test_halacha_dedup_action.py(skip / flag / keep-in-tail / over-merge-distinct / boundaries) + 59 בדיקות-הלכה קיימות (quality/coerce) עוברות. py_compile OK.🤖 Generated with Claude Code