feat(goldset): independent second-judge for rule_role — break AI-anchoring #119
Reference in New Issue
Block a user
Delete Branch "worktree-goldset-independent-judge"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
כלי-מדידה: שופט-תפקיד עצמאי שני ממודל אחר (DeepSeek, API ישיר) שמסווג
rule_roleבעיוור — בלי לראות תיוג-אדם או המלצת-claude — ומחשב מטריצת-הסכמה בין-שופטים. שובר את עיגון-ה-AI שבתיוג מדגם-הזהב.ממצא (100 פריטים מתויגים)
מסקנה: ה-100% אדם↔AI היה עיגון. תת-הסוג holding/interpretive/procedural עמום-מטבעו — שני מודלים מוכשרים חותכים אותו אחרת (DeepSeek נוטה ל-holding). הציר-הגס ("האם זו הלכה אמיתית?") אמין חוצה-מודלים (92%) → להשתמש בו כ-ground-truth, ובתת-הסוג כעצה רכה בלבד, לא כשער.
תומך ב-INV-DM7: מאמת את אמינות התוויות אחרי פיצול הסמכות/תפקיד. read-only על הזהב, אפס תיוג מהיו"ר.
Invariants
🤖 Generated with Claude Code