chore(eval): add 9 chair-approved semantic queries to FU-5 gold-set #22
Reference in New Issue
Block a user
Delete Branch "chore/goldset-semantic-queries"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
ה-gold-set היה 77 known-item ("חפש לפי שם"). נוספו 9 שאילתות מהותיות (S1–S9) שדפנה אישרה — שאלה משפטית בכל שורה, relevant = התקדימים שצריכים לעלות. בודק את מה שחשוב: האם האחזור עונה על סוגיה, לא רק מוצא תיק בשמו.
source=chair(נשמר ב-re-bootstrap).practice_areaריק כדי שהפילטר לא יחריג תקדים cross-tagged (פסקי ס'197 יושבים תחת betterment_levy).baseline כעת 86 שאילתות. ממצא מ-9 המהותיות: MRR ≈ 1.0 — המערכת מציפה תקדים-מוביל רלוונטי בדירוג 1 כמעט לכל שאלה — אבל R@10 נע 0.5–1.0: לשאלות רחבות עם הרבה תקדימים co-relevant (נטרול תמ"א 38 = 5 → R@10 0.60; שמאי מכריע = 2 → 0.50) חלק מהתקדימים לא נכנסים ל-top-10. אחזור תקדים-מוביל חזק; recall ממצה רב-תקדימי הוא הפער.
🤖 Generated with Claude Code