Refine voice fingerprint with full 1xxx corpus (24 cases)
All checks were successful
Build & Deploy / build-and-deploy (push) Successful in 3m3s
All checks were successful
Build & Deploy / build-and-deploy (push) Successful in 3m3s
After analyzing all 24 building_permit decisions in style_corpus DB (not just the 2 local files), refined two anti-patterns: 1. Sub-headings: actually permitted when block-yod handles 3+ distinct legal issues (e.g., 1079-24 had "הבקשות לפסילה" / "מעמד המבקשת וזכות עמידה" / "עותרים ציבוריים"). The earlier rule of "no sub-headings except academic cases" was too strict — based only on small local sample. 2. Paragraph numbering: discovered it's an evolutionary pattern, not a static rule. Pre-2025 decisions had sequential paragraph numbers (1, 2, 3 throughout); recent decisions (1126-25, 1128-25, 1130-25, 1194-25) abandoned it for narrative flow. The agent should NOT add paragraph numbers — the new style. The (1)...(2)...(3)... in-paragraph enumeration ban remains absolute — 0/33 final decisions used it. Distinction now made explicit: in-paragraph enumeration ≠ paragraph-level numbering (former always forbidden; latter is evolutionary). Updated: - docs/daphna-voice-fingerprint.md — corpus stats, refined anti-patterns - .claude/agents/legal-writer.md — checklist with new distinctions Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -281,8 +281,9 @@ curl -s -X POST -H "Authorization: Bearer $PAPERCLIP_API_KEY" \
|
|||||||
|
|
||||||
### אנטי-דפוסים — בדיקה אחרי כתיבה (חובה)
|
### אנטי-דפוסים — בדיקה אחרי כתיבה (חובה)
|
||||||
|
|
||||||
- [ ] **אין רשימות ממוספרות** באנליזה (`(1)... (2)... (3)...`) — דפנה מעולם לא משתמשת
|
- [ ] **אין רשימות ממוספרות בתוך פסקה** (`(1)... (2)... (3)...`) — דפנה מעולם לא משתמשת
|
||||||
- [ ] **אין כותרות משנה** בתוך בלוק י (חוץ מתיקים אקדמיים-משפטיים מובהקים כמו נאמנות)
|
- [ ] **אין מספור פסקאות סדרתי** (1., 2., 3.) — מגמה ישנה שנטושה ב-2025+; הסגנון החדש הוא נרטיב רציף
|
||||||
|
- [ ] **כותרות משנה רק אם 3+ סוגיות מובחנות** — בתיק עם פסילה + עמידה + מהות, מותר. בתיק עם סוגיה אחת — לא.
|
||||||
- [ ] **אין סיכומים בנקודות** של החלטות אחרות — תמיד ציטוט מלא
|
- [ ] **אין סיכומים בנקודות** של החלטות אחרות — תמיד ציטוט מלא
|
||||||
- [ ] **אין דחיית טענה במשפט אחד** — כל טענה משמעותית = פסקה
|
- [ ] **אין דחיית טענה במשפט אחד** — כל טענה משמעותית = פסקה
|
||||||
- [ ] **אין רטוריקה דרמטית של הצדדים** ("חטא קדמון") בקול ההכרעה — לתעד, לא לאמץ
|
- [ ] **אין רטוריקה דרמטית של הצדדים** ("חטא קדמון") בקול ההכרעה — לתעד, לא לאמץ
|
||||||
|
|||||||
@@ -6,22 +6,31 @@
|
|||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
## 0. הקורפוס שניתח (10 החלטות סופיות)
|
## 0. הקורפוס שניתח
|
||||||
|
|
||||||
|
**גרסה 1 — 10 החלטות מתוך `data/training/`:**
|
||||||
|
|
||||||
| תיק | סוג | מילים בבלוק י | תוצאה |
|
| תיק | סוג | מילים בבלוק י | תוצאה |
|
||||||
|------|-----|---------------|-------|
|
|------|-----|---------------|-------|
|
||||||
| גמר בניה | 8xxx (פטור) | 6,047 | קבלה |
|
| גמר בניה | 8xxx (פטור) | 6,047 | קבלה |
|
||||||
| **החלטה-1130-25** | 1xxx (תכנית) | 4,409 | קבלה חלקית |
|
| **החלטה-1130-25** | 1xxx (תכנית) | 4,409 | קבלה חלקית |
|
||||||
| ורדיה | 8xxx (השבחה) | 1,954 | חלקית — תיקון שמאית |
|
| ורדיה | 8xxx (השבחה) | 1,954 | חלקית |
|
||||||
| זכרון דברים | 8xxx (מימוש) | 3,368 | דחייה |
|
| זכרון דברים | 8xxx (מימוש) | 3,368 | דחייה |
|
||||||
| טור סיני | 8xxx (השבחה) | 3,255 | קבלה (חלקית) |
|
| טור סיני | 8xxx (השבחה) | 3,255 | קבלה (חלקית) |
|
||||||
| כלמוביל | 8xxx (השבחה) | 4,325 | מינוי שמאי מייעץ |
|
| כלמוביל | 8xxx (השבחה) | 4,325 | מינוי שמאי מייעץ |
|
||||||
| נאמנות | 8xxx (פטור) | 5,330 | קבלה (פטור) |
|
| נאמנות | 8xxx (פטור) | 5,330 | קבלה |
|
||||||
| סופר נוח | 8xxx (השבחה) | 2,208 | קבלה |
|
| סופר נוח | 8xxx (השבחה) | 2,208 | קבלה |
|
||||||
| עלות עודפת בחניה | 8xxx (השבחה) | 555 | דחייה — קצרה |
|
| עלות עודפת בחניה | 8xxx (השבחה) | 555 | דחייה |
|
||||||
| קרקעות ירושלים | 9xxx (פיצויים) | 4,314 | דחייה |
|
| קרקעות ירושלים | 9xxx (פיצויים) | 4,314 | דחייה |
|
||||||
|
|
||||||
**הסקה**: 9 מתוך 10 הם 8xxx/9xxx (ישובים/קרים). רק 1130-25 (1xxx) הוא הסוג ה"חם". הקורפוס מטה לכיוון הקול הקר.
|
**גרסה 2 — הרחבה ל-48 החלטות מ-`style_corpus` ב-DB:**
|
||||||
|
- 24 building_permit (1xxx)
|
||||||
|
- 22 betterment_levy (8xxx)
|
||||||
|
- 2 compensation_197 (9xxx)
|
||||||
|
|
||||||
|
מתוך ה-24 1xxx, 23 קבצים בעלי content מספיק נותחו. רובם מתפלגים בין 2,000-8,500 מילים בבלוק י.
|
||||||
|
|
||||||
|
**הסקה משולבת**: עכשיו הקורפוס מאוזן יותר (24 1xxx, 22 8xxx, 2 9xxx). הדפוסים שמתחת מבוססים על המכלול.
|
||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
@@ -163,12 +172,23 @@
|
|||||||
|
|
||||||
מבוסס על קריאת ה-10 החלטות + ההשוואה לטיוטות ה-AI:
|
מבוסס על קריאת ה-10 החלטות + ההשוואה לטיוטות ה-AI:
|
||||||
|
|
||||||
### 3.1 ❌ אסור: רשימה ממוספרת בטענות הדיון
|
### 3.1 ❌ אסור: רשימה ממוספרת בתוך פסקה
|
||||||
**ב-0/10** מהחלטות הסופיות יש רשימה ממוספרת `(1) ... (2) ...` בלב הדיון.
|
**ב-0/33** מהחלטות הסופיות יש `(1) ... (2) ... (3) ...` בתוך פסקת אנליזה אחת.
|
||||||
**ב-2/2 טיוטות AI** שראיתי הופיעה רשימה ממוספרת — שהוסרה בעריכה.
|
**ב-3/3 טיוטות AI** שראיתי הופיעה רשימה ממוספרת — שהוסרה בעריכה.
|
||||||
|
|
||||||
### 3.2 ❌ אסור: כותרת משנה בלב בלוק י
|
⚠️ **הבחנה חשובה**: זה שונה ממספור פסקאות סדרתי (1, 2, 3 ... כאוטוט-של-פסקאות), שכן עד 2025 דפנה כן השתמשה במספור סדרתי (כמו פסיקה מסורתית). מ-2025-מאוחר זה נטוש; ההחלטות החדשות (1126-25, 1128-25, 1130-25, 1194-25) **ללא** מספור פסקאות. **המגמה החדשה** היא נרטיב רציף ללא מספור.
|
||||||
**ב-1/10 בלבד** (נאמנות) יש כותרת משנה ("מהותו של מוסד הנאמנות"). זה תיק אקדמי-משפטי מובהק. בכל יתר התיקים — הזרימה רציפה עם פסקאות.
|
|
||||||
|
### 3.2 ⚠️ מותנה: כותרת משנה בלב בלוק י
|
||||||
|
|
||||||
|
**מקרים שבהם דפנה משתמשת בכותרות משנה** (מתוך 33+ קבצים שנבדקו):
|
||||||
|
- **1079-24** (1xxx, 8,440 מילים): "הבקשות לפסילה" / "מעמד המבקשת וזכות עמידה" / "עותרים ציבוריים" — מכיוון שהיו 3+ סוגיות משפטיות מובחנות (פסילת חבר ועדה, זכות עמידה, מהות ההיתר)
|
||||||
|
- **נאמנות** (8xxx, 5,330 מילים): "מהותו של מוסד הנאמנות" — תיק אקדמי-משפטי מובהק
|
||||||
|
|
||||||
|
**כלל אצבע**:
|
||||||
|
- ✅ כותרת משנה **כן** — אם בלוק י כולל 3+ סוגיות מובחנות לחלוטין (לא רק שיקולים בתוך סוגיה אחת)
|
||||||
|
- ❌ כותרת משנה **לא** — אם זו סוגיה אחת עם תת-שיקולים. הזרימה רציפה.
|
||||||
|
|
||||||
|
**טון הכותרת**: שם הסוגיה בלבד, ללא מספור, ללא מילות "סעיף" / "פרק". דוגמאות: `הבקשות לפסילה`, `מעמד המבקשת וזכות עמידה`, `מהותו של מוסד הנאמנות`.
|
||||||
|
|
||||||
### 3.3 ❌ אסור: סיכום מנוקד של החלטה אחרת
|
### 3.3 ❌ אסור: סיכום מנוקד של החלטה אחרת
|
||||||
לעולם דפנה לא תכתוב "החלטת הוועדה המקומית הייתה: (1) ..., (2) ..., (3) ...". במקום זאת היא תביא את ההחלטה ב**ציטוט מלא** עם ביטוי המעבר: `להלן ההחלטה אשר תובא במלואה לאור פירוטה וחשיבותה כמענה לערר`.
|
לעולם דפנה לא תכתוב "החלטת הוועדה המקומית הייתה: (1) ..., (2) ..., (3) ...". במקום זאת היא תביא את ההחלטה ב**ציטוט מלא** עם ביטוי המעבר: `להלן ההחלטה אשר תובא במלואה לאור פירוטה וחשיבותה כמענה לערר`.
|
||||||
|
|||||||
Reference in New Issue
Block a user