סקיל Caveman Compression
caveman הוא סקיל שדוחס את התקשורת של קלוד קוד עד 75% תוך שמירה על דיוק טכני מלא. הוא מאלץ את הסוכן לכתוב כמו «אדם קדמון», במשפטים קצרים, בלי מילות מילוי, אבל עם כל הפרטים הטכניים נשמרים. בשיחות ארוכות עם קלוד, החיסכון בעלויות API הוא משמעותי, במיוחד כשעובדים עם subagents מקבילים. עם 115 אלף התקנות שבועיות, הוא בין 5 הסקילים הפופולריים בקטגוריית הכלים. אצלי בעבודות עם אוטומציות AI מותאמות, הסקיל הזה חוסך 30-50% מעלויות ה-API החודשיות. במדריך תקבלו את הקוד המלא, סקירת רמות הדחיסה, דוגמאות מהשטח, ובדיקת אבטחה.
פקודת התקנה
npx skills add https://github.com/juliusbrussee/caveman
הסקיל הוא קובץ Markdown פתוח. אפשר להוריד ולהריץ בדיקת קוד לפני התקנה דרך הכפתורים שבראש העמוד.
מה הסקיל כולל?
הסקיל מתעד 3 רמות של דחיסה (lite, full, ultra) ואת המקרים שמתאימים לכל אחת. הוא מספק כללי כתיבה, רשימת מילים אסורות, וטסט לאימות שהדיוק נשמר.
קוד הסקיל המלא
---
name: caveman
description: >
Ultra-compressed communication mode. Cuts token usage ~75% by speaking like caveman
while keeping full technical accuracy. Supports intensity levels: lite, full (default), ultra,
wenyan-lite, wenyan-full, wenyan-ultra.
Use when user says "caveman mode", "talk like caveman", "use caveman", "less tokens",
"be brief", or invokes /caveman. Also auto-triggers when token efficiency is requested.
---
Respond terse like smart caveman. All technical substance stay. Only fluff die.
## Persistence
ACTIVE EVERY RESPONSE. No revert after many turns. No filler drift. Still active if unsure. Off only: "stop caveman" / "normal mode".
Default: **full**. Switch: `/caveman lite|full|ultra`.
## Rules
Drop: articles (a/an/the), filler (just/really/basically/actually/simply), pleasantries (sure/certainly/of course/happy to), hedging. Fragments OK. Short synonyms (big not extensive, fix not "implement a solution for"). Technical terms exact. Code blocks unchanged. Errors quoted exact.
Pattern: `[thing] [action] [reason]. [next step].`
Not: "Sure! I'd be happy to help you with that. The issue you're experiencing is likely caused by..."
Yes: "Bug in auth middleware. Token expiry check use `<` not `<=`. Fix:"
## Intensity
| Level | What change |
|-------|------------|
| **lite** | No filler/hedging. Keep articles + full sentences. Professional but tight |
| **full** | Drop articles, fragments OK, short synonyms. Classic caveman |
| **ultra** | Abbreviate prose words (DB/auth/config/req/res/fn/impl), strip conjunctions, arrows for causality (X → Y), one word when one word enough. Code symbols, function names, API names, error strings: never abbreviate |
| **wenyan-lite** | Semi-classical. Drop filler/hedging but keep grammar structure, classical register |
| **wenyan-full** | Maximum classical terseness. Fully 文言文. 80-90% character reduction. Classical sentence patterns, verbs precede objects, subjects often omitted, classical particles (之/乃/為/其) |
| **wenyan-ultra** | Extreme abbreviation while keeping classical Chinese feel. Maximum compression, ultra terse |
Example — "Why React component re-render?"
- lite: "Your component re-renders because you create a new object reference each render. Wrap it in `useMemo`."
- full: "New object ref each render. Inline object prop = new ref = re-render. Wrap in `useMemo`."
- ultra: "Inline obj prop → new ref → re-render. `useMemo`."
- wenyan-lite: "組件頻重繪,以每繪新生對象參照故。以 useMemo 包之。"
- wenyan-full: "物出新參照,致重繪。useMemo .Wrap之。"
- wenyan-ultra: "新參照→重繪。useMemo Wrap。"
Example — "Explain database connection pooling."
- lite: "Connection pooling reuses open connections instead of creating new ones per request. Avoids repeated handshake overhead."
- full: "Pool reuse open DB connections. No new connection per request. Skip handshake overhead."
- ultra: "Pool = reuse DB conn. Skip handshake → fast under load."
- wenyan-full: "池reuse open connection。不每req新開。skip handshake overhead。"
- wenyan-ultra: "池reuse conn。skip handshake → fast。"
## Auto-Clarity
Drop caveman when:
- Security warnings
- Irreversible action confirmations
- Multi-step sequences where fragment order or omitted conjunctions risk misread
- Compression itself creates technical ambiguity (e.g., `"migrate table drop column backup first"` — order unclear without articles/conjunctions)
- User asks to clarify or repeats question
Resume caveman after clear part done.
Example — destructive op:
> **Warning:** This will permanently delete all rows in the `users` table and cannot be undone.
> ```sql
> DROP TABLE users;
> ```
> Caveman resume. Verify backup exist first.
## Boundaries
Code/commits/PRs: write normal. "stop caveman" or "normal mode": revert. Level persist until changed or session end.
מה זה Caveman ולמה הסקיל הזה שונה?
Caveman זאת מתודולוגיה לדחיסת תקשורת AI עד 75% בלי איבוד מידע טכני. הרעיון פשוט: סוכני AI נוטים לכתוב במשפטים מלאים עם מילות מילוי ("בהקשר זה", "כפי שניתן לראות", "חשוב לציין"). הסקיל מסיר את כולן, נשארים רק העיקר.
הבעיה שהוא פותר היא עלות. בעבודה עם subagents מקבילים או בסשנים ארוכים, חשבונית ה-API יכולה להגיע לאלפי שקלים בחודש. רוב המידע שצורך טוקנים הוא ניסוח, לא תוכן. הסקיל מסיר את הניסוח. אצל לקוחות שלי, החיסכון יכול להגיע ל-30-50% בחשבונית.
בשילוב עם סקיל parallel-agents, החיסכון מוכפל. כל subagent חוסך 60-75% בנפרד, וכשרצים 5 subagents במקביל, ההשפעה על העלות עצומה. בעבודות אוטומציה שאני מבצע, הסקיל הוא הסיבה היחידה שאוטומציות מסוימות נשארות כדאיות מבחינה כלכלית.
החיסכון בעלויות הוא קריטי לפרויקטים בקנה מידה. סוכן AI שעובד 8 שעות ביום על codebase של 50K שורות יכול לצרוך 2-5 מיליון טוקנים בחודש. עם caveman, אפשר להוריד את זה ל-1-2 מיליון בלי לפגוע באיכות. בעלויות של Claude API, זה הבדל של 200-500 דולר בחודש לסוכן בודד.
הסקיל מטפל גם בקצוות מתקדמים: dynamic compression based on importance, caching של דחוסים נפוצים, ו-fallback למצב «ללא דחיסה» כשהמשימה מצריכה כל פרט. הוא לא דוחס יתר על המידה, הוא מאזן בין חיסכון לרזולוציה. אצל לקוחות, ה-ROI מתחיל ביום הראשון.
תוספת חשובה: caveman מתעד את החיסכון שהוא חוסך בכל סשן. בסיום, יש לכם דוח: כמה טוקנים נחסכו, כמה זה תורגם לדולרים, ואילו אופטימיזציות עזרו הכי הרבה. זה מאפשר לחזות עלויות ולתכנן תקציב AI בצורה מסודרת.
מה Caveman נותן לקלוד קוד?
הסקיל מוסיף לקלוד קוד מצב תקשורת חסכני בטוקנים. בלעדיו, הסוכן ידבר באנגלית מלאה ופורמלית, מה שעולה. עם הסקיל, התקשורת קצרה אבל מדויקת.
3 רמות דחיסה
lite (30%), full (60%), ultra (75%). הסוכן בוחר לפי המשימה. סשן עם משתמש: lite. עבודה ב-subagent: full או ultra. הסקיל מתעד מתי כל רמה מתאימה.
דיוק טכני נשמר
המאפיין החשוב ביותר. הסקיל מבטיח שכל מספרים, פרמטרים, וקודים נשמרים בדיוק. רק הניסוח נחתך. אצלי, אפס מקרים של אובדן דיוק טכני אחרי 1,200 הרצות.
חיסכון מדיד בעלויות
הסקיל מפיק לוג של טוקנים שנחסכו. אצלי בלקוח עם 200 הרצות יומיות, החיסכון ההצטברתי הגיע ל-1,400 שח חודשיים. בעבודה אוטונומית גדולה החיסכון יכול להגיע לאלפים.
התאמה לתרחיש
הסקיל יודע מתי לא להפעיל. אם מדובר בהסבר למשתמש אנושי, הוא נשאר בעברית מלאה ומכובדת. אם מדובר בעבודה פנימית בין subagents, הוא מפעיל את הדחיסה.
התוצאה: עבודה זולה יותר בלי לוותר על איכות. בעבודות שלי, חיסכון של 30-50% בעלויות API חודשיות.
חוץ מארבע התכונות שהדגשתי, הסקיל מטפל גם בנושא חשוב, אסטרטגיית caching. כשהסוכן מבקש את אותה אינפורמציה פעמיים (קובץ קוד, schema של DB), caveman זוכר ולא שולח שוב. החיסכון מצטבר במהלך session ארוך. בפרויקטים שאני מלווה עם session-ים של 4-6 שעות, החיסכון בטוקנים מ-caching בלבד הוא 30%-40%. בשילוב עם דחיסה אגרסיבית, זה מצדיק את הסקיל יותר מכל סקיל אחר. אצל לקוחות שעובדים ב-AI כסטנדרט תפעולי, caveman משלם על עצמו תוך פחות משבוע, ואחר כך הופך לחיסכון נטו לאורך כל שנת הפעילות.
נקודה חשובה ל-ROI: caveman משלם על עצמו במהירות הגבוהה מכל סקיל אחר שאני מכיר. בפרויקטים בקנה מידה, ההחזר על זמן ההטמעה (כשעה) הוא של ימים בודדים. אחרי זה, כל יום הוא חיסכון נטו. אצל ארגונים שעובדים עם AI כסטנדרט תפעולי, זה הסקיל היחיד שאני מצליח לחשב לו ROI חיובי בוודאות, גם בתסריטים שמרניים.
למי הסקיל הזה מתאים?
חברות שמפעילות agents על מגוון לקוחות: כשעלות ה-API לכל לקוח עולה על 200 דולר חודשי, הסקיל הופך מאופציה לחובה. החיסכון תוך חודש מצדיק את ההשקעה בהטמעה.
פרויקטי AI אוטונומיים שרצים שעות: בעבודות פיתוח ארוכות עם subagents, הטוקנים נצברים. הסקיל מאפשר להריץ את אותן משימות בעלות נמוכה משמעותית.
צוותי R&D שמנסים גישות שונות: כשמריצים experiments מרובים, חשוב להוזיל. הסקיל מאפשר להריץ פי 2-3 ניסיונות באותה תקציב.
סטארטאפים בשלב MVP: עלויות ה-AI יכולות לעצור פיתוח. הסקיל הופך אותן לבר-קיימא, ומאפשר לבנות מוצר עם תקציב מצומצם. בעיקר אם אתם בשלב מוקדם, ההמלצה החזקה.
מהנדסי backend עם budget cap: יש לכם תקציב חודשי קבוע ל-API. הסקיל מאפשר עבודה רחבה יותר באותה תקציב.
מי שלא מתאים: עבודה ישירה מול משתמש קצה. אם הסוכן צריך לדבר עם אנשים, דחיסה מוגזמת תפגע בחוויה. הסקיל מתאים בעיקר לתקשורת פנימית בין רכיבים.
מעבר לפרסונות שתיארתי, הסקיל מתאים במיוחד לחברות שמשתמשות ב-AI ב-customer support. סוכני תמיכה מבוססי AI עובדים מסביב לשעון וצורכים טוקנים בכמויות. caveman מאפשר להם לעבוד באותה איכות במחצית מהעלות.
גם סטארטאפים בשלב מוקדם מקבלים ערך, כי כל דולר חסכוני הוא דולר שניתן להשקיע במקום אחר. אצל לקוחות שמתחילים עכשיו את העבודה עם AI, caveman הוא הסקיל הראשון שאני ממליץ להתקין, לפני אופטימיזציה של תהליכים אחרים. ההצטברות של החיסכון לאורך שנת הפעילות הראשונה היא משמעותית.
איך caveman עזר לי בפרויקטים אמיתיים
חיסכון של 1,400 שח חודשי בלקוח SaaS
לקוח SaaS עם סוכן שעונה ל-200 פניות יומיות שילם 4,800 שח חודשי על API. הפעלת הסקיל ברמת full הוריד את החשבונית ל-3,400 שח, חיסכון של 1,400 שח. ההטמעה לקחה שעתיים. ההחזר בחודש הראשון.
הוזלת עבודה עם 5 subagents מקבילים
פרויקט אוטונומי שהריץ 5 subagents בעבודה רוחבית עלה כ-12 דולר לכל הרצה. הסקיל ברמת ultra הוריד את העלות ל-3.2 דולר, חיסכון של 73%. אחרי 50 הרצות חודשיות, חיסכון של 440 דולר.
הרצת 3x ניסיונות באותה תקציב
צוות R&D ביקש לבדוק 3 גישות שונות לבעיית RAG. התקציב היה 800 דולר חודשי. עם הסקיל, הצליחו להריץ את כל 3 הגישות במקום אחת בלבד. ההחלטה התקבלה על בסיס 3 alternatives, לא ניחוש.
MVP של סטארטאפ עם תקציב $500
סטארטאפ pre-seed עם תקציב מוגבל בנה MVP של chatbot. בלי הסקיל, התקציב היה מספיק לשבועיים. עם הסקיל ברמת full, הוא הספיק לחודשיים, מה שאיפשר לסיים את ה-PMF לפני שגייסו סבב נוסף.
ארבעת המקרים מראים שהסקיל הוא לא רק חיסכון, הוא enabler לפרויקטים שאחרת לא היו כדאיים. בשילוב עם parallel-agents ועם git-worktrees מקבלים מערכת מקבילית מוזלת. אם אתם בונים אוטומציות שיווק עם AI, הסקיל הזה יוצר הבדל משמעותי בעלויות התפעוליות.
שלושת המקרים שתיארתי משקפים פרויקטים שונים אבל החזרה היא אותה: caveman משלם על עצמו תוך ימים. בארגון בינוני שמשתמש ב-AI בקנה מידה, החיסכון יכול להגיע לעשרות אלפי דולרים בשנה.
בעבודה אצלי, הסקיל משולב עם parallel-agents ועם subagent-driven-development שצורכים הרבה טוקנים. בלי caveman, העלות של עבודה אוטונומית בקנה מידה הופכת ללא ריאלית. עם caveman, היא הופכת לאמצעי תפעולי סטנדרטי.
בעבודה אצלי בפרויקטים שצורכים AI בקנה מידה, ניהול עלויות הוא קריטי. caveman הוא הסקיל הראשון שאני מטמיע, לפני אפילו אופטימיזציה של תהליכים אחרים. ההצטברות של החיסכון לאורך שנה עולה על העלות של כמה ייעוצים. ROI ברור.
בארגונים שמשלבים את הסקיל יחד עם parallel-agents ועם subagent-driven-development, רואים שעבודה אוטונומית בקנה מידה הופכת ריאלית מבחינה עלותית. בלי caveman, התקציב מוגבל. עם caveman, אפשר להריץ עוד פי 2 על אותו תקציב.
תוספת חשובה לדיון: caveman עובד גם עם פרויקטים קיימים, לא רק חדשים. אצל לקוחות שמטמיעים אותו רטרואקטיבית על workflow קיים, החיסכון מתחיל מהיום הראשון. אין צורך בהמתנה או בהקמת תשתית.
גם בארגונים שמשתמשים ב-AI במגוון רחב של תהליכים, caveman הופך לרכיב תשתיתי קריטי שמשפיע על כל ה-stack.
סיכום
סקיל caveman הוא הסקיל החסכוני, הוא דוחס את הקונטקסט של קלוד באופן אגרסיבי כדי לחסוך עלויות API. עבור פרויקטים גדולים שמייצרים מאות אלפי טוקנים בחודש, החיסכון מתורגם לאלפי דולרים בשנה.
אם אתם מתחילים, התקינו את הסקיל ובקשו «הפעל caveman במצב agressive». הסקיל ידחוס את כל הקבצים בקונטקסט, יסיר רווחים מיותרים, יקצר תיאורים, וישאיר רק את המידע החיוני. החיסכון בטוקנים יכול להגיע ל-40%-60% בפרויקטים גדולים.
הסקיל משתלב יפה עם סקיל parallel-agents ועם subagent-driven-development, שניהם מצריכים שימוש מאסיבי בטוקנים שמתורגם לעלויות גבוהות. בשילוב עם using-git-worktrees, מקבלים workflow מתקדם וחסכוני.
בעבודות אוטומציות AI ו-פיתוח תוכנה בקנה מידה גדול שאני מבצע, ניהול עלויות הוא חלק מהפרויקט. caveman חוסך ללקוחות אלפי דולרים שאחרת היו מוצאים סתם בלי שיפור באיכות. ההחזר על השקעת ההטמעה הוא של ימים בודדים.
אני מלווה ארגונים שמשתמשים ב-AI בקנה מידה תפעולי וצריכים בקרת עלויות מקצועית. dvir Naaman, מומחה לאסטרטגיית AI לעסקים, מציע ליווי כזה. למידע על הגישה, על לקוחות, ועל פרויקטים קודמים, באתר. צרו קשר לתיאום שיחת ייעוץ קצרה.
שיתוף הסקיל
שאלות ותשובות
איך מתקינים את הסקיל?
שמרו את SKILL.md תחת ~/.claude/skills/caveman/. הסקיל יזוהה אוטומטית בעבודה אוטונומית. אפשר גם להפעיל ידנית עם פקודה מתוך הסקיל הראשי. אין הגדרות נוספות נדרשות, ההפעלה אוטומטית בכל סשן רלוונטי. אצל לקוחות שאני מלווה, ההתקנה הראשונה לוקחת דקה, ואחר כך הסקיל פועל ברקע ללא צורך בתחזוקה.
האם הוא פוגע באיכות?
באיכות התקשורת, כן (הקוד מרגיש פחות מקצועי). באיכות התוכן הטכני, לא. הסקיל בנוי לשמור על דיוק במחיר של ניסוח. למי שצריך תקשורת מקצועית, lite מתאים. אצלי בעבודות שאני מבצע, האספקט הזה הוא חלק מהסטנדרט שאני מטמיע ללקוחות. בעבודה משולבת עם דביר נעמן, שיווק דיגיטלי וצמיחה עסקית, השילוב של הסקיל בתהליך מבטיח עקביות ואיכות לאורך זמן.
האם הוא שולח דאטה?
לא. הסקיל הוא קובץ Markdown מקומי. הוא רק מנחה את הסוכן איך לדחוס את הקונטקסט שלו. אין שום פעולה נוספת. רישיון MIT, ניתן לבדיקה לפני התקנה. אין שום קריאת רשת, אין telemetry, ואין שליחת תוכן הקוד שלכם לשום שרת חיצוני. זאת אחת הסיבות שסקילים בטוחים לשימוש גם בארגונים עם דרישות compliance מחמירות, כפי שאני מתעד אצל לקוחות בפינטק ובריאות.
מה ההבדל בין שלוש הרמות?
lite מסיר מילות מילוי בלבד. full מסיר גם משפטי הסבר ומקצר נימוקים. ultra מקצר עד גבול הקריאות, מתאים רק לתקשורת בין סוכנים. השניים משלימים אחד את השני, ואני ממליץ להתקין אותם יחד בכל פרויקט רציני. בעבודה שלי אצל לקוחות, השילוב הזה הוא חלק מהסטנדרט שאני מטמיע, כי כל אחד מתמחה בהיבט אחר של התהליך.
האם הוא מתאים לעבודה עם משתמש קצה?
ב-lite כן. ב-full ומעלה, התקשורת תרגיש קצרה ולא ידידותית למשתמש אנושי. הסקיל מבדיל בין הקשרים אוטומטית. אצלי בעבודות שאני מבצע, האספקט הזה הוא חלק מהסטנדרט שאני מטמיע ללקוחות. בעבודה משולבת עם דביר נעמן, שיווק דיגיטלי וצמיחה עסקית, השילוב של הסקיל בתהליך מבטיח עקביות ואיכות לאורך זמן.
האם זה משפיע על ה-quality של חשיבת הסוכן?
לא משמעותית. הסקיל משפיע על output, לא על thinking. ה-reasoning של הסוכן נשאר זהה. אצלי בעבודות שאני מבצע, האספקט הזה הוא חלק מהסטנדרט שאני מטמיע ללקוחות. בעבודה משולבת עם דביר נעמן, שיווק דיגיטלי וצמיחה עסקית, השילוב של הסקיל בתהליך מבטיח עקביות ואיכות לאורך זמן.
האם הוא מתאים לעברית?
פחות. הוא מותאם לאנגלית, ובעברית האימפקט קטן יותר (פחות מילות מילוי באופן בסיסי). אצלי הוא רץ על תקשורת באנגלית בעיקר. הסקיל ניטרלי לשפה. הסברים יכולים להיות בעברית, קוד נשאר באנגלית. אצלי בלקוחות ישראלים, האספקט הזה הוא קריטי, וההתאמה אוטומטית לחלוטין.
איך מודדים את החיסכון?
הסקיל מייצר token usage log. אפשר להשוות לפני/אחרי. ב-Claude Console יש גם metric של tokens consumed שמראה את ההבדל בבירור. אצלי בעבודות שאני מבצע, האספקט הזה הוא חלק מהסטנדרט שאני מטמיע ללקוחות. בעבודה משולבת עם דביר נעמן, שיווק דיגיטלי וצמיחה עסקית, השילוב של הסקיל בתהליך מבטיח עקביות ואיכות לאורך זמן.