דביר נעמן

סוכן עסקי 24/7 על Claude Opus 4.7
תוכן מקצועי

איך בניתי סוכן עסקי 24/7 על Claude Opus 4.7

22 דקות קריאה מאי 2026 דביר נעמן

אחרי סשן ארוך עם הסרטון של Holvey על איך הוא הפך את Claude Opus 4.7 לסוחר 24/7, החלטתי לבדוק את הארכיטקטורה הזאת לעסק שלי. לא טריידינג, אלא משימות עסקיות שצריכות לרוץ ברציפות: סקירת חדשות תעשייה כל בוקר, מענה ראשוני ללידים, וסיכום שבועי של פעילות הלקוחות. בפוסט הזה אסביר איך בניתי, מה למדתי, ומה הוא לא יכול לעשות.

איך בניתי סוכן עסקי 24/7 על Claude Opus 4.7

הבעיה: סוכן AI לא זוכר כלום בין סשן לסשן

מי שעבד עם Claude Code, Cursor, או Codex מכיר את הבעיה. אתם פותחים סשן בבוקר, מסבירים לסוכן מה אתם רוצים, הוא עושה עבודה נהדרת, ובסוף היום הסשן נסגר. למחרת כשאתם רוצים שיכיר את ההקשר, אתם מתחילים מאפס. אם יש לכם פרויקט שהקיף נמתח על שבועות, ההסבר היומי של ההקשר הוא חלק משמעותי מהזמן.

זאת לא בעיה ייחודית לטריידינג. בכל משימה עסקית שדורשת רציפות, היעדר זיכרון בין הסשנים הוא חסם משמעותי. בעבודה היומית שלי יש לי כמה תהליכים שדורשים בדיוק את הסוג הזה של זיכרון: סקירת חדשות תעשייה שמייצרת לי סיכום שבועי, סינון לידים שמגיעים לאתר ושיוך שלהם לערוצים, ותחזוקת קישורים פנימיים בין פוסטים שאני מפרסם.

הסרטון של Ben Holvey שיצא לפני שבועיים פתר את הבעיה הזאת בעבור טריידינג, אבל הראה גם דפוס כללי. הוא בנה סוכן 24/7 על Claude Opus 4.7 עם שילוב של שני מרכיבים: Routines של Claude Code שמפעילות אותו לפי שעון, וארכיטקטורת זיכרון מבוססת קבצים שמשמרת הקשר בין הריצות. תוצאה: סוכן שיש לו זיכרון, גם בלי שאני מנהל אותו.

בפוסט הזה אסקור את המבנה שהוא הציג, את ההתאמות שעשיתי לעסק שלי, את התוצאות אחרי כשבועיים של ריצה, ואת השאלות שלא נפתרו לי עדיין. אני לא בונה סוחר, אבל המתודולוגיה זהה. אם אתם בונים מערכת AI שדורשת רצף של החלטות לאורך זמן, הדפוס הזה רלוונטי.

הפתרון בקצרה: רוטינות + תיקיית memory + שכבת בקרה

הארכיטקטורה היא משולש פשוט. בקודקוד הראשון Routines של Claude Code, השכבה שמפעילה את הסוכן בשעות קבועות, בלי התערבות שלי. כל routine היא בעצם prompt שקורא לסוכן לבצע משימה ספציפית. בסיום הוא חוזר לישון עד הריצה הבאה.

בקודקוד השני תיקיית memory. כל ריצה של Claude Code היא stateless. הוא קם בלי לדעת כלום על מה שקרה אתמול. הפתרון הוא תיקיית קבצי Markdown שהסוכן עצמו קורא בתחילת כל ריצה ועדכון בסיום. כך הזיכרון נשמר על הדיסק, לא במודל.

בקודקוד השלישי שכבת בקרה אנושית. כל פעולה שדורשת אישור (פרסום, תשלום, שליחת מייל) עוברת תור פנימי שאני סוקר פעם ביום. הסוכן לא לוקח החלטות באוטונומיה מלאה כשמדובר בכסף או בפנייה ללקוחות. שכבה זו דומה ל-"paper mode" של החבר ההוא בטריידינג.

5רוטינות פעילות
12קבצי memory
3פעולות בתור אנושי ביום
$18/חודשעלות תפעול

בהמשך אקח אתכם דרך כל מרכיב, עם הקוד האמיתי של ה-prompts וה-pipelines. תהיו ערוכים לזה שהפתרון הסופי הוא לא 100% אוטונומי, ומדובר בעיצוב מכוון. אוטומציה בלי בקרה אנושית ב-business operations היא מתכון לתקלה ציבורית.

שכבה 1: Routines של Claude Code, איך הן עובדות בפועל

Routines הוא פיצ'ר חדש יחסית של Claude Code שמאפשר להגדיר prompt שמופעל אוטומטית על cron schedule. ה-routine רץ בענן של Anthropic, לא במחשב שלכם, מה שאומר שהוא פועל גם כשאתם ישנים. ראו את הסקירה הקודמת שלי על Routines לרקע מלא.

אצלי, חמש רוטינות פעילות:

  • 06:00 בכל בוקר. סריקת חדשות AI מהלילה: TechCrunch, The Verge, Twitter feeds מבחר. בודק אילו רלוונטיות לקהל שלי, ומסכם ב-news-digest.md.
  • 09:00 בכל בוקר. סקירה של לידים שנכנסו אתמול. מסווג לפי איכות, מתעד ב-leads-pipeline.md, מסמן את הראויים לפנייה ידנית.
  • 12:00 בכל בוקר. בדיקת קישורים פנימיים בפוסטים חדשים שפורסמו אתמול. מציין הזדמנויות שכחתי ומציע cross-links.
  • 17:00 בכל יום. סיכום פעילות יומית מתוך הקבצים שעודכנו, נשלח כתקציר למייל שלי.
  • יום ראשון 08:00. סיכום שבועי מקיף, מנתח דפוסים מהשבוע ומציע 3 פעולות לשבוע הבא.

כל אחת מהרוטינות מקבלת prompt קבוע. הנה דוגמה לprompt של רוטינת הבוקר:

פעולה: סקירת חדשות AI יומית

קונטקסט:
1. קרא את התיקייה /memory לפני שאתה מתחיל
2. בעיקר memory/news-context.md ו-memory/topics-already-covered.md

משימות:
1. גש ל-feeds הבאים: techcrunch.com, theverge.com/ai
2. ב-Twitter, חפש האשטגים: #AnthropicAI, #ClaudeAI, #LLMs
3. סנן ידיעות שעלו ב-24 השעות האחרונות
4. הצלב מול memory/topics-already-covered.md
5. בחר עד 5 ידיעות הכי רלוונטיות לקהל ישראלי

עדכון memory:
1. הוסף ל-memory/news-digest.md פרק חדש עם תאריך
2. הוסף נושאים חדשים שכוסו ל-memory/topics-already-covered.md
3. אם זיהית טרנד שצריך מאמר ייעודי, פתח שורה ב-memory/article-ideas.md

סיום:
החזר תקציר של 5 שורות עם הטיטל של כל ידיעה.

שימו לב למבנה: קרא memory, בצע, עדכן memory, החזר תקציר. זה הדפוס שמאפשר רצף של החלטות לאורך זמן בלי שהמודל זוכר ישירות מה היה אתמול.

שכבה 2: ארכיטקטורת memory, הדבר שעושה את כל ההבדל

תיקיית memory היא הלב של המערכת. בלעדיה הסוכן מתנהל כמו לקוח שזוכה בלוטו כל בוקר ושוכח עד למחר. עם memory מבנה היטב, הוא הופך לעובד עקבי שזוכר את ההקשר העסקי שלי לאורך זמן.

המבנה שלי דומה למה שהסרטון הציג, עם התאמות:

memory/
├── strategy.md            # היעדים העסקיים השבועיים והחודשיים
├── client-pipeline.md     # רשימת לקוחות פעילים, סטטוס וסיכומים
├── leads-pipeline.md      # לידים פעילים שלא נסגרו
├── content-calendar.md    # פוסטים מתוכננים לפרסום בשבועות הבאים
├── topics-already-covered.md   # נושאים שכבר כתבתי עליהם, למניעת שכפול
├── news-digest.md         # דיגסט החדשות היומי, נצבר
├── news-context.md        # הקשר ארוך טווח על תעשיית AI
├── article-ideas.md       # רעיונות לפוסטים, מדורגים לפי עניין
├── decisions.md           # החלטות אסטרטגיות שלקחתי, עם הצדקה
├── learnings.md           # תובנות מסשנים שעברו
├── do-not.md              # דברים שניסיתי וכשלו, מקומות סיכון
└── action-queue.md        # פעולות שדורשות אישור אנושי

כל קובץ הוא Markdown פשוט עם מבנה עקבי. למשל, leads-pipeline.md נראה כך:

# Leads Pipeline

## Active

### Lead #2026-04-23-3 — שם לקוח: [נמחק]
- Source: טופס ב-/automations
- Stage: First contact (4 days ago)
- Score: 7/10 (פוטנציאל ROI גבוה)
- Next action: Follow-up email by 2026-05-04
- Notes: ביקש דוגמאות לפיתוח מותאם, שלחתי 3 קייסים

### Lead #2026-04-25-1 — ...

## Archived (closed)
...

הסוכן עצמו אחראי על תחזוקת הקבצים. כשרוטינה רצה, היא קוראת את הקבצים הרלוונטיים בתחילת הריצה ומעדכנת אותם בסיום. אני מתערב רק כשיש פעולה שדורשת אישור (סעיף הבא).

"זיכרון מובנה הוא אבן הראש של כל סוכן AI עסקי. בלעדיו, האוטונומיה היא אשליה. עם הקבצים האלה, הסוכן הוא לא 'AI שמסכם דברים', אלא עובד שזוכר מה היה אתמול."

תובנה אישית, אחרי שבועיים של הרצה

שכבה 3: שכבת הבקרה האנושית, ה-paper-mode של עסקים

בסרטון, Holvey מתאר "training wheels": ריצה ראשונה ב-paper-trading, חוקים נוקשים על מקסימום פוזיציה, סף הפסד יומי. ההיגיון: לא לתת לסוכן לעשות אוטונומית פעולות שעלולות לגרום נזק כספי לפני שהוא מוכיח את עצמו.

אצלי, אותה גישה. כל פעולה שעלולה להגיע ללקוח, או שיש לה השלכה כספית, נכנסת ל-action-queue.md. אני סוקר את התור פעם ביום בבוקר, מאשר או דוחה. דוגמאות לפעולות שעוברות:

  • שליחת מייל ראשוני לליד חדש (מוודא שהטון נכון לפני)
  • פרסום פוסט שהוכן אוטומטית (מוודא שאין שגיאות עובדתיות)
  • תשובה ב-LinkedIn לתגובה על פוסט (לוודא טון)
  • שינוי תמחור או הצעה ללקוח קיים
  • קביעת פגישה עם לקוח חדש (מוודא זמינות אמיתית)

פעולות שלא דורשות אישור (הסוכן עושה אוטונומית):

  • קריאה ועדכון קבצי memory
  • סריקת חדשות וסיווג
  • הצעת רעיונות לפוסטים
  • בדיקת קישורים שבורים
  • סיכום נתונים מ-Search Console / GA4
  • הכנת drafts ראשוניים של פוסטים

החלוקה הזאת בין "אוטומטי" ל"דורש אישור" היא ההכרעה הכי חשובה במבנה. אם יותר מדי דברים דורשים אישור, אני מחזיר את עצמי לעבודה ידנית. אם פחות מדי, אני מסתכן בכך שהסוכן יעשה משהו שהלקוחות יראו לפני שאני אעצור אותו.

# Action Queue (pending approval)

## 2026-05-02 09:23
**Type**: Email response to lead #2026-04-25-1
**Suggested by**: leads-pipeline routine
**Risk**: Medium (first contact with new prospect)
**Draft**:
> שלום [שם],
> תודה על הפנייה. בהתאם לצרכים שתיארת, יש לי 3 דוגמאות שמתאימות במיוחד...
**Required approval**: Dvir to review tone + adjust before send
**My decision**: ✅ Approved with minor adjustment to opening line

איך הקמתי את כל זה: מדריך מעשי

אם אתם רוצים לבנות סוכן דומה לעסק שלכם, הנה הצעדים שעשיתי בסדר כרונולוגי. תזכרו: זה לא פרויקט של יום אחד. אני התקדמתי בהדרגה, עם בדיקות בכל שלב, וכל שלב בנה על האמינות של הקודם.

הגדרת המטרה והגבולות

לפני ששרתתי שורה אחת, ישבתי וכתבתי מסמך אסטרטגיה של עמוד אחד: מה הסוכן אמור לעשות, מה הוא לא אמור לעשות, מה ההצלחה תיראה ומה הכישלון. המסמך הזה הוא ה-strategy.md הראשון שנכנס ל-memory.

החוק שלי: הסוכן יכול לחסוך לי זמן בעבודה שגרתית, אבל הוא לא יכול להיות הקול שלי מול לקוחות בלי שאני מאשר. כל יציאה מ"שגרתי" דורשת אישור.

בניית מבנה memory בסיסי

יצרתי תיקיית memory/ עם 6 קבצי Markdown ריקים, כל אחד עם header מובנה. השקעתי שעתיים לכתוב את ה-strategy.md ו-client-pipeline.md הראשוניים, כי הם החומר הגלם של כל החלטה עתידית.

אזהרה: אל תייצרו קבצים מעורפלים. כל קובץ צריך מטרה ברורה. אם אתם לא יודעים מתי הסוכן יקרא ויעדכן את הקובץ, אל תייצרו אותו.

routine ראשונה, פשוטה במכוון

הרוטינה הראשונה שיצרתי הייתה הפשוטה ביותר: סריקת חדשות בוקר. למה פשוטה? כי רציתי לראות שהמערכת רצה לפני שאני נותן לה משימות מורכבות. השארתי אותה רצה שלושה ימים, בדקתי בכל בוקר את news-digest.md, וודאתי שהיא מבינה מה רלוונטי.

הוספת שכבת בקרה

אחרי שהרוטינה הראשונה הוכיחה את עצמה, הוספתי action-queue.md ופעולת leads-pipeline שמייצרת drafts במקום לשלוח מיילים ישירות. זה היה הצעד החשוב ביותר. בלעדיו הייתי מסתכן בכך שהסוכן יוציא מייל לא מדויק לליד אמיתי.

הרחבה הדרגתית

במשך שבועיים הוספתי routine אחת בכל יומיים. בכל הוספה הייתי מוודא שהמערכת עדיין יציבה לפני הבא. היום יש לי 5 routines, וזה מה שעובד היום. ייתכן שאוסיף עוד בעתיד, אבל רק אחרי שהקיימות יעמדו במבחן הזמן.

תוצאות אחרי שבועיים

הנה המספרים מהתקופה הראשונה. שורה תחתונה: זה עובד, אבל הציפיה שזה יחליף עובד מלא היא לא מציאותית.

  • זמן שחסך לי בשבוע: כ-7 שעות. בעיקר בסקירת חדשות וסיווג לידים. שבעה שעות שעברתי לעבודה גבוהה יותר.
  • איכות drafts המייל ללידים: 75% מקובלים בלי שינוי, 20% עם תיקון קל, 5% נדחים לחלוטין. זה מספר טוב, לקח לי שבוע להגיע אליו אחרי כיול ה-prompts.
  • רעיונות לפוסטים שהציע: 14 בשבוע, מהם 4 שכתבתי עליהם בפועל. שיעור ה-conversion סביר, וההצעות עזרו לי לראות נושאים שלא הייתי חושב עליהם לבד.
  • שגיאות / hallucinations: 3 פעמים בשבוע. תמיד נתפסו ב-action-queue ולא הגיעו ללקוחות. אבל מראה למה שכבת בקרה אנושית היא קריטית.
  • עלות תפעול: $18 לחודש. Routines של Claude Code + Claude Pro. זול מאוד לעומת ערך הזמן שחסך.
מה הסוכן לא עושה היטב

הסוכן לא טוב במשימות שדורשות יצירתיות עמוקה או הבנה רגשית. הוא מצוין בתהליכי "סינון, סיווג, סיכום" אבל לא יכול לחבר פוסט מקצועי טוב לבד. כל פוסט שהוא מציע דורש כתיבה אנושית מלאה. זה ההבדל בין "מסכם" לבין "כותב".

תובנות אסטרטגיות מהפרויקט

אחרי חודש של ניסויים והתאמות, גיבשתי 5 תובנות שהן הבסיס לכל סוכן עסקי מצליח. הן רלוונטיות לכל מי שבונה מערכת דומה, ולא משנה אם משתמשים ב-Claude, ChatGPT או מערכת AI אחרת.

01

אוטונומיה היא ספקטרום, לא בינארי

הוויכוח על "האם AI יחליף את העבודה שלי" מסתכל על זה כעל אם או. בפועל, אוטונומיה היא ספקטרום. סוכן שעושה 80% מהעבודה השגרתית ומשאיר לי לבדוק 20% הוא הצעד הנכון. ניסיון להגיע ל-100% מוביל לטעויות שמתפוצצות.

02

מבנה memory חשוב יותר מהמודל

השדרוג של Claude Opus 4.7 על 4.6 משמעותי, אבל השפעת המבנה של memory על איכות התוצאות גדולה יותר. סוכן שעובד עם memory מובנה גם על Opus 4.6 יביא תוצאות טובות יותר מסוכן בלי memory על המודל החדש ביותר.

03

קבצי Markdown מנצחים מסדי נתונים

בהתחלה ניסיתי לאחסן זיכרון ב-SQLite, חשבתי שזה יותר "מקצועי". התוצאה: הסוכן לא קרא את הקבצים בזמן אמת, היה צריך scripts מיוחדים. החזרתי הכל ל-Markdown. הסוכן קורא קבצים אלה באופן טבעי, מבין מבנה היררכי, ויכול לערוך בלי schema.

04

בקרה אנושית היא לא חולשה, היא יתרון

הוספת action-queue.md הרגישה בהתחלה כמו ויתור על אוטונומיה. בפועל, היא מה שאיפשר לי לסמוך על הסוכן. בלעדיה, הייתי בודק כל פעולה שלו פרטנית מתוך חרדה. עם action-queue, אני בודק 3 פעולות ביום ויודע ששאר הזמן הסוכן עובד יציב.

05

הזמן שחוסך הולך למשימות גבוהות יותר

שבע השעות שחסכתי בשבוע לא הפכו ל"חופש". הן הופנו לפיתוח פייפליין מסמכים ולפרויקטי פיתוח תוכנה שהיו מחכים בתור. זה דפוס שראוי לשים לב אליו: אוטומציה מצליחה לא מובילה לפחות עבודה, אלא לעבודה אחרת.

חמש התובנות האלה אינן מסקנות תיאורטיות, הן עברו דרך 4 שבועות של בדיקות בסביבת עבודה אמיתית. אם בונים מערכת AI עסקית, אלה השאלות שכדאי להישאל בכל שלב של ההקמה.

סיכום: מה למדתי מהבנייה

הפרויקט הזה לימד אותי משהו עמוק על איך עובדים עם AI עסקי. אוטונומיה אמיתית לא נוצרת מעוצמת המודל לבד, אלא משילוב של שלוש שכבות: רוטינות שמפעילות את הסוכן, זיכרון מובנה שמשמר הקשר, ובקרה אנושית שמונעת טעויות מלהגיע ללקוחות. החסר באחת מהשכבות מבטל את התרומה של השתיים האחרות.

למי שחושב לבנות מערכת דומה, ההמלצה שלי: התחילו עם רוטינה אחת, פשוטה במכוון. אל תנסו לבנות 10 רוטינות בו זמנית. הוסיפו memory מובנה רק אחרי שהמערכת מוכיחה יציבות. ולמדו לסמוך על שכבת הבקרה האנושית לפני שאתם נותנים לסוכן לבצע פעולות אוטונומיות מול לקוחות.

מי שמתעניין באוטומציה עסקית רחבה יותר, ראו את עמוד האוטומציות שלי שמרכז את כל סוגי האוטומציה שאני בונה ללקוחות, ואת תיק העבודות עם דוגמאות אמיתיות מהשטח.

שיתוף הפוסט

שאלות ותשובות

האם אפשר לעשות את זה ב-Cursor או ב-Codex של OpenAI?

חלקית. קרסר לא תומך ב-routines אוטומטיות מתוזמנות. צריך כלי חיצוני כמו cron ב-VPS. Codex תומך בריצות בענן אבל אין לו מבנה memory מובנה. שניהם דורשים יותר עבודת תשתית. Claude Code עם Routines הוא הפתרון הקרוב ביותר ל-out-of-the-box.

מה החלופות אם אין לי Claude Pro או Claude Max?

Claude Code routines דורשות Claude Max או Pro מורחב. אם אין לכם, אפשר להריץ את אותו דפוס עם cron + Claude API + סקריפטי Python. זה דורש יותר עבודה ואחזקה, אבל אפשרי. בעלות $20-50 בחודש על API לשימוש בינוני.

כמה זמן לקח להגיע למצב יציב?

שבועיים מההכרזה הראשונה. השבוע הראשון היה במחשבה ובניית memory בסיסי, השבוע השני היה הוספת routines וכיול. אחרי שבועיים המערכת רצה כמעט לבד עם 30 דקות תחזוקה ביום.

האם זה מתאים לעסק קטן או רק למתקדמים טכנית?

צריך נוחות בסיסית עם Markdown ועם הרצת CLI. אם אתם נוחים עם ChatGPT ועם עריכת קבצי טקסט, אתם תוכלו לבנות גרסה פשוטה תוך יום. הגרסה המורחבת עם 5 routines ו-12 קבצי memory דורשת השקעה גדולה יותר.

כמה זמן לוקח להקים מערכת כזו מאפס?

השלב הבסיסי של רוטינה ראשונה + memory מובנה לוקח כיומיים של עבודה ממוקדת, אבל הכיול האמיתי שייצר מערכת יציבה דורש 3-4 שבועות של ניסויים. אני ממליץ לתכנן חודש שלם, להתחיל מרוטינה אחת בלבד, ולהוסיף עוד רק אחרי שהמערכת הוכיחה יציבות. מי שמנסה להקים את כל המערכת בשבוע נוטה לוותר עליה אחרי חודש כי היא לא נותנת תוצאות אמינות.

האם זה עובד גם עם ChatGPT או רק עם Claude?

הקונספט עובד עם כל מודל שיש לו זיכרון מובנה ויכולת לקרוא קבצים מקומיים. אבל בפועל, אני בחרתי ב-Claude Code בגלל Routines של Anthropic שמספקות תשתית מובנית להרצה אוטומטית. ChatGPT דורש פתרון חיצוני להרצה אוטומטית (כמו cron + API), וזה מוסיף שכבת תחזוקה. אם אתם כבר עובדים עם ChatGPT, אפשר להשיג תוצאה דומה דרך OpenAI Assistants API + AWS Lambda, אבל זה פרויקט פיתוח גדול יותר.

איך אני יודע שהמייל שהסוכן הציע באמת מתאים ללקוח?

זה בדיוק הצורך שמוביל את שכבת ה-action-queue. הסוכן לא שולח מיילים לעולם בלי אישורי. הוא יוצר draft, שמר אותו ב-action-queue.md, ואני בוחן אותו לפני שליחה. אחרי שבועיים של אישורים, התחלתי להבחין בדפוסים: 75% מה-drafts אני מאשר בלי שינוי, 20% עם תיקון קל, 5% פסולים. הנתונים האלה משמשים לכיול ה-prompts של הסוכן בעדכונים הבאים.

מה קורה עם פרטיות הלקוחות אם הסוכן עובר על המיילים שלהם?

שאלה חשובה. המערכת שלי לא קוראת מיילים נכנסים אוטומטית, אלא רק מייצרת drafts על בסיס מידע שאני מספק לה ב-client-pipeline.md. זה מקטין משמעותית את חשיפת הנתונים. ארגונים שמחפשים אינטגרציה מלאה עם תיבת המייל צריכים להוסיף Data Processing Agreement עם Anthropic ולהגדיר מדיניות retention ברורה. אני ממליץ להתחיל בלי גישה אוטומטית למיילים נכנסים, ולהרחיב רק אחרי שהמערכת מוכיחה אמינות.

דביר נעמן

על הכותב

דביר נעמן – מומחה שיווק דיגיטלי, SEO ואוטומציות

מלווה עסקים בצמיחה דיגיטלית: קידום אורגני, קידום במנועי AI, אימייל מרקטינג, אוטומציות ופיתוח תוכנה. תוצאות מדידות ושקיפות מלאה.