תוכן מקצועי

Opus 4.7 מתקן את משבר 4.6 ומוסיף X High ו-/ultra-review

10 דקות קריאה דביר נעמן

Anthropic שחררה את מודל Opus 4.7 לאחר חודש של טענות משתמשים על ירידה באיכות של Opus 4.6. המודל החדש מביא תיקון ישיר לכל תלונה שנשמעה: חזרה לתכנון מעמיק, אימות עצמי של תוצאות, תמיכה במאמץ X High, ופקודת /ultra-review חדשה שמריצה סשן ביקורת עצמאי על שינויי קוד. בניתוח מול בנצמרקים, המודל החדש מציג שיפור דרמטי במיוחד במשימות קוד קשות, בתפיסת תמונות, ובהיגיון ארוך טווח.

לקריאה המלאה שירותי פיתוח תוכנה ←

Opus 4.7 מתקן את משבר 4.6 ומוסיף X High ו-/ultra-review

מה באמת קרה עם Opus 4.6 בשבועות שלפני 4.7?

לפני שנדבר על מודל Opus 4.7, חשוב להבין את הרקע. במהלך חודש מרץ ותחילת אפריל 2026 התפתחה סערה שקטה בקרב משתמשי Claude Code. מנהלת בכירה ב-AMD פרסמה ניתוח של כמעט 7,000 סשנים של כתיבת קוד, וחשפה מספרים מטרידים: עומק החשיבה של המודל קרס ב-73%, מ-2,200 תווי חשיבה בממוצע לכל תגובה לכ-600 בלבד. אחוז הפעמים שהמודל לא קרא קבצים לפני עריכה זינק מ-6% ל-33.7%. משתמשים נאלצו להתערב ולעצור את המודל פי 12 יותר מבעבר.

התסמינים המוחשיים: hashים של commit שהומצאו מאוויר, שמות חבילות npm שלא קיימים, גרסאות API שהומצאו. המילה "simplest" הופיעה פי שלושה יותר בפלט, סימן שהמודל בחר בנתיב של מאמץ מינימלי במקום לחשוב לעומק. משתמשי Max בתוכניות של $200 לחודש התלוננו ששרפו את כל מכסת הטוקנים שלהם בתוך שעה אחת של עבודה רגילה.

Anthropic הגיבה ב-9 בפברואר עם שינוי שקוף: העברה ל-adaptive thinking, מנגנון שמאפשר למודל להחליט דינמית כמה טוקני חשיבה להקצות לכל תור. על משימות שהמודל זיהה כפשוטות, המערכת הקצתה אפס טוקני חשיבה. Boris Churnney, היוצר של Claude Code, אישר מאוחר יותר שהטורים שבהם המודל המציא מידע היו תורים עם אפס חשיבה. באותו הזמן, רמת ה-effort הכוללת של המודל הורדה אוטומטית ל-Medium, בלי הודעה פומבית. משתמשי Pro ו-Max פעלו חודש שלם על מצב Medium בלי לדעת.

ההבדל בין מודל Opus 4.6 למודל Opus 4.7 מעבר לבנצמרקים

הבנצמרקים הרשמיים של Anthropic מראים קפיצות משמעותיות: שיפור דרמטי ב-knowledge work, ב-document reasoning, ב-long-term coherence, ובקוד. במשימות של biomolecular reasoning, הציון יותר מהוכפל. אלה מספרים חשובים, אבל הם רק חלק מהתמונה. ההבדל האמיתי שאני חווה הוא בתפיסת "איכות המחשבה" של המודל ביום יום.

במודל 4.6 (לפני התיקונים), הייתי צריך להזכיר למודל שוב ושוב לקרוא קבצים, לבדוק את הקונטקסט, ולא להסיק מסקנות מהר מדי. עם מודל 4.7, המודל עצמו חוזר למנגנון של "חשוב ואז פעל". התוצאה: פחות תיקונים מאוחרים, פחות ריטראינג של פרומפטים, פחות תסכול.

טענה של משתמשי רשת שקיבלה הד: Anthropic שיחררה בהדרגה את המעצורים של 4.6 כדי לבנות ציפיות לפני השקת 4.7. טענה קונספירטיבית, אבל יש בה תמיהה לגיטימית. בכל זאת, מהמדידות האובייקטיביות ברור שבנצ'מרק SWE-bench Pro הראה קפיצה ממשית. ה-updated tokenizer החדש הוא שינוי מבני שלא ניתן להסביר בהפעלה/כיבוי של סטיף, וגם X High effort הוא מצב שלא היה קיים קודם ודורש שינויים במשקלי המודל עצמם. קצרות: מדובר במודל חדש, ולא ב-4.6 מחדש.

מה כולל מודל Opus 4.7? ארבע התכונות שחשובות לדעת

השחרור של Opus 4.7 מגיע עם ארבע תכונות מרכזיות שצריך להכיר. כל אחת מהן פותרת כאב ספציפי שהיה ב-4.6:

X High effort level

רמת מאמץ חדשה מעל max, בלעדית ל-4.7
מחזירה את עומק החשיבה שהיה לפני התקלות של 4.6
מופעלת רק כשמבקשים ידנית או דרך Plan mode
צורכת פי 2-3 יותר טוקנים, משימה לסיטואציות קשות

פקודת /ultra-review

פותחת סשן ביקורת עצמאי על שינויי קוד
המודל קורא את ה-diff ומציין באגים או הצעות
מחליפה code review אנושי קל לפני merge
זמין ב-Claude Code CLI ובאפליקציית ה-Desktop

תפיסת תמונות משופרת

קפיצה משמעותית ב-visual reasoning benchmarks
זיהוי מדויק של תרשימים, תפריטים ומסמכים מצולמים
תומך בניתוח של צילומי מסך של אפליקציות מורכבות
משתלב היטב עם Computer Use שהוצג לפני שבועיים

Updated tokenizer

Tokenizer חדש משפר את עיבוד הטקסט
אותו קלט עלול לעלות פי 1 עד 1.3 בטוקנים
דיוק גבוה יותר במיפוי של מונחים טכניים
תמיכה טובה יותר בעברית ובשפות לא-אנגליות

חשוב לדעת: מעבר ל-Opus 4.7 הוא direct upgrade מ-4.6, הקוד לא צריך שינוי. המודל יעלה קצת יותר בטוקנים באותן הרצות בגלל ה-tokenizer החדש. מי שמחזיק על חשבון API עם תקציב הדוק ירצה לעקוב אחרי גרף הצריכה בשבועיים הראשונים.

איך לעדכן למודל Opus 4.7 בכל סביבות Claude Code?

העדכון פשוט ברוב המקרים, אבל יש נקודות ספציפיות לכל סביבה. הנה המדריך המלא:

שלב 1: עדכון Claude Code CLI. הריצו את הפקודה לעדכון ידני. ברוב המקרים ה-CLI עצמו יידחוף עדכון אחרי שעות ספורות, אבל אפשר לזרז:

# Update the CLI
claude update

# Select Opus 4.7 as default
/model opus-4-7

# Or combine with Advisor Strategy: Sonnet main, Opus advisor
/model opus-plan

שלב 2: עדכון ה-Desktop App. אם אתם משתמשים באפליקציית ה-Desktop שהושקה לצד 4.7, פתחו אותה, לחצו על Settings, ועברו ל-Updates. ייתכן שהעדכון כבר הותקן אוטומטית. שימו לב לכך שהאפליקציה שוחררה עם כ-40 באגים ידועים בשעות הראשונות (מפתח בשם Theo מיפה אותם בשעה אחת של שימוש), ו-Anthropic משחררת פאצ’ים מרובים בשבוע הראשון.

שלב 3: עדכון VS Code Extension. פתחו את Extensions בתוך VS Code, חפשו "Claude Code", ולחצו Install Update. אחרי העדכון, סגרו את VS Code ופתחו מחדש כדי לטעון את המודל החדש. ב-model selector תראו Opus 4.7 זמין.

שלב 4: בדיקה ראשונה. הריצו משימה פשוטה כדי לאשר שהכל עובד. ההמלצה: משימה שכוללת קריאת קובץ, חשיבה, וכתיבת שינוי קטן. זה בודק שמצב adaptive thinking עובד. דוגמה: "קרא את הקובץ src/index.ts וזהה שלוש בעיות אפשריות ללא שינוי הקוד".

שלב 5: הגדרת X High לפרויקטים מורכבים. אם אתם עובדים על פרויקט קוד מורכב שדורש חשיבה מעמיקה, הגדירו ב-CLAUDE.md של הפרויקט את רמת המאמץ. זה מפעיל את המצב אוטומטית בכל סשן:

# In CLAUDE.md root of project
default_effort: x-high
reasoning: adaptive

טיפ נוסף: אם יש לכם Superpowers עם סקילים בפרויקט, בדקו שהמודל החדש טוען אותם כראוי. לעיתים מודל חדש מחמיץ סקילים בהרצה הראשונה, וצריך להזכיר אותם במפורש בפרומפט.

דוגמה מעשית: השוואת ביצועים בשני מקרי בוחן

כדי להבין את ההבדל בפועל ולא רק בבנצמרקים, הרצתי שני מבחני שדה מתואמים על שתי הגרסאות. שני המבחנים רצו באותה ספרייה, עם אותן הנחיות מדויקות, רק עם מודל שונה.

מבחן 1: ניתוח גרף פיננסי. נתתי למודל תמונה של גרף של מניית Meta Platforms (META) עם תנודתיות של 6 חודשים, וביקשתי שלושה משפטים עם תובנות לקבלת החלטה. מודל Opus 4.6 בתצורת extended thinking החזיר שלושה משפטים כלליים עם מונחים פיננסיים אבל בלי הקשר לגרף הספציפי. מודל Opus 4.7 בתצורה רגילה החזיר שלושה משפטים עם הקשר הדוק לנקודות משמעותיות בגרף: "המניה חזרה לנקודת קדם-Q3 earnings", "הווליום במהלך העליה האחרונה חלש", "MACD מתחיל להסתובב שלילית". ההבדל: 4.7 קרא את הגרף בפועל, 4.6 המציא פרשנות כללית.

מבחן 2: מודל SAAS של 12 חודשים. ביקשתי משני המודלים לבנות מודל פיננסי של חברת SaaS עם סליידרים אינטראקטיביים, פרמטרים של churn, ותרחישים של מחיר. מודל Opus 4.6 ב-extended thinking החזיר dashboard אינטראקטיבי יפה ומעוצב. מודל Opus 4.7 בתצורה רגילה החזיר גיליון Excel עם שלוש שכבות (בסיס, תרחיש, assumptions), עם נוסחאות נכונות ובדיקה עצמאית שמצאה שתי שגיאות שהוא תיקן בעצמו.

מסקנה אופרטיבית: מודל Opus 4.7 נוטה להחזיר deliverable מוצק יותר, במיוחד כשהמשימה מצריכה וידוא או אימות. מודל Opus 4.6 עדיין טוב יותר ב-visualization אינטראקטיבי מתוחכם. שילוב של השניים עם מודל Advisor Strategy מאפשר להפעיל את הנכון לכל משימה. אצלנו בשירותי אוטומציות עסקיות עם AI אנחנו כבר מעבירים את הלקוחות לתצורה של 4.7 כברירת מחדל עם Advisor רק במשימות חזותיות מורכבות.

שילוב מודל Opus 4.7 עם X High, /ultra-review ו-Advisor Strategy

מודל Opus 4.7 מגיע לפתח שלו כשמשתמשים בו בשילוב עם שאר התכונות שהוכרזו סביבו. הנה שלושה שילובים מרכזיים לצוותי פיתוח:

שילוב עם X High effort. רוב המשתמשים לא משנים את רמת המאמץ ברירת המחדל (Medium). זו טעות עבור משימות קוד רציניות. /model x-high או הגדרה ב-CLAUDE.md מקפיצה את איכות התשובות ל-40-60% יותר מדויקות במשימות של ריפקטור, פתרון באגים, ותכנון ארכיטקטוני. המחיר: פי 2-3 טוקנים לכל תשובה.

שילוב עם /ultra-review. אחרי כל משימת קוד בינונית או גדולה, הריצו /ultra-review. המודל פותח סשן חדש, קורא רק את ה-diff, ומחפש באגים שהמודל הראשי פספס. זו שכבת הגנה שלוקחת דקה אחת, ומונעת באגים ב-production. מומלץ להתקין כהתראה ידנית בסוף כל פרויקט, לפני שדוחפים ל-main.

שילוב עם מודל Advisor Strategy. התצורה הכי חסכונית: Haiku 4.5 כ-Executor, Opus 4.7 כ-Advisor. הסוכן שלכם ירוץ על Haiku ברוב הזמן (1/5 העלות של Opus), ויזמין את Opus 4.7 רק לשאלות שדורשות היגיון גבוה. חיסכון של 50-70% בעלויות טוקנים לעומת Opus 4.7 סולו. פרטים מלאים בManaged Agents עם Advisor Strategy.

מי צריך לעלות למודל Opus 4.7 עכשיו ומי יכול לחכות?

לא כולם חייבים לעבור מיד. לחלק מהמקרים, המעבר יקר מדי או לא מוצדק. הנה חלוקה מעשית:

למי מתאים?

מי שצריך לעבור עכשיו

מפתחים שהתלוננו על איכות של Opus 4.6 בחודש האחרון
צוותים שמבצעים ריפקטור מורכב או עבודה על מערכות Legacy
כל מי שמשתמש בתמונות כחלק מהזרימה (ניתוח UI, OCR)
בעלי Claude Code Max שרוצים את המיטב של החיבור למנוי
פרויקטים שעובדים עם long context של מיליון טוקנים

למי לא מתאים?

למי שכדאי להמתין

משתמשי API Billing עם תקציב הדוק שלא רוצים קפיצה בטוקנים
פרויקטים שרצים בפרודקשן על Opus 4.6 ללא בעיות מדווחות
צוותים שמעדיפים המתנה לעדכוני יציבות של Desktop App
מי שמסתמך על visualization אינטראקטיבי מתוחכם (שם 4.6 עדיין חזק יותר)
ספקים שנאלצים להיצמד לגרסה של Bedrock או Vertex AI (עדכון צפוי באיחור)

הטיפ הפרקטי: אפשר להריץ את שני המודלים במקביל בסשנים שונים. השווה 10 תוצאות אמיתיות על משימות שלך, והחלט לפי הבעיות שלך. Anthropic מתכוונת לתמוך ב-4.6 עוד 6 חודשים לפחות לפני שהוא ייצא משימוש.

סיכום: האם באמת יצרו משבר רק כדי לפתור אותו במודל Opus 4.7?

התאוריה הקונספירטיבית שהייתה ברשת בימים שלפני 4.7 ניסתה לטעון שאין כאן שיפור מהותי, רק תיקון של מה שנשבר במכוון ב-4.6. זו תאוריה שמפספסת את התמונה הגדולה. השינויים של Opus 4.7 הם ברורים ומבניים: tokenizer חדש, מצב effort חדש, פקודת slash חדשה, שיפור כמותי בתפיסת תמונות. אלה לא שיפורים שמקורם רק בהחזרת "פיצ’ר שהופסק", אלא הוספות שדורשות אימון מחדש של המודל.

עם זאת, הפגיעה באמון של הקהילה היא ממשית. רבים מהמשתמשים שלא יודעים לעקוב אחרי השינויים ברמת הקוד חוו חודש שבו הכלי שלהם פשוט התחיל להיות פחות טוב, בלי הסבר, בלי הודעה, בלי אופציה לבטל. Anthropic תצטרך להיות שקופה הרבה יותר בעתיד לגבי שינויים שפוגעים בזמינות יכולת. רלוונטי במיוחד עבור עסקים שמשתמשים במערכת לפרודקשן אמיתי עם לקוחות אמיתיים.

האם המודל החדש שווה את הזמן של מיגרציה? התשובה עבור רוב הצוותים היא כן, בעיקר משום שהוא זול יחסית (direct upgrade בלי שינויי קוד) והתועלת הברורה (חשיבה מעמיקה, ביקורת עצמית, תפיסת תמונות). עבור ספקי שירות שמנסים אוטומציות עסקיות עם AI, המעבר חוסך בעיות תמיכת לקוחות על כשלים מוזרים שהיו שכיחים בסוף 4.6.

אם יש לכם אוטומציה או סוכן AI שרץ על Opus ולא השלמתם עדיין את המעבר, זה הזמן. בואו נעזור לכם להעביר את כל המודלים בצורה מסודרת, כולל הפעלה של X High לפרויקטים מורכבים ושילוב עם Advisor Strategy להפחתת עלויות.

שאלות ותשובות

האם מודל Opus 4.7 יקר יותר מ-4.6?

התמחור הרשמי זהה. Opus 4.7 עולה $5 לקלט ו-$25 לפלט למיליון טוקנים, אותו תמחור של 4.6. אבל בגלל ה-tokenizer החדש, אותו קלט עלול להיספר כ-1.1 עד 1.3 פעמים יותר טוקנים. בפועל, המשתמש ישלם כ-15% יותר על אותה משימה.

האם אפשר להשתמש ב-Opus 4.7 מ-AWS Bedrock?

עדיין לא. Anthropic משחררת מודלים חדשים קודם ב-API הישיר, ורק לאחר 4-8 שבועות הם מופיעים ב-Bedrock וב-Vertex AI. אם אתם כבולים ל-Bedrock מסיבות compliance, תצטרכו להמתין עד תחילת יוני 2026 לפי ההערכות.

מה זה X High effort בדיוק?

X High הוא רמת מאמץ חדשה שמוסיפה עומק חשיבה פי 3-4 מ-High. המודל משקיע יותר זמן בתכנון, באימות, ובבחינת אפשרויות חלופיות. זה רלוונטי למשימות של פתרון באגים מורכב, ריפקטור של קוד חוב, ותכנון ארכיטקטוני. למשימות פשוטות זה מבזבז טוקנים לשווא.

האם /ultra-review פועל על כל שפות התכנות?

כן. הפקודה פועלת על כל שפה שהמודל תומך בה, כולל פייתון, JavaScript, Go, Rust, C++, ואחרות. היא מנתחת את ה-diff ולא את המבנה הלוגי של קוד. הביקורת מתמקדת בבאגים מצויים, אבטחה, ובעיות performance.

האם אני יכול לחזור ל-Opus 4.6 אם 4.7 לא טוב בשבילי?

כן, בהחלט. הפקודה /model opus-4-6 מחזירה אתכם. Anthropic מתכוונת לתחזק את מודל 4.6 עוד 6 חודשים לפחות לפני הוצאה משימוש. עד אז, אתם יכולים לעבור בין הגרסאות לפי המשימה.

איך /ultra-review שונה מ-Code Review של GitHub?

GitHub Code Review מיועד לבדיקה של בן אדם על שינויים של בן אדם. /ultra-review הוא בדיקה עצמאית של מודל AI על קוד שמודל AI כתב. הם לא תחליף זה לזה. הגישה המומלצת: /ultra-review כשלב ראשון (חוסך זמן למבקר האנושי), ו-GitHub Code Review כשלב שני על ידי אדם צוות.

האם Opus 4.7 משתלב טוב עם Managed Agents?

בהחלט. Managed Agents תומכים במודל Opus 4.7 מההשקה. בממשק בחירת מודל באנונטרופיק Console, 4.7 מופיע כאופציה ברירת מחדל בכל סוכן חדש. סוכנים קיימים עוברים לגרסה החדשה אוטומטית בהפעלה הבאה שלהם, אלא אם נעלת אותם ידנית ל-4.6.

מה הצפוי מ-Opus 5.0?

Anthropic לא פרסמה לוח זמנים רשמי. על פי אותות מהקהילה, Opus 5.0 (או שינוי שם ל-Claude 5) צפוי ברבעון השלישי של 2026. עד אז נצפה לעדכונים קטנים ל-4.7 (4.7.1, 4.7.2) שיתקנו באגים ויוסיפו שיפורים זוטרים.

Opus 4.7 מתקן את משבר 4.6 ומוסיף X High ו-/ultra-review

מה באמת קרה עם Opus 4.6 בשבועות שלפני 4.7?

ההבדל בין מודל Opus 4.6 למודל Opus 4.7 מעבר לבנצמרקים