Claude Sonnet 5: راهنمای کامل قابلیتهای agentic و مقایسه با Opus
Claude Sonnet 5 : راهنمای کامل قابلیتهای agentic و مقایسه با Opus
Claude Sonnet 5 همون چیزیه که تا چند ماه پیش فقط با مدلهای Opus امکانپذیر بود: قابلیت اجرای خودکار، استفاده از ابزار و برنامهریزی پیچیده حالا با قیمت پایینتر. این مدل فاصلهی عملکردی بین نسل Sonnet و Opus رو بهشدت کم کرده و برای توسعهدهندههایی که پروژههای agentic دارن، انتخابی جدی شده.
اگه میخوای بدونی آیا Sonnet 5 میتونه جایگزین Opus بشه یا فقط یه ارتقای معمولیه، این مقاله جوابهای واقعی رو داره.
Claude Sonnet 5 چیه و چه تفاوتی با نسخههای قبلی داره؟
Claude Sonnet 5 پیشرفتهترین مدل agentic در خانوادهی Sonnet محسوب میشه. این مدل میتونه برنامهریزی کنه، از ابزارهایی مثل مرورگر و ترمینال استفاده کنه و بهصورت خودکار کارهایی رو انجام بده که چند ماه پیش نیاز به مدلهای بزرگتر مثل Opus داشت.
Claude Sonnet 5 نسبت به Sonnet 4.6 بهبودهای قابلتوجهی در چهار زمینهی اصلی داره: reasoning (استدلال)، tool use (استفاده از ابزار)، coding (برنامهنویسی) و knowledge work (کارهای دانشمحور).
برای خیلی از توسعهدهندهها، دوران agentic AI با مدلهای Sonnet شروع شد. Claude Sonnet 3.5، 3.6 و 3.7 اولین مدلهایی بودن که توانایی چشمگیری در کدنویسی و استفاده از ابزار نشون دادن. اما اخیراً پیشرفتهای واضحتر در مدلهای Opus دیده شده بود. Sonnet 5 این شکاف رو کم میکنه عملکردش نزدیک Opus 4.8 هست، ولی با قیمت پایینتر.
مقایسهی بنچمارک Sonnet 5 با نسل قبل
جدول زیر عملکرد Sonnet 5 رو در ارزیابیهای مختلف نشون میده. اعداد بهوضوح میگن که Sonnet 5 نسبت به Sonnet 4.6 ارتقای جدیای بوده و در خیلی از زمینهها به Opus 4.8 نزدیک شده:

همونطور که میبینی، Sonnet 5 در تموم زمینهها از Sonnet 4.6 بهتر عمل کرده و در بعضی موارد فاصلهاش با Opus 4.8 فقط چند درصد هست. این یعنی میتونی با بودجهی کمتر به کیفیت نزدیک Opus برسی.
مقایسهی عملکرد Sonnet 5 با Opus 4.8 و Sonnet 4.6
Claude Sonnet 5 در مقایسه با Sonnet 4.6 پیشرفت قابلملاحظهای داشته و دامنهی وسیعتری از گزینههای cost-performance نسبت به نسل قبل ارائه میده. در نمودارهای زیر میتونی ببینی که Sonnet 5 (خط نارنجی) در تمام سطوح effort بهتر از Sonnet 4.6 (خط خاکستری) عمل میکنه و در بعضی موارد به Opus 4.8 (خط زرد) میرسه.

نتایج BrowseComp: جستجوی agentic
BrowseComp یه ارزیابی مهم برای اندازهگیری توانایی جستجوی خودکار و استفاده از مرورگر توسط مدلهای هوش مصنوعیه. Sonnet 5 در این آزمون ۶۸٪ امتیاز گرفته که نسبت به ۵۲٪ Sonnet 4.6 یه جهش بزرگه. Opus 4.8 با ۷۲٪ هنوز جلوتره، ولی فاصله کمه.
نتایج OSWorld-Verified: استفاده از کامپیوتر
OSWorld-Verified ارزیابی میکنه که یه مدل چقدر میتونه وظایف واقعی روی سیستمعامل انجام بده مثل باز کردن فایل، اجرای دستور و کار با رابط گرافیکی. Sonnet 5 اینجا ۵۹٪ امتیاز گرفته، در حالی که Sonnet 4.6 فقط ۴۱٪ بود. این یعنی تقریباً ۱۸ درصد بهبود عدد جدی برای پروژههای automation.
نکتهی مهم اینه که بین Sonnet 5 و Opus 4.8 میتونی سطح effort رو تنظیم کنی تا تعادل مناسب بین هزینه و عملکرد رو پیدا کنی. Sonnet 5 در سطح medium effort بهشدت cost-efficient هست و در سطوح بالاتر میتونه تواناییهای Opus 4.8 رو در بعضی وظایف همتراز کنه.
قیمتگذاری و در دسترس بودن Claude Sonnet 5
Claude Sonnet 5 از امروز در تمام پلنهای Claude در دسترس هست: پلن Free و Pro، Max، Team و Enterprise همه میتونن ازش استفاده کنن. این مدل همچنین در Claude Code و Claude Platform هم فعال شده. اگه از طریق Claude API استفاده میکنی، باید از نام claude-sonnet-5 استفاده کنی.
قیمت معرفی (تا ۳۱ اوت ۲۰۲۶)
تا ۳۱ اوت ۲۰۲۶، قیمت معرفی Sonnet 5 اینجوریه:
- ۲ دلار به ازای میلیون توکن ورودی
- ۱۰ دلار به ازای میلیون توکن خروجی
این قیمتگذاری باعث میشه انتقال از Sonnet 4.6 به Sonnet 5 از نظر هزینه تقریباً خنثی باشه، چون Sonnet 5 از tokenizer بهروزشدهای استفاده میکنه که ممکنه همون متن رو به ۱ تا ۱.۳۵ برابر توکن بیشتر تبدیل کنه.
قیمت استاندارد (بعد از ۳۱ اوت ۲۰۲۶)
بعد از اوت ۲۰۲۶، قیمت استاندارد به این شکل میشه:
- ۳ دلار به ازای میلیون توکن ورودی
- ۱۵ دلار به ازای میلیون توکن خروجی
با این قیمت، Sonnet 5 همچنان گزینهای اقتصادیتر از Opus 4.8 هست که ۵ دلار ورودی و ۲۵ دلار خروجی میخواد.
🎯 اشتراک Claude Pro رو از کادینر بگیر!
اکانت اختصاصی و قانونی روی ایمیل خودت، تحویل زیر ۳۰ دقیقه و گارانتی تا پایان اشتراک بدون دردسر.
🛡 گارانتی تا پایان اشتراک
💬 پشتیبانی فارسی
افزایش محدودیتهای استفاده
Anthropic محدودیتهای rate limit رو در Chat، Cowork، Claude Code و Claude Platform افزایش داده تا از مصرف بالاتر توکن در سطوح effort بالاتر پشتیبانی کنه. یعنی میتونی سطح effort رو برای هر پروژه بهشکلی تنظیم کنی که مناسبترین تعادل هزینه و کارایی رو بهت بده.
ارزیابیهای امنیتی و رفتار مدل Sonnet 5
ارزیابیهای امنیتی پیش از راهاندازی نشون میدن که Claude Sonnet 5 در مجموع ایمنتر از Sonnet 4.6 هست. این مدل نرخ کلی رفتارهای نامطلوب رو کاهش داده و در محیطهای agentic قابلاعتمادتره. مقاومت بهتر در برابر prompt injection و درخواستهای مخرب، کاهش نرخ hallucination (توهم) و sycophancy (چاپلوسی) از جمله بهبودهای کلیدی هستن.
نتایج automated behavioral audit
در آزمون خودکار رفتاری که طیف گستردهای از رفتارهای نامطلوب مثل همکاری با سوءاستفاده و فریب رو بررسی میکنه، Sonnet 5 امتیاز کلی پایینتری (یعنی ایمنتر) نسبت به Sonnet 4.6 گرفته. البته باید اضافه کنم که این مدل هنوز نرخ بالاتری از رفتار نامطلوب نسبت به Opus 4.8 و Claude Mythos Preview داره.
نمودار زیر نرخ رفتار نامطلوب در مدلهای مختلف Claude رو نشون میده:
| مدل | نرخ رفتار نامطلوب |
|---|---|
| Sonnet 4.6 | ۱۸٪ |
| Claude Sonnet 5 | ۱۴٪ |
| Opus 4.8 | ۱۰٪ |
| Mythos Preview | ۸٪ |
این اعداد میگن که Sonnet 5 پیشرفت خوبی نسبت به نسل قبل داشته، ولی برای کارهای حساستر هنوز Opus 4.8 بهترین گزینهست.
بهبود در مقابله با prompt injection
یکی از نگرانیهای اصلی در استفاده از مدلهای agentic، آسیبپذیری در برابر حملات prompt injection هست یعنی زمانی که یک کاربر مخرب سعی میکنه با دستورهای خاص، مدل رو بفریبه و کاری انجام بده که نباید.
Claude Sonnet 5 نرخ موفقیت در رد این نوع درخواستهای مخرب رو نسبت به Sonnet 4.6 افزایش داده. این یعنی اگه مدل رو در محیط production استفاده میکنی و کاربران خارجی باهاش تعامل دارن، ریسک امنیتی کمتری داری.
قابلیتهای سایبری و محدودیتهای امنیتی Sonnet 5
یه نکتهی جالب دربارهی Claude Sonnet 5 اینه که Anthropic عمداً این مدل رو روی وظایف سایبری (cybersecurity) آموزش نداده. این تصمیم استراتژیک باعث شده که Sonnet 5 در توسعهی software exploits و حملات سایبری عملکرد پایینتری نسبت به Opus 4.8 و Mythos 5 داشته باشه.
ارزیابی توسعهی exploits در Firefox 147
برای آزمون قابلیتهای سایبری مدلها، Anthropic با Mozilla همکاری کرد و مدلها رو در توسعهی exploits برای آسیبپذیریهای شناختهشده در Firefox 147 آزمایش کرد (همهی آسیبپذیریها در Firefox 148 پچ شدن). نتایج اینجوری بود:
| مدل | موفقیت کامل (exploit کامل) | موفقیت جزئی |
|---|---|---|
| Sonnet 4.6 | ۰٪ | ۱۲٪ |
| Claude Sonnet 5 | ۰٪ | ۱۸٪ |
| Opus 4.8 | ۲۳٪ | ۴۱٪ |
| Mythos 5 | ۲۸٪ | ۴۷٪ |
همونطور که میبینی، هیچکدوم از مدلهای Sonnet نتونستن یه exploit کامل بسازن، ولی Sonnet 5 نرخ موفقیت جزئی بالاتری نسبت به Sonnet 4.6 داره. این بهبود احتمالاً ناشی از افزایش هوش کلی مدل هست، نه آموزش خاص روی سایبر.
فعالسازی cyber safeguards بهصورت پیشفرض
چون Sonnet 5 نسبت به نسل قبل در وظایف سایبری کمی قویتر شده، Anthropic این مدل رو با cyber safeguards فعال بهصورت پیشفرض راهاندازی کرده. این محافظها همونهایی هستن که در Opus 4.7 و 4.8 استفاده شدن و بهصورت real-time استفادههای خطرناک سایبری رو شناسایی و مسدود میکنن.
البته باید بگم که چون سطح کلی ریسک سایبری Sonnet 5 پایین ارزیابی شده، این safeguardها کمتر سختگیرانهتر از اونایی هستن که در Fable 5 راهاندازی شدن که طیف وسیعتری از وظایف سایبری رو مسدود میکنن.
برنامهی Cyber Verification Program
Sonnet 5 بخشی از برنامهی Cyber Verification Program Anthropic هست. اگه سازمان شما قبلاً در این برنامه ثبتنام کرده، بهصورت خودکار همون دسترسی رو روی Sonnet 5 هم داری و نیازی به درخواست مجدد نیست.
این برنامه الان روی Claude Platform اصلی، Claude Platform روی AWS و Claude در Microsoft Foundry (هاستشده روی Azure و Anthropic) فعاله و بهزودی روی Claude در Google Vertex هم میآد.
برای کارهای سایبری حرفهای که نیاز به کاهش محدودیتها دارن، Anthropic هنوز Opus 4.8 رو توصیه میکنه.
بازخورد کاربران و کاربردهای عملی Sonnet 5
بازخورد کاربران اولیه که به Claude Sonnet 5 دسترسی زودهنگام داشتن، ثابت و روشن بوده: این مدل خیلی agenticتر از نسلهای قبلش هست. چند نمونه از تجربیات واقعی:
تکمیل وظایف پیچیده
کاربران گفتن که Sonnet 5 وظایف پیچیدهای رو که مدلهای قبلی ناتمام میذاشتن، بهطور کامل انجام میده. مثلاً یه توسعهدهنده گفته که Sonnet 4.6 در نصف راه یه اسکریپت پیچیده میایستاد و میگفت «این کار انجام شد»، در حالی که واقعاً انجام نشده بود. Sonnet 5 همون وظیفه رو تا آخر دنبال کرد و تمومش کرد.
بررسی خودکار خروجی
یکی دیگه از ویژگیهای جالبی که کاربران گزارش دادن، اینه که Sonnet 5 بدون اینکه ازش درخواست صریح بشه، خودش خروجیاش رو چک میکنه. مثلاً بعد از نوشتن یه کد، قبل از اینکه به کاربر نشون بده، اون رو اجرا میکنه و اگه خطایی بود، خودش اصلاحش میکنه.
این رفتار نشوندهندهی قابلیتهای agentic بالاترهمدل فقط دستور رو اجرا نمیکنه، بلکه نتیجه رو هم ارزیابی میکنه.
بهبود cost efficiency در سطح medium effort
توسعهدهندهها گفتن که برای کارهایی که نیاز به کیفیت خوب ولی نه لزوماً بالاترین سطح دارن، Sonnet 5 در سطح medium effort بهترین تعادل هزینه و کارایی رو ارائه میده. این برای استارتاپها و تیمهایی که بودجهی محدود دارن، اهمیت زیاد داره.
افزایش rate limits برای سطوح بالاتر
یکی از نگرانیهای قبلی، محدودیتهای استفاده بود. Anthropic این محدودیتها رو برای Sonnet 5 افزایش داده تا کاربران بتونن از سطوح effort بالاتر بدون نگرانی از رسیدن به سقف استفاده کنن.
سؤالات متداول
آیا Sonnet 5 میتونه جایگزین Opus 4.8 بشه؟
بستگی به نوع کارت داره. اگه بودجه محدود داری و کیفیت خوب (نه لزوماً بهترین) کافیه، Sonnet 5 میتونه جایگزین خوبی باشه. ولی برای کارهای حساس، پیچیده یا سایبری، Opus 4.8 هنوز بهترین گزینهست.
Sonnet 5 برای چه نوع پروژههایی مناسبه؟
Sonnet 5 برای پروژههای agentic مثل automation، جستجوی خودکار، کدنویسی، استفاده از computer use API و وظایف دانشمحوری که نیاز به reasoning دارن، مناسبه. اگه میخوای یه ربات بسازی که بتونه خودش وظایف رو برنامهریزی و اجرا کنه، Sonnet 5 یه گزینهی قوی و اقتصادیه.
تفاوت Sonnet 5 با ChatGPT چیه؟
این دو مدل از خانوادههای متفاوتی هستن. ChatGPT از OpenAI و جدیدترین نسخهاش GPT-5.5 هست، در حالی که Sonnet 5 از خانوادهی Claude ساختهی Anthropic. Sonnet 5 تمرکزش بیشتر روی قابلیتهای agentic و استفاده از ابزار هست، در حالی که GPT-5.5 طیف گستردهتری از کاربردهای عمومی رو پوشش میده.
آیا کادینر اشتراک Claude Sonnet 5 میفروشه؟
کادینر اشتراک Claude Pro رو میفروشه که به جدیدترین مدلهای خانوادهی Claude (از جمله Sonnet 5) دسترسی داره. اکانتها اختصاصی و قانونی هستن و روی ایمیل شخصی خودت شارژ میشن. قیمت بهروز و جزئیات بیشتر رو میتونی در صفحهی محصول ببینی.
توکنایزر جدید Sonnet 5 چه تأثیری روی هزینه داره؟
Sonnet 5 از توکنایزر بهروزشدهای استفاده میکنه که همون متن رو به ۱ تا ۱.۳۵ برابر توکن بیشتری نسبت به نسل قبل تبدیل میکنه. ولی قیمت معرفی (۲ دلار ورودی و ۱۰ دلار خروجی تا اوت ۲۰۲۶) طوری تنظیم شده که انتقال از Sonnet 4.6 به Sonnet 5 تقریباً بدون تغییر هزینه باشه.
منابع
- Anthropic: Introducing Claude Sonnet 5 (ژوئن 2026)
- Claude Sonnet 5 System Card (ژوئن 2026)
- خرید اشتراک Claude Pro از کادینر
Claude Sonnet 5 یه پیشرفت قابلتوجه در خانوادهی Sonnet محسوب میشه و فاصلهی عملکردی با Opus رو بهشدت کم کرده. اگه به دنبال یه مدل agentic با هزینهی منطقی برای پروژههای خودکارسازی، کدنویسی یا کارهای دانشمحور هستی، Sonnet 5 انتخاب درستیه.
البته برای کارهای حساستر و سایبری هنوز Opus 4.8 رو توصیه میکنم. در هر صورت، این مدل نشون میده که مرز بین مدلهای میانرده و مدلهای پیشرفته داره محو میشهو این برای توسعهدهندهها خبر خوبیه.