برای ارائه تجربهای پایدار و منصفانه، درخواستهای API بر اساس مدل انتخابی شما، وضعیت حساب و کنترلهای سراسری محدود میشود. در این صفحه، نحوه محاسبه، هدرهای مرتبط و راهکارهای عبور از محدودیتها را توضیح میدهیم.
مرور کلی
نرخ درخواستها بهصورت درخواست در دقیقه (RPM) و درخواست در روز (RPD) اعمال میشود. مقادیر دقیق برای مدلهای رایگان بر اساس مجموع شارژ شما تغییر میکند و برای مدلهای پولی ثابت و بالا است.
سطوح مدلهای رایگان
راهیانا بر اساس مجموع شارژ حساب شما سطح دسترسی تعیین میکند. هر چه شارژ بیشتری داشته باشید، محدودیتهای بالاتری دریافت میکنید. برای مشاهده مجموع شارژ و مدیریت مصرف به صفحه مصرف مراجعه کنید.
سطح | مجموع شارژ (تومان) | RPM | RPD |
---|---|---|---|
سطح ۱ | ۰ تا ۱۰۰,۰۰۰ | ۲۰ | ۵۰۰ |
سطح ۲ | ۱۰۰,۰۰۰ تا ۱۰,۰۰۰,۰۰۰ | ۱۰۰ | ۲,۰۰۰ |
سطح ۳ | ۱۰,۰۰۰,۰۰۰ به بالا | ۵۰۰ | ۱۰,۰۰۰ |
مدلهای پولی
برای مدلهای پولی محدودیتها ثابت و بالا هستند:
این مقادیر در کد بهصورت ثابت تعریف شدهاند و پاسخگوی بارهای سنگین هستند.
کنترلهای سراسری و IP
علاوه بر محدودیتهای کاربری، کنترلهای سراسری در سطح هر مسیر و محدودیت مبتنیبر IP برای جلوگیری از سوءاستفاده اعمال میشود.
X-RateLimit-*
اعلان میشود.مقادیر پیشفرض سراسری و IP از طریق متغیرهای محیطی مانند GLOBAL_RPM_CHAT_COMPLETIONS
و IP_RATE_LIMIT_RPM
قابل تنظیم هستند.
هدرهای نرخ درخواست
پاسخهای API در صورت فعال بودن محدودیتهای سراسری یا IP هدرهای زیر را بازمیگردانند:
هدر | نوع | توضیحات |
---|---|---|
X-RateLimit-Limit | number | حداکثر درخواست مجاز در بازه فعلی |
X-RateLimit-Remaining | number | تعداد درخواستهای باقیمانده در بازه |
X-RateLimit-Reset | unix timestamp (seconds) | زمان ریست پنجره (UTC) |
X-RateLimit-IP-Limit | number | حداکثر درخواست مجاز برای IP در دقیقه (در صورت اعمال) |
X-RateLimit-IP-Remaining | number | درخواستهای باقیمانده برای IP |
X-RateLimit-IP-Reset | unix timestamp (seconds) | زمان ریست پنجره IP |
اگر از محدودیت عبور کنید، پاسخ با وضعیت 429 برمیگردد. توصیه میشود از الگوریتمهای backoff نمایی و صفبندی استفاده کنید.
پیشنهادها و بهترین شیوهها
خطاهای متداول
429 Too Many Requests: از محدودیت عبور کردهاید. پس از زمان X-RateLimit-Reset
دوباره تلاش کنید یا نرخ ارسال را کاهش دهید.
rate_limit_error (بدنه JSON): پیام خطا شامل علت (مثلاً ip_rate_limit یا global limit) خواهد بود.