Сколько я должен использовать генераций в месяц, чтобы Enterprise был выгоден?

Минимум 50K генераций/месяц. Ниже этого Professional будет дешевле.

Сколько времени занимает onboarding на Enterprise?

Обычно 2–4 недели (включая переговоры, подписание контракта, настройку инстанса).

Могу ли я переехать с Professional на Enterprise без потери данных?

Да. Мы мигрируем вашу историю проектов на новый инстанс.

Что если мой трафик варьируется (в пиках 500K генераций, в низы 50K)?

Enterprise лучше для вариативного трафика. Вы платите за базовый объем, но можете обрабатывать пики без проблем.

Как выглядит SLA для 99.99%?

Максимум 52 минуты downtime в год = в среднем < 5 минут в месяц. Это очень высокий уровень.

AI Дизайн API Платформа

Enterprise API Quotas: масштабируем Vision AI на 1M+ генераций в месяц

13 апреля 2026 г. 6 мин чтения

Вы маркетплейс мебели на 100K продавцов. Каждый день 500 новых товаров. Каждый товар = минимум 3 lifestyle-фото через AI. Нужно 1,500 генераций в день = 45K генераций в месяц. Решение: Enterprise API с неограниченными quotas, в...

Сегодня в блоге Vision AI разбираем enterprise API Quotas: масштабируем Vision AI на 1M+ генераций в месяц. Это практический разбор с примерами — материал основан на нашем опыте работы с реальными клиентами и анализе того, как нейросеть обрабатывает похожие задачи. Вы узнаете не только что мы делаем в Vision AI, но и какие технические или дизайнерские решения стоят за этим. Дата публикации: 13.04.2026. Этот пост — часть нашей миссии сделать AI-дизайн интерьера понятным и доступным каждому.

Вы маркетплейс мебели на 100K продавцов. Каждый день 500 новых товаров. Каждый товар = минимум 3 lifestyle-фото через AI. Нужно 1,500 генераций в день = 45K генераций в месяц.

Vision AI Professional план = максимум 10K в месяц.

Проблема: лимит исчерпывается за неделю.

Решение: Enterprise API с неограниченными quotas, выделенной инфраструктурой и SLA гарантиями.

Обзор планов и quotas

Сравнение планов

Параметр	Starter	Professional	Enterprise
Генераций/месяц	100	10,000	Неограниченно
Изображений на генерацию	1–3	1–5	1–10
API calls/sec	1	10	100+
Priority queue	Стандартная	Стандартная	Приоритетная
Uptime SLA	Нет	99.5%	99.99%
Support	Email	Email (24ч)	Телефон 24/7
Выделенный account manager	Нет	Нет	Да
Цена	3K ₽/мес	50K ₽/мес	Custom

Quota система

Каждый API запрос потребляет определенное количество "quota units":

``` Simple project (1 image, 1 variant) = 1 unit Complex project (3 images, 5 variants each) = 15 units

Starter план: 100 units/мес (≈ 100 простых проектов) Professional: 10K units/мес (≈ 10K простых или 666 сложных проектов) Enterprise: Custom quota (обычно 100K–1M units/мес) ```

Пример расхода для маркетплейса:

``` Объем: 500 товаров в день

Каждый товар:

1 изображение товара
3 lifestyle-варианта

Расход: 500 × 3 = 1,500 генераций/день = 45K/месяц

На Professional (10K/мес): не хватит На Enterprise (100K+/мес): достаточно ```

Rate limiting и как его обойти

Что такое rate limit

Rate limit = максимальное количество запросов в секунду, которое вы можете отправить.

``` Starter: 1 запрос/сек Professional: 10 запросов/сек = 600 запросов/минуту = 36K/час Enterprise: 100+ запросов/сек ```

Когда вы попадаете в лимит

``` Вы отправляете 15 запросов/сек на Professional (лимит 10) ↓ Vision AI возвращает ошибку 429 "Too Many Requests" ↓ Вы должны подождать и повторить (exponential backoff) ↓ Общее время обработки растет на 50–100% ```

Как оптимизировать

Вариант 1: Batch processing

Вместо отправления 1000 запросов одновременно, отправьте их волнами:

```python import time from tenacity import retry, stop_after_attempt, wait_exponential

@retry(stop=stop_after_attempt(3), wait=wait_exponential()) def generate_with_retry(product_id, image_url): response = api.generate( image_url=image_url, quantity=3 ) return response

# Batch processing с задержками for i, product in enumerate(products): if i > 0 and i % 10 == 0: time.sleep(1) # Пауза каждые 10 запросов

generate_with_retry(product.id, product.image_url) ```

Вариант 2: Асинхронная обработка

```javascript // Node.js с Promise.all, но с ограничением параллельных запросов const pLimit = require('p-limit'); const limit = pLimit(8); // Максимум 8 одновременных запросов

const promises = products.map(product => limit(() => api.generate({ image_url: product.image_url, quantity: 3 })) );

const results = await Promise.all(promises); ```

Вариант 3: Queue система

Используйте message queue (RabbitMQ, Redis) для очередности:

``` [Product 1] ──┐ [Product 2] ──┤ [Product 3] ──┼→ [Queue] → [Vision AI API] (1–10 реквестов/сек) [Product N] ──┤ → [Results storage] ```

Выделенная инфраструктура для Enterprise

Что означает "выделенная инфраструктура"

Standard (Starter/Professional):

Общий сервер с другими клиентами
Ресурсы распределяются динамически
Могут быть spike и задержки

Enterprise (выделенный):

Ваш собственный экземпляр Vision AI API
Гарантированные ресурсы (CPU, RAM, GPU)
Изолированная база данных
Приоритет в очереди обработки

Создайте дизайн интерьера за минуты

Загрузите фото комнаты и получите профессиональную 3D-визуализацию с помощью AI — без дизайнера и долгого ожидания.

Попробовать бесплатно

Архитектура Enterprise

``` [Your API requests] ↓ [Dedicated Vision AI Instance]

8 vCPU
32 GB RAM
2x GPU (NVIDIA A100)

↓ [Your Dedicated Database]

PostgreSQL
500 GB SSD

↓ [Backup & Monitoring]

Daily backups
24/7 monitoring

```

Преимущества выделенного инстанса

✅ Гарантированная скорость — нет очередей, нет соседей ✅ Пиковые нагрузки — обработайте 100 запросов/сек без проблем ✅ Приватность — ваши данные физически отделены ✅ Customization — можно настроить под ваши требования

SLA и гарантии

Service Level Agreement (SLA)

Vision AI Enterprise гарантирует:

``` ✅ 99.99% uptime (максимум 52 минуты downtime в год) ✅ 99th percentile latency < 2 sec (генерация) ✅ Support response time < 1 hour (для critical issues) ✅ Deduplicated backups (1 раз в 6 часов) ```

Что если SLA нарушена?

``` SLA Credit:

99.0–99.9% uptime: 10% скидка на счет
95.0–99.0% uptime: 25% скидка
< 95% uptime: 100% скидка + переговоры

Минимум: 100 ₽ кредита на счет Максимум: до 30% счета за месяц ```

Расчет стоимости

Модель pricing для Enterprise

Vision AI не публикует готовые цены на Enterprise (потому что они очень кастомные).

Типичная структура:

``` Базовая плата: 500K–2M ₽/месяц + За каждые 100K генераций: 200K ₽/месяц

Пример для маркетплейса (500 товаров × 3 генерации = 45K/месяц):

Базовая плата: 500K ₽
API использование: 0 дополнительно (45K < 100K)
ИТОГО: 500K ₽/месяц

Пример для крупной платформы (1M генераций/месяц):

Базовая плата: 2M ₽
За 1M генераций (10 × 100K): 10 × 200K = 2M ₽
ИТОГО: 4M ₽/месяц

```

ROI для Enterprise

``` Платформа с маркетплейсом мебели:

100K продавцов
500 товаров/день = 182.5K товаров/год
Каждый товар = 3 генерации (lifestyle-фото)
ИТОГО: 547.5K генераций/год = 45.6K/месяц

Вариант 1: Рекомендовать клиентам Vision AI

Клиенты платят Vision AI напрямую
Платформа не получает дополнительный доход
Потеря возможности монетизации: −500K–1M ₽/год

Вариант 2: Enterprise Vision AI

Стоимость: 500K ₽/месяц = 6M ₽/год
Монетизация: 100 ₽ за генерацию × 45.6K = 4.56M ₽/год
Прибыль: 4.56M − 6M = −1.44M ₽ (убыток)

Вариант 3: Enterprise + повышенная цена

Новая цена: 250 ₽/генерацию (vs 100 ₽ конкурентов)
Доход: 250 × 45.6K = 11.4M ₽/год
Прибыль: 11.4M − 6M = 5.4M ₽/год (огромная прибыль!)

Вывод: Enterprise окупается при 250+ ₽ за генерацию ```

Оптимизация для больших объемов

1. Кеширование результатов

```python # Кешируйте идентичные запросы cache = {}

def generate_cached(image_url, style='modern'): cache_key = f"{image_url}_{style}"

if cache_key in cache: return cache[cache_key] # Из кеша

result = api.generate(image_url, style) cache[cache_key] = result

return result

# Экономия: если 30% запросов идентичны, сэкономите 30% API quota ```

2. Compress & Optimize images

```python from PIL import Image

def optimize_image(image_path, max_size=2000): img = Image.open(image_path) img.thumbnail((max_size, max_size), Image.Resampling.LANCZOS) img.save(image_path, quality=85, optimize=True) # Уменьшенное фото → быстрее обрабатывается, меньше API cost ```

3. Batch by similarity

```python # Группируйте похожие объекты furniture_items = { 'sofas': [...], # 500 диванов 'chairs': [...], # 300 стульев 'tables': [...] # 200 столов }

# Генерируйте один раз для типичного примера sofa_example = api.generate(sofas[0].image) # Потом переиспользуйте для похожих товаров (кеширование) ```

Кейсы Enterprise

Кейс: Маркетплейс "МебельMart" (1M товаров)

Ситуация:

Маркетплейс мебели с 10K продавцов
1M товаров в каталоге
50K новых товаров/месяц
Нужны lifestyle-фото для каждого (3 варианта)

Решение:

Enterprise Vision AI (выделенный инстанс)
Batch processing: 150K генераций/месяц
Цена: 1.5M ₽/месяц

Монетизация:

Продавцы платят: 100 ₽/генерацию
Доход: 150K × 100 ₽ = 15M ₽/месяц
Прибыль: 15M − 1.5M = 13.5M ₽/месяц

Результат:

ROI: окупается за 1 неделю
Товары с lifestyle-фото: +45% конверсия
Увеличение продаж в маркетплейсе: +35%