Своя языковая модель для Узбекистана.
Узбекский язык + AI-агенты + дешёвый inference.
| Страна | Проект | Статус |
|---|---|---|
| Казахстан | KAZ-LLM (8B+70B) | Выпущен |
| Турция | Kumru AI (14B) | Выпущен |
| ОАЭ | Falcon (7B–180B) | Выпущен |
| Сауд. Аравия | ALLaM (34B) | Выпущен |
| Узбекистан | — | Нет LLM |
Вместо одной модели — используем две под разные задачи
Qwen3 — единственная open-source модель с нативной поддержкой узбекского языка. 36 триллионов токенов обучающих данных.
Полная свобода: любое название, коммерческое использование, модификации. Идеально для «национальной LLM».
14B параметров = 8 GB VRAM (INT4). Один RTX 4090 ($1,600) обслуживает 30–60 пользователей.
| Критерий | Qwen3 | Llama 4 | Gemma 3 |
|---|---|---|---|
| Узбекский | Да | Слабо | Средне |
| Лицензия | Apache 2.0 | Community | Gemma ToU |
| 14B вариант | Да | Нет | Нет |
| Обуч. данные | 36T | 15T | ~14T |
| QLoRA VRAM | 10–16 GB | 10–16 GB | 8–12 GB |
| Контекст | 128K | 128K | 128K |
| Метод | VRAM | Цена |
|---|---|---|
| QLoRA | 10–16 GB | $10–50 |
| LoRA | 24–48 GB | $50–200 |
| Full fine-tune | ~200 GB | $2,000–5,000 |
Полная экосистема: от LLM до клиентского продукта
Fine-tuning под конкретную индустрию: банковский узбекский, медицинский, юридический, e-gov.
GPU-серверы в Ташкенте. Data sovereignty. Low latency для CIS-региона.
Помогаем компаниям просчитать ROI от внедрения AI: стоимость токенов, модель ценообразования, маржинальность.
Разворачиваем AI-агентов из исходников. Клиент контролирует каждый шаг через Claude Code в терминале.
| GPU | Покупка | Аренда/ч | Юзеров |
|---|---|---|---|
| RTX 4090 | $1.6–2K | $0.34–0.44 | 30–60 |
| L40S | $7–10K | $0.59–1.24 | 50–100 |
| A100 80GB | $10–15K | $0.67–2.06 | 80–150 |
| H100 SXM | $27–40K | $1.99–6.16 | 150–300 |
| Тариф | Модель | $/1M токенов |
|---|---|---|
| Economy | MILA-LLM-4B | $0.05 |
| Standard | MILA-LLM-14B | $0.30–0.50 |
| Agent | MiniMax M2.5 | $0.30 / $2.40 |
| Premium | 14B + RAG | $1.00 |
Вместе строим AI-инфраструктуру Узбекистана