Ornith AI: самоулучшающиеся модели для agentic coding
Практический гид по семейству Ornith 1.0 от DeepReinforce AI.
Изучите модели кода с self-scaffolding, бенчмарки, выбор железа и локальные варианты запуска.
Сравните варианты 9B, 31B, 35B MoE и 397B MoE перед выбором локальной или production-конфигурации.
Ключевые данные Ornith AI
Главное из текущего гида Ornith 1.0.
Релиз
Jun 25
2026
Размеры моделей
9B-397B
Dense + MoE
Контекст
262K
tokens
SWE-Bench
82.4
Verified
Что такое Ornith AI?
Ornith AI посвящен Ornith 1.0, семейству open-source LLM для agentic coding на уровне репозитория. Модели учатся не только писать код, но и строить рабочий scaffold: планирование, использование инструментов, повторы и проверку.
- Агенты с self-scaffoldingOrnith учит планы задач, tool calls, восстановление после ошибок и code patches в одном reinforcement learning цикле.
- Открытое семейство моделейВыбирайте между 9B Dense, 31B Dense, 35B MoE и 397B MoE под лицензией MIT.
- Для coding workflowПодходит для terminal-native агентов, multi-file refactoring, поиска bugs, test-driven patches и offline assistants.
Как работает Ornith AI
Структура гида помогает понять идею обучения, сравнить бенчмарки и выбрать модель под ваше железо.



Данные моделей
Спецификации Ornith 1.0
Размер, архитектура, базовая модель, VRAM и сценарии на основе Ornith model guide.
Ornith-1.0-9B
9B Dense на Qwen 3.5 для низкой VRAM и быстрого triage кода.
- Архитектура
- Dense
- Все параметры активны при inference
- VRAM
- ~19GB bf16 / ~6GB Q4
- Q4 подходит для начальных локальных setup
- Контекст
- 262K tokens
- Достаточно для широкого контекста репозитория
- Лучше для
- Edge / Offline
- Приватный кодинг, triage и легкие агенты
Ornith-1.0-31B
31B Dense на Gemma 4 для команд, которым нужна стабильность dense-модели.
- Архитектура
- Dense
- Стабильное поведение с большим потреблением ресурсов
- VRAM
- ~62GB bf16 / ~20GB Q4
- GPU класса 80GB или quantized deployment
- Контекст
- 262K tokens
- Coding tasks с длинным контекстом
- Лучше для
- Баланс
- Качество и скорость без MoE routing
Ornith-1.0-35B MoE
35B MoE примерно с 3B активных параметров на token, рекомендован большинству локальных разработчиков.
- Архитектура
- MoE
- Больше общего знания при меньших активных вычислениях
- VRAM
- ~25GB Q5_K_M
- Практично для одной GPU 24GB+
- Скорость
- Быстрее 9B dense
- MoE снижает compute на token
- Лучше для
- Best Value
- Локальные агенты, refactors, ежедневный coding
Ornith-1.0-397B MoE
397B MoE для максимальной точности в production agent pipelines.
- Архитектура
- MoE
- Основан на Qwen 3.5 397B
- VRAM
- ~200GB FP8 / ~400GB bf16
- Обычно 8x GPUs по 80GB
- Лучший score
- 82.4 SWE-Bench
- Verified benchmark
- Лучше для
- Production
- Высокоточные автономные coding systems
35B MoE — рекомендуемый sweet spot для большинства локальных разработчиков; 397B предназначен для production agent pipelines.
Данные benchmark
Бенчмарки Ornith 1.0
Сравнение Terminal-Bench, SWE-Bench, NL2Repo и ClawEval для 397B и меньших локальных моделей.
397B против frontier models
Ornith-1.0-397B в сравнении со scores Qwen, GLM, DeepSeek и Claude Opus.
| Бенчмарк | Ornith 397B | Qwen 3.5 | Qwen 3.7 | GLM 5.2 | DeepSeek V4 | Opus 4.7 | Opus 4.8 |
|---|---|---|---|---|---|---|---|
| Terminal-Bench 2.1 | 77.5 | 53.5 | 73.5 | 81.0 | 64 | 70.3 | 85 |
| SWE-Bench Verified | 82.4 | 76.4 | 80.4 | - | 80.6 | 80.8 | 87.6 |
| SWE-Bench Pro | 62.2 | 51.6 | 60.6 | 62.1 | 55.4 | 64.3 | 69.2 |
| SWE-Bench Multilingual | 78.9 | 69.3 | 78.3 | - | 76.2 | - | - |
| NL2Repo | 48.2 | 36.8 | 47.2 | 48.9 | - | - | 69.7 |
| ClawEval Avg | 77.1 | 70.7 | 65.2 | - | 75.8 | 78.2 | - |
Сравнение малых моделей
Результаты 9B и 35B MoE против близких по размеру baselines Qwen и Gemma.
| Бенчмарк | Ornith 9B | Ornith 35B | Qwen 3.5 9B | Qwen 3.5 35B | Gemma 12B | Gemma 31B |
|---|---|---|---|---|---|---|
| Terminal-Bench 2.1 | 43.1 | 64.2 | 21.3 | 41.4 | 21 | 42.1 |
| SWE-Bench Verified | 69.4 | 75.6 | 53.2 | 70 | 44.2 | 52 |
| SWE-Bench Pro | 42.9 | 44.6 | 31.3 | 44.6 | 27.6 | 35.7 |
| SWE-Bench Multilingual | 52 | 60.3 | 39.7 | 60.3 | 32.5 | 51.7 |
| NL2Repo | 27.2 | 20.5 | 16.2 | 20.5 | 10.3 | 15.5 |
| ClawEval Avg | 63.1 | 65.4 | 53.2 | 65.4 | 32.5 | 48.5 |
Примечание: scores взяты из официальной оценки DeepReinforce; перед production проверьте на своих задачах.
Локальный запуск
Данные runtime и deployment
Заметки по serving и интеграции для vLLM, Ollama, LM Studio, SGLang, llama.cpp и OpenAI-compatible coding agents.
vLLM
OpenAI-compatible serving для production deployments с prefix caching, tool parsing и reasoning parsing.
- Port
- 8000
- OpenAI /v1 endpoint
- Context
- 262144
- --max-model-len
- Tool calls
- qwen3_xml
- --enable-auto-tool-choice
- Reasoning
- qwen3
- поле reasoning_content
Ollama / LM Studio
Лучше для локальных проб и GUI workflow; используйте GGUF Q4_K_M или Q5_K_M quantization.
- Ollama
- hf.co/...-GGUF
- Скачать и запустить одной командой
- LM Studio
- Search Ornith-1.0
- Скачать и загрузить quantized weights
- 9B Q4
- ~6GB VRAM
- Вход для низкой VRAM
- 35B Q5
- ~25GB VRAM
- Рекомендованное локальное качество
SGLang / llama.cpp
SGLang полезен для MoE scheduling; llama.cpp — легкий C++ serving path.
- SGLang parser
- qwen3_coder
- Отличается от vLLM parser
- llama.cpp
- llama-server
- -c 262144
- Agents
- Claude Code / OpenHands
- Указать локальный OPENAI_BASE_URL
- API key
- EMPTY
- Placeholder для локальных сервисов
Заметка об оценке
Данные бенчмарков взяты из официальной оценки DeepReinforce; используйте их как сигнал выбора и перепроверьте перед production.
- Terminal-Bench
- среднее по 5 runs
- timeout 4h, 32 CPU, 48GB RAM
- SWE-Bench
- OpenHands
- контекст 256K
- NL2Repo
- 400K context
- вывод 48K
- ClawEval
- реальные пользовательские задачи
- 256K context
Сценарии Ornith AI и выбор моделей
Краткая карта применения Ornith AI в реальных developer workflow.
Рефакторинг репозитория
Планируйте и применяйте согласованные изменения во многих файлах с проверкой промежуточных результатов.
Локализация bugs
Ищите по codebase, сужайте вероятные причины и создавайте сфокусированные patches с тестами.
Terminal agents
Используйте для terminal-native coding agents со структурированными tool calls и recovery loops.
Приватный локальный кодинг
Запускайте меньшие варианты локально для offline assistance и приватности кода.
35B MoE как sweet spot
Используйте 35B MoE для баланса скорости, качества и стоимости железа.
397B для production
Используйте 397B MoE для максимальной точности в production agent pipelines.
FAQ Ornith AI
Короткие ответы о выборе модели, настройке и позиционировании.
Что такое Ornith AI?
Ornith AI — это гид вокруг Ornith 1.0, open-source семейства моделей agentic coding от DeepReinforce AI.
Чем Ornith отличается?
Ключевая идея — self-scaffolding: модель вместе учится планированию, использованию инструментов, восстановлению после ошибок и решению coding tasks.
Какую модель Ornith выбрать?
Для многих пользователей 35B MoE — практичная середина. 9B лучше для ограниченного железа, а 397B — для production agents с высокой точностью.
Можно ли запускать Ornith AI локально?
Да. Гид покрывает vLLM, Ollama, LM Studio, quantized weights и компромиссы VRAM для local/self-hosted сценариев.
Создавайте с Ornith AI
Начните с семейства моделей, сравните benchmark signals и выберите deployment path под ваше железо и workflow.