Ornith 1.0Семейство coding-моделей под лицензией MIT

Ornith AI: самоулучшающиеся модели для agentic coding

Практический гид по семейству Ornith 1.0 от DeepReinforce AI.
Изучите модели кода с self-scaffolding, бенчмарки, выбор железа и локальные варианты запуска.

Сравните варианты 9B, 31B, 35B MoE и 397B MoE перед выбором локальной или production-конфигурации.

Ornith 1.0

Ключевые данные Ornith AI

Главное из текущего гида Ornith 1.0.

Релиз

Jun 25

2026

Размеры моделей

9B-397B

Dense + MoE

Контекст

262K

tokens

SWE-Bench

82.4

Verified

Что такое Ornith AI?

Ornith AI посвящен Ornith 1.0, семейству open-source LLM для agentic coding на уровне репозитория. Модели учатся не только писать код, но и строить рабочий scaffold: планирование, использование инструментов, повторы и проверку.

  • Агенты с self-scaffolding
    Ornith учит планы задач, tool calls, восстановление после ошибок и code patches в одном reinforcement learning цикле.
  • Открытое семейство моделей
    Выбирайте между 9B Dense, 31B Dense, 35B MoE и 397B MoE под лицензией MIT.
  • Для coding workflow
    Подходит для terminal-native агентов, multi-file refactoring, поиска bugs, test-driven patches и offline assistants.
Цикл обучения

Как работает Ornith AI

Структура гида помогает понять идею обучения, сравнить бенчмарки и выбрать модель под ваше железо.

Модель одновременно оптимизирует стратегию оркестрации и финальный код, не полагаясь на фиксированный human-designed harness.

Совместное обучение scaffold и решения
Reasoning с вызовами инструментов
Защита от reward hacking

Данные моделей

Спецификации Ornith 1.0

Размер, архитектура, базовая модель, VRAM и сценарии на основе Ornith model guide.

Ornith-1.0-9B

9B Dense на Qwen 3.5 для низкой VRAM и быстрого triage кода.

Локальный старт
Архитектура
Dense
Все параметры активны при inference
VRAM
~19GB bf16 / ~6GB Q4
Q4 подходит для начальных локальных setup
Контекст
262K tokens
Достаточно для широкого контекста репозитория
Лучше для
Edge / Offline
Приватный кодинг, triage и легкие агенты

Ornith-1.0-31B

31B Dense на Gemma 4 для команд, которым нужна стабильность dense-модели.

Сбалансированный Dense
Архитектура
Dense
Стабильное поведение с большим потреблением ресурсов
VRAM
~62GB bf16 / ~20GB Q4
GPU класса 80GB или quantized deployment
Контекст
262K tokens
Coding tasks с длинным контекстом
Лучше для
Баланс
Качество и скорость без MoE routing

Ornith-1.0-35B MoE

35B MoE примерно с 3B активных параметров на token, рекомендован большинству локальных разработчиков.

Рекомендуется
Архитектура
MoE
Больше общего знания при меньших активных вычислениях
VRAM
~25GB Q5_K_M
Практично для одной GPU 24GB+
Скорость
Быстрее 9B dense
MoE снижает compute на token
Лучше для
Best Value
Локальные агенты, refactors, ежедневный coding

Ornith-1.0-397B MoE

397B MoE для максимальной точности в production agent pipelines.

Флагман
Архитектура
MoE
Основан на Qwen 3.5 397B
VRAM
~200GB FP8 / ~400GB bf16
Обычно 8x GPUs по 80GB
Лучший score
82.4 SWE-Bench
Verified benchmark
Лучше для
Production
Высокоточные автономные coding systems

35B MoE — рекомендуемый sweet spot для большинства локальных разработчиков; 397B предназначен для production agent pipelines.

Данные benchmark

Бенчмарки Ornith 1.0

Сравнение Terminal-Bench, SWE-Bench, NL2Repo и ClawEval для 397B и меньших локальных моделей.

397B против frontier models

Ornith-1.0-397B в сравнении со scores Qwen, GLM, DeepSeek и Claude Opus.

БенчмаркOrnith 397BQwen 3.5Qwen 3.7GLM 5.2DeepSeek V4Opus 4.7Opus 4.8
Terminal-Bench 2.177.553.573.581.06470.385
SWE-Bench Verified82.476.480.4-80.680.887.6
SWE-Bench Pro62.251.660.662.155.464.369.2
SWE-Bench Multilingual78.969.378.3-76.2--
NL2Repo48.236.847.248.9--69.7
ClawEval Avg77.170.765.2-75.878.2-

Сравнение малых моделей

Результаты 9B и 35B MoE против близких по размеру baselines Qwen и Gemma.

БенчмаркOrnith 9BOrnith 35BQwen 3.5 9BQwen 3.5 35BGemma 12BGemma 31B
Terminal-Bench 2.143.164.221.341.42142.1
SWE-Bench Verified69.475.653.27044.252
SWE-Bench Pro42.944.631.344.627.635.7
SWE-Bench Multilingual5260.339.760.332.551.7
NL2Repo27.220.516.220.510.315.5
ClawEval Avg63.165.453.265.432.548.5

Примечание: scores взяты из официальной оценки DeepReinforce; перед production проверьте на своих задачах.

Локальный запуск

Данные runtime и deployment

Заметки по serving и интеграции для vLLM, Ollama, LM Studio, SGLang, llama.cpp и OpenAI-compatible coding agents.

vLLM

OpenAI-compatible serving для production deployments с prefix caching, tool parsing и reasoning parsing.

Пропускная способность production
Port
8000
OpenAI /v1 endpoint
Context
262144
--max-model-len
Tool calls
qwen3_xml
--enable-auto-tool-choice
Reasoning
qwen3
поле reasoning_content

Ollama / LM Studio

Лучше для локальных проб и GUI workflow; используйте GGUF Q4_K_M или Q5_K_M quantization.

Самый быстрый setup
Ollama
hf.co/...-GGUF
Скачать и запустить одной командой
LM Studio
Search Ornith-1.0
Скачать и загрузить quantized weights
9B Q4
~6GB VRAM
Вход для низкой VRAM
35B Q5
~25GB VRAM
Рекомендованное локальное качество

SGLang / llama.cpp

SGLang полезен для MoE scheduling; llama.cpp — легкий C++ serving path.

Self-hosted варианты
SGLang parser
qwen3_coder
Отличается от vLLM parser
llama.cpp
llama-server
-c 262144
Agents
Claude Code / OpenHands
Указать локальный OPENAI_BASE_URL
API key
EMPTY
Placeholder для локальных сервисов

Заметка об оценке

Данные бенчмарков взяты из официальной оценки DeepReinforce; используйте их как сигнал выбора и перепроверьте перед production.

Self-reported
Terminal-Bench
среднее по 5 runs
timeout 4h, 32 CPU, 48GB RAM
SWE-Bench
OpenHands
контекст 256K
NL2Repo
400K context
вывод 48K
ClawEval
реальные пользовательские задачи
256K context

Сценарии Ornith AI и выбор моделей

Краткая карта применения Ornith AI в реальных developer workflow.

Рефакторинг репозитория

Планируйте и применяйте согласованные изменения во многих файлах с проверкой промежуточных результатов.

Локализация bugs

Ищите по codebase, сужайте вероятные причины и создавайте сфокусированные patches с тестами.

Terminal agents

Используйте для terminal-native coding agents со структурированными tool calls и recovery loops.

Приватный локальный кодинг

Запускайте меньшие варианты локально для offline assistance и приватности кода.

35B MoE как sweet spot

Используйте 35B MoE для баланса скорости, качества и стоимости железа.

397B для production

Используйте 397B MoE для максимальной точности в production agent pipelines.

FAQ

FAQ Ornith AI

Короткие ответы о выборе модели, настройке и позиционировании.

1

Что такое Ornith AI?

Ornith AI — это гид вокруг Ornith 1.0, open-source семейства моделей agentic coding от DeepReinforce AI.

2

Чем Ornith отличается?

Ключевая идея — self-scaffolding: модель вместе учится планированию, использованию инструментов, восстановлению после ошибок и решению coding tasks.

3

Какую модель Ornith выбрать?

Для многих пользователей 35B MoE — практичная середина. 9B лучше для ограниченного железа, а 397B — для production agents с высокой точностью.

4

Можно ли запускать Ornith AI локально?

Да. Гид покрывает vLLM, Ollama, LM Studio, quantized weights и компромиссы VRAM для local/self-hosted сценариев.

Создавайте с Ornith AI

Начните с семейства моделей, сравните benchmark signals и выберите deployment path под ваше железо и workflow.