Ornith 1.0Семейство coding-моделей под лицензией MIT

Ornith AI: самоулучшающиеся модели для agentic coding

Практический гид по семейству Ornith 1.0 от DeepReinforce AI.
Изучите модели кода с self-scaffolding, бенчмарки, выбор железа и локальные варианты запуска.

Сравните варианты 9B, 31B, 35B MoE и 397B MoE перед выбором локальной или production-конфигурации.

Ornith 1.0

Ключевые данные Ornith AI

Главное из текущего гида Ornith 1.0.

Релиз

Jun 25

2026

Размеры моделей

9B-397B

Dense + MoE

Контекст

262K

tokens

SWE-Bench

82.4

Verified

Что такое Ornith AI?

Ornith AI посвящен Ornith 1.0, семейству open-source LLM для agentic coding на уровне репозитория. Модели учатся не только писать код, но и строить рабочий scaffold: планирование, использование инструментов, повторы и проверку.

Агенты с self-scaffolding
Ornith учит планы задач, tool calls, восстановление после ошибок и code patches в одном reinforcement learning цикле.
Открытое семейство моделей
Выбирайте между 9B Dense, 31B Dense, 35B MoE и 397B MoE под лицензией MIT.
Для coding workflow
Подходит для terminal-native агентов, multi-file refactoring, поиска bugs, test-driven patches и offline assistants.

Цикл обучения

Как работает Ornith AI

Структура гида помогает понять идею обучения, сравнить бенчмарки и выбрать модель под ваше железо.

Модель одновременно оптимизирует стратегию оркестрации и финальный код, не полагаясь на фиксированный human-designed harness.

Данные моделей

Спецификации Ornith 1.0

Размер, архитектура, базовая модель, VRAM и сценарии на основе Ornith model guide.

Ornith-1.0-9B

9B Dense на Qwen 3.5 для низкой VRAM и быстрого triage кода.

Локальный старт

Архитектура: Dense; Все параметры активны при inference
VRAM: ~19GB bf16 / ~6GB Q4; Q4 подходит для начальных локальных setup
Контекст: 262K tokens; Достаточно для широкого контекста репозитория
Лучше для: Edge / Offline; Приватный кодинг, triage и легкие агенты

Ornith-1.0-31B

31B Dense на Gemma 4 для команд, которым нужна стабильность dense-модели.

Сбалансированный Dense

Архитектура: Dense; Стабильное поведение с большим потреблением ресурсов
VRAM: ~62GB bf16 / ~20GB Q4; GPU класса 80GB или quantized deployment
Контекст: 262K tokens; Coding tasks с длинным контекстом
Лучше для: Баланс; Качество и скорость без MoE routing

Ornith-1.0-35B MoE

35B MoE примерно с 3B активных параметров на token, рекомендован большинству локальных разработчиков.

Рекомендуется

Архитектура: MoE; Больше общего знания при меньших активных вычислениях
VRAM: ~25GB Q5_K_M; Практично для одной GPU 24GB+
Скорость: Быстрее 9B dense; MoE снижает compute на token
Лучше для: Best Value; Локальные агенты, refactors, ежедневный coding

Ornith-1.0-397B MoE

397B MoE для максимальной точности в production agent pipelines.

Флагман

Архитектура: MoE; Основан на Qwen 3.5 397B
VRAM: ~200GB FP8 / ~400GB bf16; Обычно 8x GPUs по 80GB
Лучший score: 82.4 SWE-Bench; Verified benchmark
Лучше для: Production; Высокоточные автономные coding systems

35B MoE — рекомендуемый sweet spot для большинства локальных разработчиков; 397B предназначен для production agent pipelines.

Данные benchmark

Бенчмарки Ornith 1.0

Сравнение Terminal-Bench, SWE-Bench, NL2Repo и ClawEval для 397B и меньших локальных моделей.

397B против frontier models

Ornith-1.0-397B в сравнении со scores Qwen, GLM, DeepSeek и Claude Opus.

Бенчмарк	Ornith 397B	Qwen 3.5	Qwen 3.7	GLM 5.2	DeepSeek V4	Opus 4.7	Opus 4.8
Terminal-Bench 2.1	77.5	53.5	73.5	81.0	64	70.3	85
SWE-Bench Verified	82.4	76.4	80.4	-	80.6	80.8	87.6
SWE-Bench Pro	62.2	51.6	60.6	62.1	55.4	64.3	69.2
SWE-Bench Multilingual	78.9	69.3	78.3	-	76.2	-	-
NL2Repo	48.2	36.8	47.2	48.9	-	-	69.7
ClawEval Avg	77.1	70.7	65.2	-	75.8	78.2	-

Сравнение малых моделей

Результаты 9B и 35B MoE против близких по размеру baselines Qwen и Gemma.

Бенчмарк	Ornith 9B	Ornith 35B	Qwen 3.5 9B	Qwen 3.5 35B	Gemma 12B	Gemma 31B
Terminal-Bench 2.1	43.1	64.2	21.3	41.4	21	42.1
SWE-Bench Verified	69.4	75.6	53.2	70	44.2	52
SWE-Bench Pro	42.9	44.6	31.3	44.6	27.6	35.7
SWE-Bench Multilingual	52	60.3	39.7	60.3	32.5	51.7
NL2Repo	27.2	20.5	16.2	20.5	10.3	15.5
ClawEval Avg	63.1	65.4	53.2	65.4	32.5	48.5

Примечание: scores взяты из официальной оценки DeepReinforce; перед production проверьте на своих задачах.

Локальный запуск

Данные runtime и deployment

Заметки по serving и интеграции для vLLM, Ollama, LM Studio, SGLang, llama.cpp и OpenAI-compatible coding agents.

vLLM

OpenAI-compatible serving для production deployments с prefix caching, tool parsing и reasoning parsing.

Пропускная способность production

Port: 8000; OpenAI /v1 endpoint
Context: 262144; --max-model-len
Tool calls: qwen3_xml; --enable-auto-tool-choice
Reasoning: qwen3; поле reasoning_content

Ollama / LM Studio

Лучше для локальных проб и GUI workflow; используйте GGUF Q4_K_M или Q5_K_M quantization.

Самый быстрый setup

Ollama: hf.co/...-GGUF; Скачать и запустить одной командой
LM Studio: Search Ornith-1.0; Скачать и загрузить quantized weights
9B Q4: ~6GB VRAM; Вход для низкой VRAM
35B Q5: ~25GB VRAM; Рекомендованное локальное качество

SGLang / llama.cpp

SGLang полезен для MoE scheduling; llama.cpp — легкий C++ serving path.

Self-hosted варианты

SGLang parser: qwen3_coder; Отличается от vLLM parser
llama.cpp: llama-server; -c 262144
Agents: Claude Code / OpenHands; Указать локальный OPENAI_BASE_URL
API key: EMPTY; Placeholder для локальных сервисов

Заметка об оценке

Данные бенчмарков взяты из официальной оценки DeepReinforce; используйте их как сигнал выбора и перепроверьте перед production.

Self-reported

Terminal-Bench: среднее по 5 runs; timeout 4h, 32 CPU, 48GB RAM
SWE-Bench: OpenHands; контекст 256K
NL2Repo: 400K context; вывод 48K
ClawEval: реальные пользовательские задачи; 256K context

Сценарии Ornith AI и выбор моделей

Краткая карта применения Ornith AI в реальных developer workflow.

Рефакторинг репозитория

Планируйте и применяйте согласованные изменения во многих файлах с проверкой промежуточных результатов.

Локализация bugs

Ищите по codebase, сужайте вероятные причины и создавайте сфокусированные patches с тестами.

Terminal agents

Используйте для terminal-native coding agents со структурированными tool calls и recovery loops.

Приватный локальный кодинг

Запускайте меньшие варианты локально для offline assistance и приватности кода.

35B MoE как sweet spot

Используйте 35B MoE для баланса скорости, качества и стоимости железа.

397B для production

Используйте 397B MoE для максимальной точности в production agent pipelines.

FAQ

FAQ Ornith AI

Короткие ответы о выборе модели, настройке и позиционировании.

Что такое Ornith AI?

Ornith AI — это гид вокруг Ornith 1.0, open-source семейства моделей agentic coding от DeepReinforce AI.

Чем Ornith отличается?

Ключевая идея — self-scaffolding: модель вместе учится планированию, использованию инструментов, восстановлению после ошибок и решению coding tasks.

Какую модель Ornith выбрать?

Для многих пользователей 35B MoE — практичная середина. 9B лучше для ограниченного железа, а 397B — для production agents с высокой точностью.

Можно ли запускать Ornith AI локально?

Да. Гид покрывает vLLM, Ollama, LM Studio, quantized weights и компромиссы VRAM для local/self-hosted сценариев.

Создавайте с Ornith AI

Начните с семейства моделей, сравните benchmark signals и выберите deployment path под ваше железо и workflow.

Ornith AI: самоулучшающиеся модели для agentic coding

Ключевые данные Ornith AI

Что такое Ornith AI?

Как работает Ornith AI

Совместное обучение scaffold и решения

Reasoning с вызовами инструментов

Защита от reward hacking

Спецификации Ornith 1.0

Ornith-1.0-9B

Ornith-1.0-31B

Ornith-1.0-35B MoE

Ornith-1.0-397B MoE

Бенчмарки Ornith 1.0

397B против frontier models

Сравнение малых моделей

Данные runtime и deployment

vLLM

Ollama / LM Studio

SGLang / llama.cpp

Заметка об оценке

Сценарии Ornith AI и выбор моделей

Рефакторинг репозитория

Локализация bugs

Terminal agents

Приватный локальный кодинг

35B MoE как sweet spot

397B для production

FAQ Ornith AI

Что такое Ornith AI?

Чем Ornith отличается?

Какую модель Ornith выбрать?

Можно ли запускать Ornith AI локально?

Создавайте с Ornith AI