Ornith 1.0Família de modelos de código com licença MIT

Ornith AI: modelos autoaprimorados para agentic coding

Um guia prático da família Ornith 1.0 da DeepReinforce AI.
Explore modelos de código com self-scaffolding, benchmarks, escolhas de hardware e caminhos de deploy local.

Compare as variantes 9B, 31B, 35B MoE e 397B MoE antes de escolher uma configuração local ou de produção.

Ornith 1.0

Sinais principais do Ornith AI

O essencial do guia atual do Ornith 1.0.

Lançamento

Jun 25

2026

Tamanhos

9B-397B

Dense + MoE

Janela de contexto

262K

tokens

SWE-Bench

82.4

Verified

O que é Ornith AI?

Ornith AI se concentra no Ornith 1.0, uma família de LLMs open-source projetada para agentic coding em escala de repositório. Os modelos aprendem não só a escrever código, mas também a construir o scaffold do trabalho: planejamento, uso de ferramentas, retentativas e verificação.

Agentes com self-scaffolding
Ornith aprende planos de tarefa, chamadas de ferramentas, recuperação de erros e patches de código no mesmo ciclo de reinforcement learning.
Família de modelos aberta
Escolha entre variantes 9B Dense, 31B Dense, 35B MoE e 397B MoE sob licença MIT.
Feito para fluxos de código
Use em agentes de terminal, refactors multi-arquivo, localização de bugs, patches com testes e assistentes offline.

Ciclo de treinamento

Como o Ornith AI funciona

A estrutura do guia ajuda a entender a ideia de treinamento, comparar benchmarks e escolher o modelo adequado ao seu hardware.

O modelo otimiza a estratégia de orquestração e o código final ao mesmo tempo, sem depender de um harness humano fixo.

Aprendizado conjunto de scaffold e solução

Treinamento protegido contra reward hacking

Dados dos modelos

Especificações do Ornith 1.0

Tamanho, arquitetura, modelo base, VRAM e casos de uso adaptados do guia de modelos Ornith.

Ornith-1.0-9B

9B Dense em Qwen 3.5 para pouca VRAM e triagem rápida de código.

Entrada local

Arquitetura: Dense; Todos os parâmetros ativos na inferência
VRAM: ~19GB bf16 / ~6GB Q4; Q4 cabe em setups locais de entrada
Contexto: 262K tokens; Amplo para contexto de repositórios
Ideal para: Edge / Offline; Código privado, triagem e agentes leves

Ornith-1.0-31B

31B Dense em Gemma 4 para equipes que preferem estabilidade dense.

Dense equilibrado

Arquitetura: Dense; Comportamento estável com maior demanda de recursos
VRAM: ~62GB bf16 / ~20GB Q4; GPU classe 80GB ou deploy quantizado
Contexto: 262K tokens; Tarefas de código com longo contexto
Ideal para: Equilíbrio; Qualidade e velocidade sem roteamento MoE

Ornith-1.0-35B MoE

35B MoE com cerca de 3B parâmetros ativos por token, recomendado para a maioria dos devs locais.

Recomendado

Arquitetura: MoE; Mais conhecimento total com menos computação ativa
VRAM: ~25GB Q5_K_M; Prático para uma única GPU 24GB+
Velocidade: Mais rápido que 9B dense; MoE reduz computação por token
Ideal para: Melhor valor; Agentes locais, refactors e código diário

Ornith-1.0-397B MoE

397B MoE para máxima precisão em pipelines de agentes de produção.

Flagship

Arquitetura: MoE; Baseado em Qwen 3.5 397B
VRAM: ~200GB FP8 / ~400GB bf16; Normalmente 8x GPUs de 80GB
Melhor score: 82.4 SWE-Bench; Benchmark Verified
Ideal para: Produção; Sistemas autônomos de código de alta precisão

35B MoE é o ponto ideal recomendado para a maioria dos desenvolvedores locais; 397B mira pipelines de agentes em produção.

Dados de benchmark

Benchmarks do Ornith 1.0

Dados comparativos de Terminal-Bench, SWE-Bench, NL2Repo e ClawEval para o 397B e modelos locais menores.

397B vs modelos frontier

Ornith-1.0-397B comparado com pontuações de Qwen, GLM, DeepSeek e Claude Opus.

Benchmark	Ornith 397B	Qwen 3.5	Qwen 3.7	GLM 5.2	DeepSeek V4	Opus 4.7	Opus 4.8
Terminal-Bench 2.1	77.5	53.5	73.5	81.0	64	70.3	85
SWE-Bench Verified	82.4	76.4	80.4	-	80.6	80.8	87.6
SWE-Bench Pro	62.2	51.6	60.6	62.1	55.4	64.3	69.2
SWE-Bench Multilingual	78.9	69.3	78.3	-	76.2	-	-
NL2Repo	48.2	36.8	47.2	48.9	-	-	69.7
ClawEval Avg	77.1	70.7	65.2	-	75.8	78.2	-

Comparação de modelos pequenos

Resultados 9B e 35B MoE contra baselines Qwen e Gemma de tamanho similar.

Benchmark	Ornith 9B	Ornith 35B	Qwen 3.5 9B	Qwen 3.5 35B	Gemma 12B	Gemma 31B
Terminal-Bench 2.1	43.1	64.2	21.3	41.4	21	42.1
SWE-Bench Verified	69.4	75.6	53.2	70	44.2	52
SWE-Bench Pro	42.9	44.6	31.3	44.6	27.6	35.7
SWE-Bench Multilingual	52	60.3	39.7	60.3	32.5	51.7
NL2Repo	27.2	20.5	16.2	20.5	10.3	15.5
ClawEval Avg	63.1	65.4	53.2	65.4	32.5	48.5

Nota: essas pontuações vêm da avaliação oficial da DeepReinforce; teste novamente com suas tarefas antes da produção.

Execução local

Dados de runtime e deploy

Notas de serving e integração para vLLM, Ollama, LM Studio, SGLang, llama.cpp e agentes compatíveis com OpenAI.

vLLM

Serving compatível com OpenAI para produção com prefix caching, tool parsing e reasoning parsing.

Throughput de produção

Port: 8000; endpoint OpenAI /v1
Context: 262144; --max-model-len
Tool calls: qwen3_xml; --enable-auto-tool-choice
Reasoning: qwen3; campo reasoning_content

Ollama / LM Studio

Ideal para testes locais e workflows GUI; use quantização GGUF Q4_K_M ou Q5_K_M.

Setup mais rápido

Ollama: hf.co/...-GGUF; Baixar e rodar em um comando
LM Studio: Search Ornith-1.0; Baixar e carregar pesos quantizados
9B Q4: ~6GB VRAM; Entrada com pouca VRAM
35B Q5: ~25GB VRAM; Qualidade local recomendada

SGLang / llama.cpp

SGLang é útil para scheduling MoE; llama.cpp é um caminho C++ leve.

Opções self-hosted

SGLang parser: qwen3_coder; Diferente do parser vLLM
llama.cpp: llama-server; -c 262144
Agents: Claude Code / OpenHands; Apontar para OPENAI_BASE_URL local
API key: EMPTY; Placeholder para serviços locais

Nota de avaliação

Os dados de benchmark vêm da avaliação oficial da DeepReinforce; use como sinal de seleção e reteste antes da produção.

Self-reported

Terminal-Bench: média de 5 execuções; timeout 4h, 32 CPU, 48GB RAM
SWE-Bench: OpenHands; contexto 256K
NL2Repo: 400K context; saída 48K
ClawEval: tarefas reais de usuários; 256K context

Casos de uso e escolha de modelos no Ornith AI

Um mapa compacto de onde Ornith AI se encaixa em fluxos reais de desenvolvimento.

Refatoração de repositórios

Planeje e aplique mudanças coordenadas em muitos arquivos enquanto verifica resultados intermediários.

Localização de bugs

Pesquise uma codebase, identifique causas prováveis e produza patches focados com testes.

Agentes de terminal

Alimente agentes de código em terminal que precisam de tool calls estruturadas e loops de recuperação.

Código local privado

Execute variantes menores localmente para assistência offline e privacidade do código.

35B MoE como ponto ideal

Use 35B MoE para equilibrar velocidade, qualidade e custo de hardware.

397B em produção

Use 397B MoE para máxima precisão em pipelines de agentes de produção.

FAQ

FAQ do Ornith AI

Respostas rápidas sobre escolha de modelo, setup e posicionamento.

O que é Ornith AI?

Ornith AI é este guia em torno do Ornith 1.0, uma família open-source de modelos agentic coding da DeepReinforce AI.

O que torna Ornith diferente?

A ideia central é self-scaffolding: o modelo aprende junto planejamento, uso de ferramentas, recuperação de erros e solução de tarefas de código.

Qual modelo Ornith escolher?

Para muitos usuários, 35B MoE é o meio-termo prático. 9B é melhor para hardware limitado, enquanto 397B mira agentes de produção de alta precisão.

Ornith AI pode rodar localmente?

Sim. O guia cobre vLLM, Ollama, LM Studio, pesos quantizados e tradeoffs de VRAM para caminhos locais e self-hosted.

Construa com Ornith AI

Comece pela família de modelos, compare os sinais de benchmark e escolha o caminho de deploy adequado ao hardware e workflow.

Ornith AI: modelos autoaprimorados para agentic coding

Sinais principais do Ornith AI

O que é Ornith AI?

Como o Ornith AI funciona

Aprendizado conjunto de scaffold e solução

Raciocínio com chamadas de ferramentas

Treinamento protegido contra reward hacking

Especificações do Ornith 1.0

Ornith-1.0-9B

Ornith-1.0-31B

Ornith-1.0-35B MoE

Ornith-1.0-397B MoE

Benchmarks do Ornith 1.0

397B vs modelos frontier

Comparação de modelos pequenos

Dados de runtime e deploy

vLLM

Ollama / LM Studio

SGLang / llama.cpp

Nota de avaliação

Casos de uso e escolha de modelos no Ornith AI

Refatoração de repositórios

Localização de bugs

Agentes de terminal

Código local privado

35B MoE como ponto ideal

397B em produção

FAQ do Ornith AI

O que é Ornith AI?

O que torna Ornith diferente?

Qual modelo Ornith escolher?

Ornith AI pode rodar localmente?

Construa com Ornith AI