Ornith 1.0Família de modelos de código com licença MIT

Ornith AI: modelos autoaprimorados para agentic coding

Um guia prático da família Ornith 1.0 da DeepReinforce AI.
Explore modelos de código com self-scaffolding, benchmarks, escolhas de hardware e caminhos de deploy local.

Compare as variantes 9B, 31B, 35B MoE e 397B MoE antes de escolher uma configuração local ou de produção.

Ornith 1.0

Sinais principais do Ornith AI

O essencial do guia atual do Ornith 1.0.

Lançamento

Jun 25

2026

Tamanhos

9B-397B

Dense + MoE

Janela de contexto

262K

tokens

SWE-Bench

82.4

Verified

O que é Ornith AI?

Ornith AI se concentra no Ornith 1.0, uma família de LLMs open-source projetada para agentic coding em escala de repositório. Os modelos aprendem não só a escrever código, mas também a construir o scaffold do trabalho: planejamento, uso de ferramentas, retentativas e verificação.

  • Agentes com self-scaffolding
    Ornith aprende planos de tarefa, chamadas de ferramentas, recuperação de erros e patches de código no mesmo ciclo de reinforcement learning.
  • Família de modelos aberta
    Escolha entre variantes 9B Dense, 31B Dense, 35B MoE e 397B MoE sob licença MIT.
  • Feito para fluxos de código
    Use em agentes de terminal, refactors multi-arquivo, localização de bugs, patches com testes e assistentes offline.
Ciclo de treinamento

Como o Ornith AI funciona

A estrutura do guia ajuda a entender a ideia de treinamento, comparar benchmarks e escolher o modelo adequado ao seu hardware.

O modelo otimiza a estratégia de orquestração e o código final ao mesmo tempo, sem depender de um harness humano fixo.

Aprendizado conjunto de scaffold e solução
Raciocínio com chamadas de ferramentas
Treinamento protegido contra reward hacking

Dados dos modelos

Especificações do Ornith 1.0

Tamanho, arquitetura, modelo base, VRAM e casos de uso adaptados do guia de modelos Ornith.

Ornith-1.0-9B

9B Dense em Qwen 3.5 para pouca VRAM e triagem rápida de código.

Entrada local
Arquitetura
Dense
Todos os parâmetros ativos na inferência
VRAM
~19GB bf16 / ~6GB Q4
Q4 cabe em setups locais de entrada
Contexto
262K tokens
Amplo para contexto de repositórios
Ideal para
Edge / Offline
Código privado, triagem e agentes leves

Ornith-1.0-31B

31B Dense em Gemma 4 para equipes que preferem estabilidade dense.

Dense equilibrado
Arquitetura
Dense
Comportamento estável com maior demanda de recursos
VRAM
~62GB bf16 / ~20GB Q4
GPU classe 80GB ou deploy quantizado
Contexto
262K tokens
Tarefas de código com longo contexto
Ideal para
Equilíbrio
Qualidade e velocidade sem roteamento MoE

Ornith-1.0-35B MoE

35B MoE com cerca de 3B parâmetros ativos por token, recomendado para a maioria dos devs locais.

Recomendado
Arquitetura
MoE
Mais conhecimento total com menos computação ativa
VRAM
~25GB Q5_K_M
Prático para uma única GPU 24GB+
Velocidade
Mais rápido que 9B dense
MoE reduz computação por token
Ideal para
Melhor valor
Agentes locais, refactors e código diário

Ornith-1.0-397B MoE

397B MoE para máxima precisão em pipelines de agentes de produção.

Flagship
Arquitetura
MoE
Baseado em Qwen 3.5 397B
VRAM
~200GB FP8 / ~400GB bf16
Normalmente 8x GPUs de 80GB
Melhor score
82.4 SWE-Bench
Benchmark Verified
Ideal para
Produção
Sistemas autônomos de código de alta precisão

35B MoE é o ponto ideal recomendado para a maioria dos desenvolvedores locais; 397B mira pipelines de agentes em produção.

Dados de benchmark

Benchmarks do Ornith 1.0

Dados comparativos de Terminal-Bench, SWE-Bench, NL2Repo e ClawEval para o 397B e modelos locais menores.

397B vs modelos frontier

Ornith-1.0-397B comparado com pontuações de Qwen, GLM, DeepSeek e Claude Opus.

BenchmarkOrnith 397BQwen 3.5Qwen 3.7GLM 5.2DeepSeek V4Opus 4.7Opus 4.8
Terminal-Bench 2.177.553.573.581.06470.385
SWE-Bench Verified82.476.480.4-80.680.887.6
SWE-Bench Pro62.251.660.662.155.464.369.2
SWE-Bench Multilingual78.969.378.3-76.2--
NL2Repo48.236.847.248.9--69.7
ClawEval Avg77.170.765.2-75.878.2-

Comparação de modelos pequenos

Resultados 9B e 35B MoE contra baselines Qwen e Gemma de tamanho similar.

BenchmarkOrnith 9BOrnith 35BQwen 3.5 9BQwen 3.5 35BGemma 12BGemma 31B
Terminal-Bench 2.143.164.221.341.42142.1
SWE-Bench Verified69.475.653.27044.252
SWE-Bench Pro42.944.631.344.627.635.7
SWE-Bench Multilingual5260.339.760.332.551.7
NL2Repo27.220.516.220.510.315.5
ClawEval Avg63.165.453.265.432.548.5

Nota: essas pontuações vêm da avaliação oficial da DeepReinforce; teste novamente com suas tarefas antes da produção.

Execução local

Dados de runtime e deploy

Notas de serving e integração para vLLM, Ollama, LM Studio, SGLang, llama.cpp e agentes compatíveis com OpenAI.

vLLM

Serving compatível com OpenAI para produção com prefix caching, tool parsing e reasoning parsing.

Throughput de produção
Port
8000
endpoint OpenAI /v1
Context
262144
--max-model-len
Tool calls
qwen3_xml
--enable-auto-tool-choice
Reasoning
qwen3
campo reasoning_content

Ollama / LM Studio

Ideal para testes locais e workflows GUI; use quantização GGUF Q4_K_M ou Q5_K_M.

Setup mais rápido
Ollama
hf.co/...-GGUF
Baixar e rodar em um comando
LM Studio
Search Ornith-1.0
Baixar e carregar pesos quantizados
9B Q4
~6GB VRAM
Entrada com pouca VRAM
35B Q5
~25GB VRAM
Qualidade local recomendada

SGLang / llama.cpp

SGLang é útil para scheduling MoE; llama.cpp é um caminho C++ leve.

Opções self-hosted
SGLang parser
qwen3_coder
Diferente do parser vLLM
llama.cpp
llama-server
-c 262144
Agents
Claude Code / OpenHands
Apontar para OPENAI_BASE_URL local
API key
EMPTY
Placeholder para serviços locais

Nota de avaliação

Os dados de benchmark vêm da avaliação oficial da DeepReinforce; use como sinal de seleção e reteste antes da produção.

Self-reported
Terminal-Bench
média de 5 execuções
timeout 4h, 32 CPU, 48GB RAM
SWE-Bench
OpenHands
contexto 256K
NL2Repo
400K context
saída 48K
ClawEval
tarefas reais de usuários
256K context

Casos de uso e escolha de modelos no Ornith AI

Um mapa compacto de onde Ornith AI se encaixa em fluxos reais de desenvolvimento.

Refatoração de repositórios

Planeje e aplique mudanças coordenadas em muitos arquivos enquanto verifica resultados intermediários.

Localização de bugs

Pesquise uma codebase, identifique causas prováveis e produza patches focados com testes.

Agentes de terminal

Alimente agentes de código em terminal que precisam de tool calls estruturadas e loops de recuperação.

Código local privado

Execute variantes menores localmente para assistência offline e privacidade do código.

35B MoE como ponto ideal

Use 35B MoE para equilibrar velocidade, qualidade e custo de hardware.

397B em produção

Use 397B MoE para máxima precisão em pipelines de agentes de produção.

FAQ

FAQ do Ornith AI

Respostas rápidas sobre escolha de modelo, setup e posicionamento.

1

O que é Ornith AI?

Ornith AI é este guia em torno do Ornith 1.0, uma família open-source de modelos agentic coding da DeepReinforce AI.

2

O que torna Ornith diferente?

A ideia central é self-scaffolding: o modelo aprende junto planejamento, uso de ferramentas, recuperação de erros e solução de tarefas de código.

3

Qual modelo Ornith escolher?

Para muitos usuários, 35B MoE é o meio-termo prático. 9B é melhor para hardware limitado, enquanto 397B mira agentes de produção de alta precisão.

4

Ornith AI pode rodar localmente?

Sim. O guia cobre vLLM, Ollama, LM Studio, pesos quantizados e tradeoffs de VRAM para caminhos locais e self-hosted.

Construa com Ornith AI

Comece pela família de modelos, compare os sinais de benchmark e escolha o caminho de deploy adequado ao hardware e workflow.