Qual é o preço do DeepSeek v4?

O DeepSeek v4 Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída. Isso o torna significativamente mais acessível do que os frontier models proprietários.

Como acesso a API do DeepSeek v4?

Você pode acessá-lo por meio da DeepSeek Platform usando um SDK compatível com OpenAI ou via provedores como o OpenRouter. Ele utiliza a mesma estrutura de URL base das versões anteriores.

Qual é o tamanho máximo da context window?

O model suporta uma context window nativa de 1 milhão de tokens. Isso permite que os usuários processem vários livros ou grandes bases de código em um único prompt.

Ele suporta entrada de imagem e vídeo?

Sim, o DeepSeek v4 é um model multimodal nativo que processa entradas de texto, imagem, vídeo e áudio. Ele não requer encoders externos para essas tarefas.

O DeepSeek v4 é open-source?

Sim, os pesos do model estão disponíveis no Hugging Face sob a licença MIT. Isso permite tanto o deployment local quanto a integração comercial.

O que é o recurso 'Thinking Mode'?

O Thinking Mode é uma configuração de reasoning opcional que usa chain-of-thought para resolver problemas matemáticos e lógicos complexos. Ele é modelado com base em outros sistemas de deep-thinking.

Como ele se compara ao GPT-5 ou Claude 4?

Ele rivaliza com os principais modelos closed-source em benchmarks de reasoning e coding, sendo até 30 vezes mais econômico. Ele se destaca especificamente nas pontuações do LiveCodeBench.

Qual é o tamanho máximo da saída?

O DeepSeek v4 pode gerar até 384.000 tokens de saída em uma única resposta. Este é atualmente um dos maiores limites de saída do setor.

DeepSeek v4

O DeepSeek v4 é um model MoE de 1,6T de parâmetros com uma context window de 1M de tokens e suporte multimodal nativo para texto, visão e vídeo a preços...

Open-SourceMultimodalMixture of ExpertsReasoningLong Context

deepseekDeepSeek-V2026-04-23

Contexto

1.0Mtokens

Saida Max

384Ktokens

Preco Entrada

$1.74/ 1M

Preco Saida

$3.48/ 1M

Modalidade:TextImageAudioVideo

Capacidades:VisaoFerramentasStreamingRaciocinio

Benchmarks

GPQA

90.1%

HLE

48.2%

MMLU

90.1%

MMLU Pro

87.5%

SimpleQA

57.9%

IFEval

89%

AIME 2025

92%

MATH

90.2%

GSM8k

92.6%

MGSM

92%

MathVista

72%

SWE-Bench

80.6%

HumanEval

90%

LiveCodeBench

93.5%

MMMU

70%

MMMU Pro

55%

ChartQA

87%

DocVQA

92%

Terminal-Bench

67.9%

ARC-AGI

77%

Ver Documentacao da API

Sobre DeepSeek v4

Aprenda sobre as capacidades do DeepSeek v4, recursos e como ele pode ajuda-lo a obter melhores resultados.

Arquitetura de Alta Eficiência em Escala de Trilhões

O DeepSeek v4 representa uma evolução no design de Mixture-of-Experts (MoE), escalando para 1,6 trilhões de parâmetros totais com 49 bilhões de parâmetros ativos. O model integra Compressed Sparse Attention (CSA) e Heavily Compressed Attention (HCA) para gerenciar sua context window de 1 milhão de tokens. Essas tecnologias reduzem o footprint de memória do cache KV em 90% em comparação com arquiteturas padrão, permitindo inferência mais rápida e menores requisitos de hardware para tarefas de long context.

Integração Multimodal Nativa

Diferente de modelos que usam encoders de visão ou áudio separados, o DeepSeek v4 é nativamente multimodal desde a fase inicial de treinamento. Ele processa texto, imagens, áudio e vídeo dentro de um framework unificado único. Essa abordagem melhora o reasoning intermodal, permitindo que o model execute análises complexas em arquivos de vídeo brutos e arquivos de documentos em grande escala sem perder detalhes granulares.

Disrupção Estratégica de Custos

O model é posicionado como uma alternativa open-source de alto desempenho aos modelos proprietários de alto nível. Com um preço de US$ 1,74 por milhão de tokens de entrada, ele mantém um desempenho de nível frontier em coding e matemática, reduzindo significativamente os custos operacionais para desenvolvedores. A inclusão de um Thinking Mode opcional permite um deep reasoning para provas lógicas e programação competitiva.

Casos de Uso para DeepSeek v4

Descubra as diferentes maneiras de usar DeepSeek v4 para obter otimos resultados.

Refatoração de Bases de Código em Grande Escala

Utilizando a context window de 1M para processar repositórios inteiros para detecção global de bugs e melhorias arquiteturais.

Análise Nativa de Vídeo

Processando arquivos de vídeo brutos diretamente para realizar detecção de cenas, geração de transcrições e reasoning visual complexo.

Agentes de Software Autônomos

Implantando o model em fluxos de trabalho agentic para resolver problemas reais do GitHub com uma taxa de sucesso de 80,6% no SWE-bench.

Criação de Conteúdo Multimodal

Gerando dados estruturados e conteúdo criativo em formatos de texto, imagem e áudio usando um model unificado.

Provas Matemáticas de Alto Nível

Resolvendo problemas de matemática de nível de olimpíada e provas formais usando o Thinking Mode especializado para deep reasoning.

Recuperação de Conhecimento Corporativo

Analisando arquivos massivos de documentos em um único prompt para extrair fatos sem a necessidade de pipelines de RAG complexos.

Pontos Fortes

Limitacoes

Long Context de Alta Eficiência: Reduz o footprint do cache KV em 90%, permitindo uma context window de 1M que mantém o desempenho em hardware padrão.

Latência Maior no Thinking Mode: O modo de deep reasoning aumenta o tempo até o primeiro token (time-to-first-token), tornando-o menos adequado para necessidades conversacionais ultra rápidas.

Valor Líder de Mercado: Oferece inteligência de nível frontier por US$ 1,74/M de tokens, superando significativamente os concorrentes closed-source ocidentais.

Viés de Otimização de Hardware: Relatórios técnicos sugerem que a otimização é fortemente adaptada para aceleradores domésticos chineses específicos em vez de clusters da Nvidia.

Coding Agentic de Elite: Alcança 80,6% no SWE-bench Verified, tornando-o um dos modelos mais capazes para engenharia de software autônoma.

Lacunas de Factualidade: Pontua 57,9% no SimpleQA, indicando que, embora o reasoning seja de elite, a alucinação factual continua sendo um desafio.

Multimodalidade Nativa Unificada: Suporta texto, visão, áudio e vídeo em uma única arquitetura sem exigir adaptadores externos ou sub-modelos.

Requisitos Complexos de Cache KV: O mecanismo de atenção HCA/CSA híbrido requer suporte de kernel específico para desempenho local ideal.

Inicio Rapido da API

deepseek/deepseek-v4-pro

Ver Documentacao

deepseek SDK

import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Otimize este kernel Rust para eficiência de memória.' }], }); console.log(msg.choices[0].message.content);

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre DeepSeek v4

Veja o que a comunidade pensa sobre DeepSeek v4

“O modo de reasoning do DeepSeek v4 encontrou um bug de concorrência no meu código Rust que até o Claude Opus deixou passar. Realmente insano.”

— rust_dev_2025

“A era do long context de 1M com bom custo-benefício finalmente chegou. Agora podemos fazer refatorações de projetos completos por centavos.”

— tech_lead_alex

twitter

“Ver o model trabalhar em uma base de código de 1M de tokens sem perder o 'fio da meada' é o verdadeiro ponto de virada para 2026.”

— logic_fanatic

hackernews

“A Anthropic e a OpenAI têm um sério problema de precificação agora. O DeepSeek acabou de transformar IA frontier em uma commodity.”

— CodeMaster

youtube

“Ele supera o GPT-5.4 em benchmarks de coding enquanto é open-source. Este é o maior lançamento do ano.”

— AI_Researcher_99

twitter

“A compressão de memória é a verdadeira mágica. 1T de parâmetros em hardware de consumo está finalmente se tornando real.”

— GPU_Rich

Videos Sobre DeepSeek v4

Assista tutoriais, analises e discussoes sobre DeepSeek v4

“A eficiência de memória é o ponto principal aqui; reduzir o cache KV em 90% muda tudo”

“Executar um model de 1T com esse nível de velocidade é uma vitória arquitetural massiva”

“O custo por milhão de tokens torna impossível para pequenas startups ignorarem”

“Nunca vi um model open-source lidar com 1 milhão de tokens tão bem”

“Parece que o abismo entre modelos open e closed foi oficialmente fechado”

“O DeepSeek não está mais competindo apenas por preço; eles estão liderando em reasoning com long context”

“O suporte nativo a vídeo é surpreendentemente robusto comparado ao Gemini 2.0”

“Instalar isso localmente é surpreendentemente fácil se você usar o SGLang”

“Benchmarks no HumanEval mostram que ele está essencialmente em paridade com o GPT-5”

“A context window torna pipelines de RAG quase redundantes para projetos de médio porte”

“O desempenho em benchmarks de coding é atualmente inigualável por qualquer outro model de pesos abertos”

“Ele iguala ou supera os melhores modelos closed em refatoração de bases de código massivas”

“A implementação de engram memory é uma maravilha técnica neste espaço”

“Estamos vendo 90% de precisão lógica no Thinking Mode para matemática de olimpíada”

“Este lançamento efetivamente democratiza a inteligência de trilhões de parâmetros”

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA

Automacao Web

Fluxos Inteligentes

Comece Gratis

Dicas Profissionais para DeepSeek v4

Dicas de especialistas para ajuda-lo a aproveitar ao maximo DeepSeek v4 e obter melhores resultados.

Alternar Modos de Pensamento

Use o modo padrão para conversas rápidas e reserve o Thinking Mode especificamente para coding e provas lógicas.

Aproveite o Context Caching

Utilize recursos integrados de context caching para reduzir custos em até 90% ao usar prompts de long context repetitivos.

Entrada Multimodal Direta

Envie arquivos de áudio e vídeo brutos diretamente para a API para se beneficiar da arquitetura nativa em vez de realizar transcrições prévias.

Otimização de System Prompt

Forneça esquemas JSON claros ou instruções de tool-use no system prompt para um comportamento agentic altamente confiável.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context

$0.95/$4.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Perguntas Frequentes Sobre DeepSeek v4

Encontre respostas para perguntas comuns sobre DeepSeek v4