Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e da Web, os SDKs Firebase AI Logic permitem interagir com os modelos Gemini e Imagen 3 com suporte diretamente no app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. Os modelos Imagen 3 podem ser solicitados com texto para gerar imagens.

A tabela a seguir é uma visão geral dos modelos compatíveis com Firebase AI Logic e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de visualização e experimentais disponíveis para casos de uso de prototipagem.

Modelo Entrada Saída Descrição
Modelos Gemini com versões estáveis
Gemini 2.0 Flash
gemini-2.0-flash-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON
(imagens e áudio em breve)
Nosso modelo multimodal com recursos de última geração e recursos aprimorados, incluindo velocidade superior, uso de ferramentas integradas e uma janela de contexto de 1 milhão de tokens (geração multimodal em breve)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do Flash 1.5 que querem qualidade melhor pelo mesmo preço e velocidade.
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem)
Gemini 2.5 Pro
gemini-2.5-pro-preview-05-06
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Nosso modelo de raciocínio mais avançado, capaz de resolver problemas complexos.
Gemini 2.5 Flash
gemini-2.5-flash-preview-04-17
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Nosso modelo de pensamento que oferece recursos excelentes e completos. Ele foi projetado para oferecer um equilíbrio entre preço e desempenho.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
texto (streaming),
áudio (streaming)
texto (streaming),
áudio (streaming)
Nosso modelo multimodal que oferece suporte a streaming em tempo real de baixa latência de entradas e saídas multimodais.
Modelos Imagen 3 (ao usar com Firebase AI Logic)
Imagen 3
imagen-3.0-generate-002
texto imagens Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
texto imagens Gera imagens para prototipagem ou casos de uso de baixa latência

1 Não tem suporte ao usar o Gemini Developer API com SDKs Firebase AI Logic.
2 Não é compatível com o Gemini Developer API, independente de como você acessa a API.

Consulte também nossas Perguntas frequentes sobre todos os modelos compatíveis e não compatíveis com Firebase AI Logic.


O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.

  • Comparar modelos:

    • Entrada e saída com suporte
    • Comparação de alto nível dos recursos com suporte
    • Especificações e limitações, por exemplo, tokens de entrada máximos ou comprimento máximo de vídeo de entrada
  • Descrição de como os modelos são versionados, especificamente as versões estáveis, atualizadas automaticamente, de pré-lançamento e experimentais

  • Listas de nomes de modelos disponíveis para incluir no código durante a inicialização

  • Listas de idiomas com suporte para os modelos

Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos.



Comparação de modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Observe que cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter recursos adicionais que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que está procurando nas subseções a seguir, consulte a documentação do provedor de API escolhido para encontrar ainda mais informações:

Entrada e saída com suporte

Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Tipos de entrada
Texto
Texto (streaming)
Código
Documentos
(PDFs ou texto simples)
Imagens
Vídeo
Áudio
Áudio (streaming)
Tipos de saída
Texto
Texto (streaming)
Código
Saída estruturada
(como JSON)
Imagens Em breve
Áudio Em breve
Áudio (streaming)

Para saber mais sobre os tipos de arquivos aceitos, consulte Requisitos e arquivos de entrada compatíveis.

Recursos e recursos compatíveis

Estes são os recursos e os recursos com suporte ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Gerar texto com base em entradas somente de texto ou multimodais somente streaming
Gerar imagens
(Imagen 3)
em breve
Gerar áudio Em breve somente streaming
Gerar saída estruturada
(como JSON)
Analisar documentos
(PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão)
Analisar áudio somente streaming
Chat multiturno
Chamadas de função (ferramentas)
Contar tokens
Instruções do sistema
Streaming multimodal bidirecional

Especificações e limitações

Estas são as especificações e limitações ao usar cada modelo com Firebase AI Logic:

Propriedade <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Janela de contexto *
Limite total de tokens
(entrada+saída combinadas)
1.048.576 tokens 1.048.576 tokens 1.048.576 tokens 1.048.576 tokens 32.768 tokens 480 tokens
Limite de token de saída * 65.536 tokens 65.536 tokens 8.192 tokens 8.192 tokens --- ---
Data limite de conhecimento Janeiro de 2025 Janeiro de 2025 Junho de 2024 Junho de 2024 Agosto de 2024 ---
PDFs (por solicitação)
Número máximo
de arquivos PDF de entrada **
3.000 arquivos 3.000 arquivos 3.000 arquivos 3.000 arquivos --- ---
Número máximo
de páginas
por arquivo PDF de entrada **
1.000 páginas 1.000 páginas 1.000 páginas 1.000 páginas --- ---
Tamanho máximo
por arquivo PDF de entrada
50 MB 50 MB 50 MB 50 MB --- ---
Imagens (por solicitação)
Número máximo
de imagens de entrada
3.000 imagens 3.000 imagens 3.000 imagens 3.000 imagens --- ---
Número máximo
de imagens de saída
--- --- Em breve --- --- 4 imagens
Tamanho máximo
por imagem codificada em base64 de entrada
7 MB 7 MB 7 MB 7 MB --- ---
Vídeo (por solicitação)
Número máximo
de arquivos de vídeo de entrada
10 arquivos 10 arquivos 10 arquivos 10 arquivos --- ---
Duração máxima
de todo o vídeo de entrada
(somente frames)
~60 minutos ~60 minutos ~60 minutos ~60 minutos --- ---
Comprimento máximo
de todo o vídeo de entrada
(frames + áudio)
aproximadamente 45 minutos aproximadamente 45 minutos aproximadamente 45 minutos aproximadamente 45 minutos --- ---
Áudio (por solicitação)
Número máximo
de arquivos de áudio de entrada
1 arquivo 1 arquivo 1 arquivo 1 arquivo --- ---
Número máximo
de arquivos de áudio de saída
--- --- Em breve --- --- ---
Comprimento máximo
de todo o áudio de entrada
~8,4 horas ~8,4 horas ~8,4 horas ~8,4 horas --- ---
Comprimento máximo
de todo o áudio de saída
--- --- Em breve --- --- ---

* Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres, então 100 tokens são cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.

** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.

Encontre mais informações detalhadas



Controle de versões de modelo e padrões de nomenclatura

Os modelos são oferecidos nas versões estável, pré-lançamento e experimental. Para conveniência, há suporte para aliases sem valores de versão explícitos.

Para encontrar nomes de modelos específicos a serem usados no código, consulte a seção "Nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão /
Etapa de lançamento
Descrição Padrão de nome do modelo
Estável As versões estáveis estão disponíveis e têm suporte para uso em produção a partir da data de lançamento.

Uma versão estável do modelo geralmente é lançada com uma data de desativação, que indica o último dia em que o modelo está disponível. Após essa data, o modelo não será mais acessível nem terá suporte do Google.

Os nomes de modelos de versões estáveis são anexados a um número de versão de três dígitos específico.

Exemplo: gemini-2.0-flash-001
Exemplo: imagen-3.0-generate-002

Alias estável atualizado automaticamente Os aliases estáveis atualizados automaticamente sempre apontam para a versão estável mais recente desse modelo. Se uma nova versão estável for lançada, o alias auto-atualizado vai começar a apontar para essa nova versão estável.

Os nomes de modelos de aliases não têm apêndices

Exemplo: gemini-2.0-flash

Visualizar As versões Pré-lançamento têm novos recursos e são consideradas não estáveis.

As versões de pré-lançamento sempre apontam para a última versão de pré-lançamento desse modelo. Se uma nova versão de visualização for lançada, todas as versões de visualização atuais vão começar a apontar para essa nova versão.

Esses modelos não são recomendados para uso em produção, têm limites de taxa mais restritivos e podem ter requisitos de faturamento.

Os nomes de modelos de versões de pré-lançamento são anexados com -preview e a data de lançamento do modelo (-MM-DD).

Exemplo: gemini-2.5-flash-preview-04-17
(lançado em 17 de abril de 2025)

Experimental As versões experimentais têm novos recursos e são consideradas não estáveis.

Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir a experimentação dos nossos recursos mais recentes.

Os nomes de modelos de versões experimentais são anexados com -exp e a data de lançamento do modelo (-MM-DD).

Exemplo: gemini-2.5-pro-exp-03-25
(lançado em 25 de março de 2025)

Aposentado As versões descontinuadas já passaram da data de descontinuação e foram desativadas permanentemente.

Os modelos desativados não são mais acessíveis nem compatíveis com o Google. As solicitações que fazem referência a um ID de modelo desativado geralmente retornam um erro 404.

---



Nomes de modelos disponíveis

Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo.

Listar de maneira programática todos os modelos disponíveis

É possível listar todos os nomes de modelos disponíveis usando a API REST:

A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só aceita os modelos Gemini e Imagen descritos nesta página. Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo básico.

Gemini nomes de modelos

Para conferir exemplos de inicialização para sua plataforma, consulte o guia de início.

Para saber mais sobre as fases de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.

Gemini 2.5 Pro nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-pro-preview-05-06 Versão de pré-lançamento de Gemini 2.5 Pro Visualizar 2025-05-06 A ser determinado
gemini-2.5-pro-preview-03-25 Versão de pré-lançamento apontando para gemini-2.5-pro-preview-05-06
(que é a versão de pré-lançamento mais recente)
Visualizar 25/03/2025 A ser determinado

Gemini 2.5 Flash nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-preview-04-17 Versão de pré-lançamento de Gemini 2.5 Flash Visualizar 2025-04-17 A ser determinado

Gemini 2.0 Flash nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.0-flash-001 Versão estável mais recente do Gemini 2.0 Flash Estável 2025-02-05 A partir de
2026-02-05
gemini-2.0-flash Alias atualizado automaticamente que aponta para a versão estável mais recente do Flash 2.0
(atualmente gemini-2.0-flash-001)
Estável 2025-02-10 ---

Gemini 2.0 Flash‑Lite nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.0-flash-lite-001 Versão estável mais recente do Gemini 2.0 Flash‑Lite Estável 2025-02-25 A partir de
2026-02-25
gemini-2.0-flash-lite Alias atualizado automaticamente que aponta para a versão estável mais recente do Flash-Lite 2.0
(atualmente gemini-2.0-flash-lite-001)
Estável 2025-02-25 ---

Gemini 2.0 Flash‑Live nomes de modelos

Disponível apenas ao usar o Vertex AI Gemini API como seu provedor de API.

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.0-flash-live-preview-04-09 1 Versão de pré-lançamento para Gemini 2.0 Flash‑Live Visualizar 2025-04-09 A ser determinado

1 Não tem suporte ao usar o Gemini Developer API com SDKs Firebase AI Logic.

Imagen nomes de modelos

Para conferir exemplos de inicialização para sua plataforma, consulte o guia de geração de imagens com Imagen.

Para saber mais sobre as fases de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.

Imagen 3 nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-3.0-generate-002 Versão estável mais recente do Imagen 3 Estável 2025-01-23 A partir de 23/01/2026
imagen-3.0-generate-001 2 Versão estável inicial de Imagen 3 Estável 2024-07-31 A partir de 31-07-2025

Imagen 3 Fast nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-3.0-fast-generate-001 2 Versão estável inicial de Imagen 3 Fast Estável 2024-07-31 A partir de 31-07-2025

2 Não é compatível com o Gemini Developer API, independente de como você acessa a API.



Idiomas disponíveis

Gemini

  • Todos os modelos Gemini podem entender e responder nos seguintes idiomas:

    Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)

  • Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes idiomas adicionais:

    Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)

Imagen

  • Disponibilidade geral: inglês

  • Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol



Informações sobre modelos mais antigos

Firebase AI Logic oferece suporte aos modelos Gemini ativos mais antigos (como os modelos Gemini 1.5).

Firebase AI Logic não oferece suporte aos modelos Imagen mais antigos (como Imagen 2).

Modelo Entrada Saída Otimizado para
Gemini 1.5 Pro
gemini-1.5-pro-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto de 2 milhões
Gemini 1.5 Flash
gemini-1.5-flash-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece desempenho rápido e versátil em diversas tarefas
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
texto, código, PDFs, imagens, vídeo (somente frames) text, code Processa texto, imagens e vídeos para respostas de texto ou código. Não pode ser usado para chat.
Gemini 1.0 Pro
gemini-1.0-pro-002
text, code text, code Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código



Próximas etapas

Testar os recursos do Gemini API