Para apps para dispositivos móveis e da Web, os SDKs Firebase AI Logic permitem interagir com os modelos Gemini e Imagen 3 com suporte diretamente no app.
Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. Os modelos Imagen 3 podem ser solicitados com texto para gerar imagens.
A tabela a seguir é uma visão geral dos modelos compatíveis com Firebase AI Logic e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de visualização e experimentais disponíveis para casos de uso de prototipagem.
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Gemini com versões estáveis | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON (imagens e áudio em breve) |
Nosso modelo multimodal com recursos de última geração e recursos aprimorados, incluindo velocidade superior, uso de ferramentas integradas e uma janela de contexto de 1 milhão de tokens (geração multimodal em breve) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do Flash 1.5 que querem qualidade melhor pelo mesmo preço e velocidade. |
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo de raciocínio mais avançado, capaz de resolver problemas complexos. |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo de pensamento que oferece recursos excelentes e completos. Ele foi projetado para oferecer um equilíbrio entre preço e desempenho. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
texto (streaming), áudio (streaming) |
texto (streaming), áudio (streaming) |
Nosso modelo multimodal que oferece suporte a streaming em tempo real de baixa latência de entradas e saídas multimodais. |
Modelos Imagen 3 (ao usar com Firebase AI Logic) | |||
Imagen 3imagen-3.0-generate-002 |
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |
1 Não tem suporte ao usar o Gemini Developer API
com SDKs Firebase AI Logic.
2 Não é compatível com o Gemini Developer API, independente
de como você acessa a API.
Consulte também nossas Perguntas frequentes sobre todos os modelos compatíveis e não compatíveis com Firebase AI Logic.
O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.
-
- Entrada e saída com suporte
- Comparação de alto nível dos recursos com suporte
- Especificações e limitações, por exemplo, tokens de entrada máximos ou comprimento máximo de vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estáveis, atualizadas automaticamente, de pré-lançamento e experimentais
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas com suporte para os modelos
Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos.
Comparação de modelos
Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Observe que cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter recursos adicionais que não estão disponíveis ao usar nossos SDKs.
Se você não encontrar as informações que está procurando nas subseções a seguir, consulte a documentação do provedor de API escolhido para encontrar ainda mais informações:
Gemini Developer API: modelos Gemini e modelos Imagen
Vertex AI Gemini API: modelos Gemini e modelos Imagen
Entrada e saída com suporte
Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
Tipos de entrada | ||||||||
Texto | ||||||||
Texto (streaming) | ||||||||
Código | ||||||||
Documentos (PDFs ou texto simples) |
||||||||
Imagens | ||||||||
Vídeo | ||||||||
Áudio | ||||||||
Áudio (streaming) | ||||||||
Tipos de saída | ||||||||
Texto | ||||||||
Texto (streaming) | ||||||||
Código | ||||||||
Saída estruturada (como JSON) |
||||||||
Imagens | Em breve | |||||||
Áudio | Em breve | |||||||
Áudio (streaming) |
Para saber mais sobre os tipos de arquivos aceitos, consulte Requisitos e arquivos de entrada compatíveis.
Recursos e recursos compatíveis
Estes são os recursos e os recursos com suporte ao usar cada modelo com Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
Gerar texto com base em entradas somente de texto ou multimodais | somente streaming | |||||
Gerar imagens (Imagen 3) |
em breve | |||||
Gerar áudio | Em breve | somente streaming | ||||
Gerar
saída estruturada
(como JSON) |
||||||
Analisar documentos
(PDFs ou texto simples) |
||||||
Analisar imagens (visão) | ||||||
Analisar vídeo (visão) | ||||||
Analisar áudio | somente streaming | |||||
Chat multiturno | ||||||
Chamadas de função (ferramentas) | ||||||
Contar tokens | ||||||
Instruções do sistema | ||||||
Streaming multimodal bidirecional |
Especificações e limitações
Estas são as especificações e limitações ao usar cada modelo com Firebase AI Logic:
Propriedade |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
Janela de contexto * Limite total de tokens (entrada+saída combinadas) |
1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 32.768 tokens | 480 tokens | |
Limite de token de saída * | 65.536 tokens | 65.536 tokens | 8.192 tokens | 8.192 tokens | --- | --- | |
Data limite de conhecimento | Janeiro de 2025 | Janeiro de 2025 | Junho de 2024 | Junho de 2024 | Agosto de 2024 | --- | |
PDFs (por solicitação) | |||||||
Número máximo de arquivos PDF de entrada ** |
3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | --- | --- | |
Número máximo de páginas por arquivo PDF de entrada ** |
1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | --- | --- | |
Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | |
Imagens (por solicitação) | |||||||
Número máximo de imagens de entrada |
3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | --- | --- | |
Número máximo de imagens de saída |
--- | --- | Em breve | --- | --- | 4 imagens | |
Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | |
Vídeo (por solicitação) | |||||||
Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | 10 arquivos | 10 arquivos | --- | --- | |
Duração máxima de todo o vídeo de entrada (somente frames) |
~60 minutos | ~60 minutos | ~60 minutos | ~60 minutos | --- | --- | |
Comprimento máximo de todo o vídeo de entrada (frames + áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | --- | --- | |
Áudio (por solicitação) | |||||||
Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | 1 arquivo | 1 arquivo | --- | --- | |
Número máximo de arquivos de áudio de saída |
--- | --- | Em breve | --- | --- | --- | |
Comprimento máximo de todo o áudio de entrada |
~8,4 horas | ~8,4 horas | ~8,4 horas | ~8,4 horas | --- | --- | |
Comprimento máximo de todo o áudio de saída |
--- | --- | Em breve | --- | --- | --- |
*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
então 100 tokens são cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível
determinar a contagem total de tokens nas solicitações usando
countTokens
.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Encontre mais informações detalhadas
As cotas e os preços são diferentes para cada modelo. Os preços também dependem da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada aceitos, como especificar o tipo MIME e como garantir que os arquivos de entrada e as solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Requisitos e arquivos de entrada compatíveis.
Controle de versões de modelo e padrões de nomenclatura
Os modelos são oferecidos nas versões estável, pré-lançamento e experimental. Para conveniência, há suporte para aliases sem valores de versão explícitos.
Para encontrar nomes de modelos específicos a serem usados no código, consulte a seção "Nomes de modelos disponíveis" mais adiante nesta página.
Tipo de versão / Etapa de lançamento |
Descrição | Padrão de nome do modelo | |
---|---|---|---|
Estável |
As versões estáveis estão disponíveis e têm suporte
para uso em produção a partir da data de lançamento.
Uma versão estável do modelo geralmente é lançada com uma data de desativação, que indica o último dia em que o modelo está disponível. Após essa data, o modelo não será mais acessível nem terá suporte do Google. |
Os nomes de modelos de versões estáveis são anexados a um número de versão de três dígitos específico.
Exemplo: |
|
Alias estável atualizado automaticamente | Os aliases estáveis atualizados automaticamente sempre apontam para a versão estável mais recente desse modelo. Se uma nova versão estável for lançada, o alias auto-atualizado vai começar a apontar para essa nova versão estável. |
Os nomes de modelos de aliases não têm apêndices
Exemplo: |
|
Visualizar |
As versões Pré-lançamento têm novos recursos e
são consideradas não estáveis.
As versões de pré-lançamento sempre apontam para a última versão de pré-lançamento desse modelo. Se uma nova versão de visualização for lançada, todas as versões de visualização atuais vão começar a apontar para essa nova versão. Esses modelos não são recomendados para uso em produção, têm limites de taxa mais restritivos e podem ter requisitos de faturamento. |
Os nomes de modelos de versões de pré-lançamento são anexados com
Exemplo: |
|
Experimental |
As versões experimentais têm novos recursos
e são consideradas não estáveis.
Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir a experimentação dos nossos recursos mais recentes. |
Os nomes de modelos de versões experimentais são anexados com
Exemplo: |
|
Aposentado |
As versões descontinuadas já passaram da data de descontinuação
e foram desativadas permanentemente.
Os modelos desativados não são mais acessíveis nem compatíveis com o Google. As solicitações que fazem referência a um ID de modelo desativado geralmente retornam um erro 404. |
--- |
Nomes de modelos disponíveis
Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo.
Listar de maneira programática todos os modelos disponíveis
É possível listar todos os nomes de modelos disponíveis usando a API REST:
Gemini Developer API: chama o endpoint
models.list
.Vertex AI Gemini API: chama o endpoint
publishers.models.list
.
A lista retornada inclui todos os modelos compatíveis com os
provedores de API, mas o Firebase AI Logic só aceita os
modelos Gemini e Imagen descritos nesta página.
Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash
) não são
listados porque são um alias de conveniência para o modelo básico.
Gemini nomes de modelos
Para conferir exemplos de inicialização para sua plataforma, consulte o guia de início.
Para saber mais sobre as fases de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.
Gemini 2.5 Pro nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Versão de pré-lançamento de Gemini 2.5 Pro | Visualizar | 2025-05-06 | A ser determinado |
gemini-2.5-pro-preview-03-25 |
Versão de pré-lançamento apontando para gemini-2.5-pro-preview-05-06 (que é a versão de pré-lançamento mais recente) |
Visualizar | 25/03/2025 | A ser determinado |
Gemini 2.5 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
Versão de pré-lançamento de Gemini 2.5 Flash | Visualizar | 2025-04-17 | A ser determinado |
Gemini 2.0 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-001 |
Versão estável mais recente do Gemini 2.0 Flash | Estável | 2025-02-05 | A partir de 2026-02-05 |
gemini-2.0-flash |
Alias atualizado automaticamente que aponta para a versão estável mais recente do Flash 2.0 (atualmente gemini-2.0-flash-001 |
Estável | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Versão estável mais recente do Gemini 2.0 Flash‑Lite | Estável | 2025-02-25 | A partir de 2026-02-25 |
gemini-2.0-flash-lite |
Alias atualizado automaticamente que aponta para a versão estável mais recente do Flash-Lite 2.0 (atualmente gemini-2.0-flash-lite-001 |
Estável | 2025-02-25 | --- |
Gemini 2.0 Flash‑Live nomes de modelos
Disponível apenas ao usar o Vertex AI Gemini API como seu provedor de API. |
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Versão de pré-lançamento para Gemini 2.0 Flash‑Live | Visualizar | 2025-04-09 | A ser determinado |
1 Não tem suporte ao usar o Gemini Developer API com SDKs Firebase AI Logic.
Imagen nomes de modelos
Para conferir exemplos de inicialização para sua plataforma, consulte o guia de geração de imagens com Imagen.
Para saber mais sobre as fases de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.
Imagen 3 nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-3.0-generate-002 |
Versão estável mais recente do Imagen 3 | Estável | 2025-01-23 | A partir de 23/01/2026 |
imagen-3.0-generate-001 2 |
Versão estável inicial de Imagen 3 | Estável | 2024-07-31 | A partir de 31-07-2025 |
Imagen 3 Fast nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Versão estável inicial de Imagen 3 Fast | Estável | 2024-07-31 | A partir de 31-07-2025 |
2 Não é compatível com o Gemini Developer API, independente de como você acessa a API.
Idiomas disponíveis
Gemini
Todos os modelos Gemini podem entender e responder nos seguintes idiomas:
Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes idiomas adicionais:
Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)
Imagen
Disponibilidade geral: inglês
Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol
Informações sobre modelos mais antigos
Firebase AI Logic oferece suporte aos modelos Gemini ativos mais antigos (como os modelos Gemini 1.5).
Firebase AI Logic não oferece suporte aos modelos Imagen mais antigos (como Imagen 2).
Modelo | Entrada | Saída | Otimizado para |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto de 2 milhões |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho rápido e versátil em diversas tarefas |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Próximas etapas
Testar os recursos do Gemini API
- Crie conversas com vários turnos (chat).
- Gerar texto com base em comandos somente de texto.
- Gere texto solicitando vários tipos de arquivos, como imagens, PDFs, vídeos e áudio.
- Gere saída estruturada (como JSON) com comandos de texto e multimodais.
- Gerar imagens com base em comandos de texto.
- Transmita entrada e saída de stream (incluindo áudio) usando o Gemini Live API.
- Use a chamada de função para conectar modelos generativos a sistemas e informações externas.