針對行動和網頁應用程式,Firebase AI Logic SDK 可讓您直接透過應用程式與支援的 Gemini 模型和 Imagen 3 模型互動。
Gemini 模型屬於多模態,因為它們能夠處理甚至產生多種型態,包括文字、程式碼、PDF、圖片、影片和音訊。Imagen 3 模型可透過文字產生圖片。
下表簡要總結 Firebase AI Logic 支援的型號,以及最新的穩定型號。這份表格也會列出可用於原型設計用途的預覽和實驗模型。
模型 | 輸入 | 輸出 | 說明 |
---|---|---|---|
Gemini 穩定版本的模型 | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON (圖片和音訊即將推出!) |
我們的多模態模型提供新一代功能和強化功能,包括優異的速度、內建工具使用方式,以及 100 萬個符號上下文視窗 (多模態生成功能即將推出!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 最快速且最具成本效益的 Flash 模型。這是 1.5 Flash 使用者升級的途徑,可讓他們以相同的價格和速度獲得更優質的品質。 |
Gemini 模型,僅提供預覽和實驗版本 (僅建議用於原型設計用途) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | Google 最先進的推理模型,可以解決複雜問題。 |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 我們的推理模型提供多元且強大的功能。這項服務旨在兼顧價格和效能。 |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
文字 (串流)、 音訊 (串流) |
文字 (串流)、 音訊 (串流) |
我們的多模態模型支援低延遲即時串流的多模態輸入和輸出。 |
Imagen 3 模型 (與 Firebase AI Logic 搭配使用時) | |||
Imagen 3imagen-3.0-generate-002 |
文字 | 圖片 | 根據自然語言文字提示生成逼真且高品質的圖片 |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
文字 | 圖片 | 產生圖像,用於原型設計或低延遲用途 |
1 如果將 Gemini Developer API 與 Firebase AI Logic SDK 搭配使用,則不支援。
2 無論您如何存取 API,Gemini Developer API 皆不支援。
此外,請參閱常見問題,瞭解 Firebase AI Logic 支援和不支援的所有型號。
本頁的其餘部分會提供 Firebase AI Logic 支援的模型詳細資訊。
比較模式:
- 支援的輸入和輸出
- 支援功能的概略比較
- 規格和限制,例如輸入符記上限或輸入影片長度上限
說明模型的版本編號方式,特別是穩定版、自動更新版、預覽版和測試版
在初始化期間要納入程式碼的可用模型名稱清單
模型支援的語言清單
你可以在本頁底部查看舊型機型的詳細資訊。
比較模式
每個模型的功能各有不同,可支援各種用途。請注意,本節中的每個表格都會說明與 Firebase AI Logic 搭配使用時的每個模型。每個模型可能都有額外功能,這些功能在使用 SDK 時無法使用。
如果您在下列子節中找不到所需資訊,可以前往所選 API 供應商的說明文件,進一步瞭解相關資訊:
支援的輸入和輸出
以下是搭配 Firebase AI Logic 使用各個模型時支援的輸入和輸出類型:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 版 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
輸入類型 | ||||||||
文字 | ||||||||
文字 (串流) | ||||||||
程式碼 | ||||||||
文件 (PDF 或純文字) |
||||||||
圖片 | ||||||||
影片 | ||||||||
音訊 | ||||||||
音訊 (串流) | ||||||||
輸出類型 | ||||||||
文字 | ||||||||
文字 (串流) | ||||||||
程式碼 | ||||||||
結構化輸出內容 (例如 JSON) |
||||||||
圖片 | 敬請期待! | |||||||
音訊 | 敬請期待! | |||||||
音訊 (串流) |
如要瞭解支援的檔案類型,請參閱「支援的輸入檔案和相關規定」。
支援的功能
以下是搭配 Firebase AI Logic 使用各個模型時支援的功能和功能:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 版 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
從純文字或多模態輸入內容產生文字 | 僅限串流 | |||||
產生圖片 (Imagen 3) |
敬請期待! | |||||
生成音訊 | 敬請期待! | 僅限串流 | ||||
產生結構化輸出內容
(例如 JSON) |
||||||
分析文件
(PDF 或純文字) |
||||||
分析圖片 (視覺) | ||||||
分析影片 (視覺) | ||||||
分析音訊 | 僅限串流 | |||||
多輪對話 | ||||||
函式呼叫 (工具) | ||||||
計算符號數 | ||||||
系統指示 | ||||||
雙向多模態串流 |
規格和限制
以下是搭配 Firebase AI Logic 使用各個模型時的規格和限制:
屬性 |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 版 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
脈絡窗口 * 總符記限制 (輸入和輸出總和) |
1,048,576 個符記 | 1,048,576 個符記 | 1,048,576 個符記 | 1,048,576 個符記 | 32,768 個符記 | 480 個符記 | |
輸出符記限制 * | 65,536 個符記 | 65,536 個符記 | 8,192 個符記 | 8,192 個符記 | --- | --- | |
知識截點日期 | 2025 年 1 月 | 2025 年 1 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 8 月 | --- | |
PDF (每項要求) | |||||||
輸入 PDF 檔案的最大數量 ** |
3,000 個檔案 | 3,000 個檔案 | 3,000 個檔案 | 3,000 個檔案 | --- | --- | |
每個輸入 PDF 檔案的 頁數 上限 ** |
1,000 頁 | 1,000 頁 | 1,000 頁 | 1,000 頁 | --- | --- | |
每個輸入 PDF 檔案的大小上限 |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | |
圖片 (每個要求) | |||||||
輸入圖片的 數量上限 |
3,000 張圖片 | 3,000 張圖片 | 3,000 張圖片 | 3,000 張圖片 | --- | --- | |
輸出圖片的最大 數量 |
--- | --- | 敬請期待! | --- | --- | 4 張圖片 | |
每張輸入 Base64 編碼圖片的最大大小 |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | |
影片 (每項要求) | |||||||
輸入影片檔案的數量上限 |
10 個檔案 | 10 個檔案 | 10 個檔案 | 10 個檔案 | --- | --- | |
所有輸入影片 的長度上限 (僅限影格) |
約 60 分鐘 | 約 60 分鐘 | 約 60 分鐘 | 約 60 分鐘 | --- | --- | |
所有輸入影片 的長度上限 (影格 + 音訊) |
約 45 分鐘 | 約 45 分鐘 | 約 45 分鐘 | 約 45 分鐘 | --- | --- | |
音訊 (依要求) | |||||||
輸入音訊檔案的 數量上限 |
1 個檔案 | 1 個檔案 | 1 個檔案 | 1 個檔案 | --- | --- | |
輸出音訊檔案的 數量上限 |
--- | --- | 敬請期待! | --- | --- | --- | |
所有輸入音訊的長度上限 |
約 8.4 小時 | 約 8.4 小時 | 約 8.4 小時 | 約 8.4 小時 | --- | --- | |
所有輸出音訊的長度上限 |
--- | --- | 敬請期待! | --- | --- | --- |
*
對於所有 Gemini 模型,一個符記相當於約 4 個字元,因此 100 個符記相當於約 60 到 80 個英文單字。針對 Gemini 模型,您可以使用 countTokens
判斷要求中的權杖總數。
** PDF 會視為圖片,因此 PDF 的單頁會視為一張圖片。要求中允許的頁面數量,不得超過模型可支援的圖片數量。
取得其他詳細資訊
請參閱「支援的輸入檔案類型和相關規定」,瞭解支援的輸入檔案類型、如何指定 MIME 類型,以及如何確保輸入檔案和多模態要求符合規定並遵循最佳做法。
模型版本管理和命名模式
模型提供穩定、預覽和實驗版本。為方便起見,系統支援不含明確版本值的別名。
如要找出要在程式碼中使用的特定型號名稱,請參閱本頁後文的「可用型號名稱」一節。
版本類型 / 發布階段 |
說明 | 模型名稱模式 | |
---|---|---|---|
穩定版 |
穩定版已推出,並自發布日期起可供正式環境使用。 穩定版模型通常會在退役日期前發布,退役日期是指模型可用的最後一天。在該日期之後,Google 將不再提供這項模型的存取權或支援。 |
穩定版的模型名稱會附加特定的三位數版本號碼
示例: |
|
自動更新的穩定別名 | 自動更新的穩定別名一律會指向該模型的最新穩定版本。如果發布新的穩定版,自動更新別名會自動開始指向該新穩定版。 |
別名的模型名稱沒有附加字串
示例: |
|
預覽 |
預覽版具有新功能,且被視為不穩定。 預覽版本一律會指向該模型的最新 預覽版本。如果發布新的預先發布版,所有現有的預先發布版都會自動開始指向該新版。 這些模型不建議用於實際工作環境,且有更嚴格的費率限制,可能還有計費要求。 |
預覽版本的模型名稱會附上
範例: |
|
實驗功能 |
實驗版本具有新功能,且被視為不穩定。 這些模型不建議用於實際工作環境,且有更嚴格的速率限制。實驗模型的用意是收集意見回饋,並讓您試用最新功能。 |
實驗版本的模型名稱會加上
示例: |
|
退休 |
已停用的版本已過停用日期,並已永久停用。 Google 已不再提供舊型機型的存取權,也不再支援這些機型。 參照已停用的模型 ID 的要求通常會傳回 404 錯誤。 |
--- |
可用的型號名稱
模型名稱是在初始化模型時,在程式碼中加入的明確值。
透過程式列出所有可用模型
您可以使用 REST API 列出所有可用的模型名稱:
Gemini Developer API:呼叫
models.list
端點Vertex AI Gemini API:呼叫
publishers.models.list
端點
請注意,這個傳回清單會包含 API 供應商支援的所有模型,但 Firebase AI Logic 只支援本頁所述的 Gemini 和 Imagen 模型。另請注意,系統不會列出自動更新的別名 (例如 gemini-2.0-flash
),因為這些是基礎模型的方便性別名。
Gemini 模型名稱
如需平台的初始化範例,請參閱入門指南。
如要進一步瞭解發布階段 (特別是用途和帳單),請參閱模型版本和命名模式。
Gemini 2.5 Pro 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro 的預覽版 | 預覽 | 2025-05-06 | 待定 |
gemini-2.5-pro-preview-03-25 |
預覽版本指向 gemini-2.5-pro-preview-05-06 (這是最新的預先發布版) |
預覽 | 2025-03-25 | 待定 |
Gemini 2.5 Flash 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash 的預覽版 | 預覽 | 2025-04-17 | 待定 |
Gemini 2.0 Flash 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash 的最新穩定版 | 穩定 | 2025-02-05 | 2026-02-05 以後 |
gemini-2.0-flash |
自動更新別名,指向 2.0 Flash 的最新穩定版本 (目前為 gemini-2.0-flash-001 |
穩定 | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite 的最新穩定版 | 穩定 | 2025-02-25 | 不得早於 2026-02-25 |
gemini-2.0-flash-lite |
自動更新別名,指向 2.0 Flash-Lite 的最新穩定版本 (目前為 gemini-2.0-flash-lite-001 |
穩定 | 2025-02-25 | --- |
Gemini 2.0 Flash‑Live 模型名稱
僅限使用 Vertex AI Gemini API 做為 API 供應商時使用。 |
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Gemini 2.0 Flash‑Live 的預覽版本 | 預覽 | 2025-04-09 | 待定 |
1 如果將 Gemini Developer API 與 Firebase AI Logic SDK 搭配使用,則不支援。
Imagen 模型名稱
如需平台的初始化範例,請參閱「使用 Imagen 產生圖片」指南。
如要進一步瞭解發布階段 (特別是用途和帳單),請參閱模型版本和命名模式。
Imagen 3 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 的最新穩定版 | 穩定 | 2025-01-23 | 最早於 2026 年 1 月 23 日 |
imagen-3.0-generate-001 2 |
Imagen 3 的初始穩定版本 | 穩定 | 2024-07-31 | 最早於 2025-07-31 |
Imagen 3 Fast 模型名稱
模型名稱 | 說明 | 發布階段 | 發布日期 | 退休日期 |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast 的初始穩定版本 | 穩定 | 2024-07-31 | 最早於 2025-07-31 |
2 無論您如何存取 API,Gemini Developer API 皆不支援此功能。
支援的語言
Gemini
所有 Gemini 模型都能以以下語言理解及回應:
阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、簡體中文和繁體中文 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、丹麥文 (da)、荷蘭文 (nl)、英文 (en)、愛沙尼亞文 (et)、芬蘭文 (fi)、法文 (fr)、德文 (de)、希臘文 (el)、希伯來文 (iw)、北印度文 (hi)、匈牙利文 (hu)、印尼文 (id)、義大利文 (it)、日文 (ja)、韓文 (ko)、拉脫維亞文 (lv)、立陶宛文 (lt)、挪威文 (no)、波蘭文 (pl)、葡萄牙文 (pt)、羅馬尼亞文 (ro)、俄文 (ru)、塞爾維亞文 (sr)、斯洛伐克文 (sk)、斯洛維尼亞文 (sl)、西班牙文 (es)、斯瓦希里文 (sw)、瑞典文 (sv)、泰文 (th)、土耳其文 (tr)、烏克蘭文 (uk)、越南文 (vi)
Gemini 2.0 Flash、Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可使用下列其他語言進行理解和回應:
Afrikaans (af)、Amharic (am)、Assamese (as)、Azerbaijani (az)、 Belarusian (be)、Bosnian (bs)、Catalan (ca)、Cebuano (ceb)、Corsican (co)、 Welsh (cy)、Dhivehi (dv)、Esperanto (eo)、Basque (eu)、Persian (fa)、 Filipino (Tagalog) (fil)、Frisian (fy)、Irish (ga)、Scots Gaelic (gd)、 Galician (gl)、Gujarati (gu)、Hausa (ha)、Hawaiian (haw)、Hmong (hmn)、 Haitian Creole (ht)、Armenian (hy)、Igbo (ig)、Icelandic (is)、Javanese (jv)、 Georgian (ka)、Kazakh (kk)、Khmer (km)、Kannada (kn)、Krio (kri)、 Kurdish (ku)、Kyrgyz (ky)、Latin (la)、Luxembourgish (lb)、Lao (lo)、 Malagasy (mg)、Maori (mi)、Macedonian (mk)、Malayalam (ml)、Mongolian (mn)、 Meiteilon (Manipuri) (mni-Mtei)、Marathi (mr)、Malay (ms)、Maltese (mt)、 Myanmar (Burmese) (my)、Nepali (ne)、Nyanja (Chichewa) (ny)、 Odia (Oriya) (or)、Punjabi (pa)、Pashto (ps)、Sindhi (sd)、 Sinhala (Sinhalese) (si)、Samoan (sm)、Shona (sn)、Somali (so)、Albanian (sq)、 Sesotho (st)、Sundanese (su)、Tamil (ta)、Telugu (te)、Tajik (tg)、 Uyghur (ug)、Urdu (ur)、Uzbek (uz)、Xhosa (xh)、Yiddish (yi)、Yoruba (yo)、 Zulu (zu)
Imagen
正式發布:英文
預覽:簡體中文、繁體中文、北印度文、日文、韓文、葡萄牙文、西班牙文
舊型機型相關資訊
Firebase AI Logic 支援舊版的有效 Gemini 模型 (例如 Gemini 1.5 模型)。
Firebase AI Logic「不」支援較舊的 Imagen 型號 (例如 Imagen 2)。
模型 | 輸入 | 輸出 | 適合用途 |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 支援需要更多智慧的複雜推理工作; 200 萬個長脈絡 |
Gemini 1.5 Flashgemini-1.5-flash-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 在各種任務中提供快速且多功能的效能 |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
後續步驟
試用 Gemini API 的功能
- 建構多輪對話 (聊天)。
- 使用文字提示來生成文字。
- 透過提示各種檔案類型 (例如圖片、PDF 檔案、影片和音訊) 產生文字。
- 從文字和多模態提示產生結構化輸出內容 (例如 JSON)。
- 使用文字提示生成圖片。
- 使用 Gemini Live API 串流輸入和輸出 (包括音訊)。
- 使用函式呼叫,將生成模型連結至外部系統和資訊。