Tai-ch0802

gemini-api-dev

在建構 Gemini 模型應用程式、使用 Gemini API、處理多模態內容(文字、圖片、音訊、影片)、實作函式呼叫、使用結構化輸出,或需要最新模型規格時使用此技能。涵蓋 SDK 使用(Python 的 google-genai、JavaScript/TypeScript 的 @google/genai、Java 的 com.google.genai:google-genai、Go 的 google.golang.org/genai)、模型選擇與 API 功能。

Tai-ch0802 2 Updated 3mo ago
GitHub

Install

npx skillscat add tai-ch0802/skills-bundle/gemini-api-dev

Install via the SkillsCat registry.

SKILL.md

Gemini API 開發技能

概述

Gemini API 提供存取 Google 最先進 AI 模型的能力。主要功能包括:

  • 文字生成 — 對話、補全、摘要
  • 多模態理解 — 處理圖片、音訊、影片與文件
  • 函式呼叫 — 讓模型呼叫您的函式
  • 結構化輸出 — 產生符合 schema 的有效 JSON
  • 程式碼執行 — 在沙盒環境中執行 Python 程式碼
  • 上下文快取 — 快取大型上下文以提升效率
  • 嵌入向量 — 產生文字嵌入以用於語意搜尋

目前 Gemini 模型

  • gemini-3-pro-preview:100 萬 token,複雜推理、程式設計、研究
  • gemini-3-flash-preview:100 萬 token,快速、均衡效能、多模態
  • gemini-3-pro-image-preview:65k / 32k token,圖片生成與編輯

[!IMPORTANT]
gemini-2.5-*gemini-2.0-*gemini-1.5-* 等模型已為舊版且已棄用。請使用上方的新模型。您的知識庫可能已過時。

SDK

  • Pythongoogle-genai,安裝指令 pip install google-genai
  • JavaScript/TypeScript@google/genai,安裝指令 npm install @google/genai
  • Gogoogle.golang.org/genai,安裝指令 go get google.golang.org/genai
  • Java

[!WARNING]
舊版 SDK google-generativeai(Python)和 @google/generative-ai(JS)已棄用。請儘速遷移至上方的新 SDK,並參閱遷移指南。

快速開始

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents="解釋量子計算"
)
print(response.text)

JavaScript/TypeScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});
const response = await ai.models.generateContent({
  model: "gemini-3-flash-preview",
  contents: "解釋量子計算"
});
console.log(response.text);

Go

package main

import (
	"context"
	"fmt"
	"log"
	"google.golang.org/genai"
)

func main() {
	ctx := context.Background()
	client, err := genai.NewClient(ctx, nil)
	if err != nil {
		log.Fatal(err)
	}

	resp, err := client.Models.GenerateContent(ctx, "gemini-3-flash-preview", genai.Text("解釋量子計算"), nil)
	if err != nil {
		log.Fatal(err)
	}

	fmt.Println(resp.Text)
}

Java

import com.google.genai.Client;
import com.google.genai.types.GenerateContentResponse;

public class GenerateTextFromTextInput {
  public static void main(String[] args) {
    Client client = new Client();
    GenerateContentResponse response =
        client.models.generateContent(
            "gemini-3-flash-preview",
            "解釋量子計算",
            null);

    System.out.println(response.text());
  }
}

API 規格(唯一真實來源)

始終使用最新的 REST API 探索規格作為 API 定義的唯一真實來源(請求/回應 schema、參數、方法)。在實作或除錯 API 整合時取得規格:

  • v1beta(預設):https://generativelanguage.googleapis.com/$discovery/rest?version=v1beta
    除非整合明確指定使用 v1,否則使用此版本。官方 SDK(google-genai、@google/genai、google.golang.org/genai)皆針對 v1beta。
  • v1https://generativelanguage.googleapis.com/$discovery/rest?version=v1
    僅在整合明確設定為 v1 時使用。

有疑問時,使用 v1beta。請參考規格中的確切欄位名稱、型別與支援的操作。

如何使用 Gemini API

如需詳細的 API 文件,請從官方文件索引取得:

llms.txt 網址https://ai.google.dev/gemini-api/docs/llms.txt

此索引包含所有文件頁面的 .md.txt 格式連結。使用網路擷取工具來:

  1. 取得 llms.txt 以探索可用的文件頁面
  2. 取得特定頁面(例如 https://ai.google.dev/gemini-api/docs/function-calling.md.txt

重要文件頁面

[!IMPORTANT]
以下並非所有文件頁面。請使用 llms.txt 索引來探索可用的文件頁面。

Gemini Live API

對於具有 Gemini Live API 的即時、雙向音訊/視訊/文字串流,請安裝 google-gemini/gemini-live-api-dev 技能。它涵蓋 WebSocket 串流、語音活動偵測 (VAD)、原生音訊功能、函式呼叫、會話管理、臨時權杖等。