Prompt API

公開日: 2025 年 5 月 20 日

商品の解説 ウェブ 拡張機能 Chrome のステータス インテント
GitHub 試験運用版 EPP の場合 Chrome ベータ版 Chrome 137 ベータ版 表示 テストの目的

Prompt API を使用すると、ブラウザで Gemini Nano に自然言語リクエストを送信できます。

Prompt API は Chrome 拡張機能で利用可能です。ウェブ デベロッパーは、早期プレビュー プログラムに参加することで、Chrome Canary で探索 API を使用できます。この API はまもなく初期試用版で利用可能になります。

Prompt API を使用する方法は数多くあります。ウェブ アプリケーションまたはウェブサイトでは、次のことを作成できます。

  • AI を活用した検索: ウェブページのコンテンツに基づいて質問に回答します。
  • パーソナライズされたニュース フィード: 記事をカテゴリで動的に分類し、ユーザーがそのコンテンツをフィルタできるようにするフィードを作成します。

Chrome 拡張機能では、次のものを作成できます。

  • カレンダーの予定。ウェブページから予定の詳細を自動的に抽出する Chrome 拡張機能を開発して、ユーザーが数ステップでカレンダーの予定を作成できるようにします。
  • 連絡先の抽出。ウェブサイトから連絡先情報を抽出する拡張機能を作成して、ユーザーがビジネスに連絡したり、連絡先リストに詳細情報を追加したりしやすくします。

これらはほんの一例にすぎません。皆様がどのようなものを作成されるか楽しみにしております。

Prompt API を使用する

LanguageModel 名前空間で使用できる主な関数は次の 2 つです。

  • availability(): モデルの機能と利用可能かどうかを確認します。
  • create(): 言語モデル セッションを開始します。

モデルのダウンロード

Prompt API は、Chrome の Gemini Nano モデルを使用します。API は Chrome に組み込まれていますが、拡張機能が API を初めて使用するときにモデルが個別にダウンロードされます。

モデルが使用可能かどうかを確認するには、非同期の LanguageModel.availability() 関数を呼び出します。次のいずれかのレスポンスが返されます。

  • "unavailable" は、ブラウザがリクエストされたオプションをサポートしていないか、言語モデルのプロンプトをまったくサポートしていないことを意味します。
  • "downloadable" は、ブラウザがリクエストされたオプションをサポートしていることを意味しますが、それらのオプションを使用してセッションを作成するには、何か(言語モデル自体やファインチューニングなど)をダウンロードする必要があります。
  • "downloading" は、ブラウザがリクエストされたオプションをサポートしていることを意味します。ただし、これらのオプションを使用してセッションを作成するには、進行中のダウンロード オペレーションを完了する必要があります。
  • "available" は、ブラウザが新しいダウンロードを必要とせずにリクエストされたオプションをサポートしていることを意味します。

availability() へのレスポンスが 'downloadable' の場合、ダウンロードの進行状況をリッスンし、ダウンロードに時間がかかる場合はユーザーに通知します。

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
    });
  },
});

マルチモーダル機能

Prompt API は、ローカルでの試験運用用に、Chrome 138 Canary からの音声入力と画像入力をサポートしています。API はテキスト出力を返します。

これらの機能により、次のことができます。

  • ユーザーがチャット アプリで送信された音声メッセージを文字起こしできるようにします。
  • ウェブサイトにアップロードされた画像を説明して、キャプションや代替テキストに使用します。

お寄せいただいたフィードバックは、この API の今後の開発と Gemini Nano の改善に役立てさせていただきます。専用のタスク API(音声文字変換や画像の説明用の API など)が作成される可能性もあります。これにより、お客様とユーザーのニーズを満たすことができます。

参加してフィードバックを共有する

ご意見は、この API とすべての組み込み AI API の今後のバージョンの構築と実装に直接影響します。