2022年に発表されたStable Diffusionは、AI分野、特にテキストからイメージを生成する分野における重要なマイルストーンとなりました。Diffusionテクニックに基づくこのモデルは、AIの進歩が続く中で象徴的な存在です。本文では、Stable Diffusion APIの使い方を皆さんに紹介します。
このガイドを参照して、Stable Diffusion API経由で自分のアプリをもStable Diffusionサービスに簡単に連携することができると思います。
また、Apidogは完全無料で利用可能なツールになりますが、次のボタンからこのツールを無料で取得することが可能です。
Stable Diffusionとは
Stable Diffusionは、Stability AIが開発したオープンソースの画像生成AIモデルです。テキストプロンプトから高品質の画像を生成することができます。

主な特徴は以下の通りです:
- テキスト・画像ペアのデータセットを用いて学習された潜在拡散モデル(Latent Diffusion Model)に基づいています。
- ユーザーが入力したテキストプロンプトから、写真のようにリアルな画像や、絵画風・イラスト風の画像など、様々なスタイルの画像を生成できます。
- オープンソースで公開されているため、誰でも自由に利用・改変することができます。商用利用も可能です。
- 比較的少ない計算リソースで動作するため、パーソナルコンピュータでも利用可能です。
- 学習に使用された画像の著作権の扱いや、生成された画像の責任の所在など、法的・倫理的な課題も指摘されています。
Stable Diffusionは、画像生成AIの民主化に大きく貢献し、クリエイティブな表現の可能性を広げるツールとして注目を集めています。一方で、悪用のリスクもはらんでおり、技術の発展と並行して、適切な利用のためのルール作りが求められています。
Stable Diffusion APIとは?
そもそもStabele Diffusion APIとは何ですか?
Stable Diffusion APIは、Stability AIが提供するクラウドベースのAPIサービスで、開発者がStable Diffusionの機能を自身のアプリケーションやサービスに組み込むことを可能にします。
Stable Diffusion APIを使えば、開発者、アーティスト、エンスージアストは、ローカルセットアップや特殊なハードウェアを必要とせずに、Stable Diffusionモデルを使ってAIイメージを生成できます。クラウドコンピューティングの力を活用することで、APIはスムーズで効率的な体験を実現し、ユーザーが簡単に高品質のイメージを生成できるようになります。
Stable Diffusion APIにできること
それでは、Stable Diffusion APIを通じて、どのような作業が実現されることが可能ですか。次は、Stable Diffusion APIの主な機能を皆さんに紹介します。
テキストから画像生成(Text-to-Image)
- ユーザーが入力したテキストプロンプトから、対応する画像を生成します。
- 生成する画像のスタイルや特徴を、プロンプトで指定することができます。
画像から画像生成(Image-to-Image)
- 入力画像とテキストプロンプトに基づいて、入力画像を変換・編集した新しい画像を生成します。
- 例えば、入力画像のスタイルを変更したり、新しい要素を追加したりすることができます。
画像のアップスケーリング(Upscaling)
- 低解像度の画像を入力として、高解像度の画像を生成します。
- 画質を維持しながら、画像のサイズを拡大することができます。
マスキングによる編集(Inpainting)
- 画像の一部をマスクで指定し、その部分をテキストプロンプトに基づいて編集・変更します。
- 例えば、画像の背景を変更したり、オブジェクトを追加・削除したりすることができます。
ということでStable Diffusion APIを利用することで、開発者は以下のようなアプリケーションやサービスを作成できます:
- カスタムデザインジェネレーター
- 画像編集ツール
- 仮想試着サービス
- ゲームやバーチャルワールドのアセット生成
- クリエイティブなソーシャルメディアフィルター
などです。
APIを使うことで、開発者は自身でStable Diffusionモデルをトレーニングしたり、高性能なハードウェアを用意したりすることなく、Stable Diffusionの機能を手軽に利用できます。これにより、画像生成AIを活用した新しいサービスやアプリケーションの開発が促進されています。
また、最新のアップデートにより、Stable Video Diffusionモデルによって動画の生成もできるようになりましたので、必要に応じてStable Diffusion APIを経由で動画の生成もできます。
例:Stability.aiの動画出力
Stable Diffusion APIの利用料金
Stable Diffusion APIに新しく登録すると、自動的に25個の無料クレジットが付与されます。このクレジットはDreamStudioとStable Diffusion APIの両方でも使用できます。
その以降、クレジットを追加購入する場合は、100クレジットにつき、1米ドルがかかります。標準のイメージ生成では、ステップ=30で0.2クレジットが必要です。
ご案内:"ステップ"とは、イメージ生成プロセスで実行される繰り返し回数やDiffusionステップの回数を指します。

モデルによって生成コストが異なります。以下が比較です。
画像
モデル | Stable Diffusion XL 1.0 | Stable Diffusion 1.6 |
---|---|---|
機能 | 標準 | 高速処理 |
価格 (ステップ=30) | 0.20 | 0.24 |
編集(Editing)
Search-and-Replace | Inpaint | |
---|---|---|
機能 | 画像の一部を置き換え | 画像の一部を補完 |
価格 | 4.00 | 3.00 |
アップスケーリング(Upscaling)
Creative Upscale | Real-ESRGAN x2 | |
---|---|---|
機能 | 4Kへの品質・パフォーマンス改善 | 細部の強調 |
価格 | 25.00 | 0.2 |
ビデオ
- 機能: 短いビデオを生成
- 価格: 20.00
Stable Diffusion API認証
Stable Diffusion APIを使用する前に、認証するために、APIキーを取得する必要があります。次は、ステップバイステップの認証用APIキーを取得するチュートリアルになります。
- stability.aiでアカウントを作成します。

2. アカウントページで右上にあるプロファイルのアイコンをクリックします。

3. ここで左側のメニューから「API Keys」を選択して、「+Create API Key」ボタンをクリックすることで、APIキーを生成して取得できます。

Stable Diffusion APIの利用を始める
APIキートークンを取得したら、Apidogというツールが使えます。ApidogはAPIの設計、デバッグ、テスト、ドキュメント化、モック化を1つのツールで行えるオールインワンのAPI開発ツールです。ApidogはゼロからAPIを構築したり、既存のAPIをインポートしたりと、柔軟に対応できます。
また、ApidogのAPI Hubでは、Stable Diffusion APIプロジェクトを直ちに利用することもできますので、次のページにアクセスすると、オンラインでStable Diffusion APIを利用したり、テストしたりすることができます。

ApidogでStable Diffusion APIを使用
Apidogを利用することで、簡単にStable Diffusion APIを利用することができます。
使用例1:残高の確認
ApidogのStable Diffusion APIプロジェクトにアクセスすると、左側のメニューからStable Diffusion APIの全てのエンドポイントが表示されます。そこから必要なものを選択できます。例えば、残高を確認するために、「balance」を選択します。
Method: GET
Endpoint: https://api.stability.ai/v1/user/balance
ここで右側パネルで「Try it out」ボタンをクリックして、直ちに利用することができます。

そして、Headersタブに切り替え、AuthorizationフィールドにAPIキーを設定します。

リクエストを送信すると、残高の情報が返されます。

使用例⒉テキストからイメージ生成
また、Stable Diffusion APIを利用して、テキストからイメージを生成する方法を紹介します。同じくApidogでのStable Diffusion APIプロジェクトからtext-to-imageというエンドポイントを選択します。
Method: POST
endpoint: https://api.stability.ai/v1/generation/{engine_id}/text-to-image
そして、必要なパスパラメータを記述:
- engine_id: モデルのバージョン (文字列)

本文のパラメータ (必須項目のみ指定):
- text_prompts:
- "text": "画像に関する説明"
- "weight": オプション
例:
"text_prompts": [
{
"text": "画像に関する説明",
"weight": 0.5
}
]

結果:

base64の文字列をコピーし、base64からイメージへの変換ツールを使ってイメージを取得します。

クライアントコードを生成してStable Diffusionに連携
また、Apidogを使って、Stable Diffusion APIをテストして、それが問題なく動作できることを確認した上、Apidogを利用して、Stable Diffusion APIのクライアントコードを生成することもできます。プロジェクトが使用しているプログラミング言語が何であっても、Apidogはその言語のクライアントコードを生成することもできますので、Stable Diffusionサービスに連携することも楽々なことになりますね。

まとめ
この記事では、Stable Diffusion APIの基本情報、料金、及び簡単に利用できる方法を皆さんに紹介しました。
ApidogのAPI Hubでは、Stable Diffusion APIプロジェクトを直ちに利用することもできますので、オンラインでStable Diffusion APIを利用したり、テストしたりすることが必要となる場合、非常に役に立ちます。