Stable Diffusion API使い方｜オンラインで利用・テスト

2022年に発表されたStable Diffusionは、AI分野、特にテキストからイメージを生成する分野における重要なマイルストーンとなりました。Diffusionテクニックに基づくこのモデルは、AIの進歩が続く中で象徴的な存在です。本文では、Stable Diffusion APIの使い方を皆さんに紹介します。

このガイドを参照して、Stable Diffusion API経由で自分のアプリをもStable Diffusionサービスに簡単に連携することができると思います。

💡

Stable Diffusion APIを自分のプロジェクトに導入したり、それを使って新しいプロジェクトを開発したりしたい場合、Apidogという完璧なAPI管理ツールを使うことがおすすめです。ApidogではStable Diffusion APIプロジェクトを便利にアクセスして、それを直ちに利用したり、テストしたり、自分のプロジェクトに導入したりすることができます。

また、Apidogは完全無料で利用可能なツールになりますが、次のボタンからこのツールを無料で取得することが可能です。

button

Stable Diffusionとは

Stable Diffusionは、Stability AIが開発したオープンソースの画像生成AIモデルです。テキストプロンプトから高品質の画像を生成することができます。

主な特徴は以下の通りです：

テキスト・画像ペアのデータセットを用いて学習された潜在拡散モデル(Latent Diffusion Model)に基づいています。
ユーザーが入力したテキストプロンプトから、写真のようにリアルな画像や、絵画風・イラスト風の画像など、様々なスタイルの画像を生成できます。
オープンソースで公開されているため、誰でも自由に利用・改変することができます。商用利用も可能です。
比較的少ない計算リソースで動作するため、パーソナルコンピュータでも利用可能です。
学習に使用された画像の著作権の扱いや、生成された画像の責任の所在など、法的・倫理的な課題も指摘されています。

Stable Diffusionは、画像生成AIの民主化に大きく貢献し、クリエイティブな表現の可能性を広げるツールとして注目を集めています。一方で、悪用のリスクもはらんでおり、技術の発展と並行して、適切な利用のためのルール作りが求められています。

Stable Diffusion APIとは?

そもそもStabele Diffusion APIとは何ですか？

Stable Diffusion APIは、Stability AIが提供するクラウドベースのAPIサービスで、開発者がStable Diffusionの機能を自身のアプリケーションやサービスに組み込むことを可能にします。

Stable Diffusion APIを使えば、開発者、アーティスト、エンスージアストは、ローカルセットアップや特殊なハードウェアを必要とせずに、Stable Diffusionモデルを使ってAIイメージを生成できます。クラウドコンピューティングの力を活用することで、APIはスムーズで効率的な体験を実現し、ユーザーが簡単に高品質のイメージを生成できるようになります。

Stable Diffusion APIにできること

それでは、Stable Diffusion APIを通じて、どのような作業が実現されることが可能ですか。次は、Stable Diffusion APIの主な機能を皆さんに紹介します。

テキストから画像生成（Text-to-Image）

ユーザーが入力したテキストプロンプトから、対応する画像を生成します。
生成する画像のスタイルや特徴を、プロンプトで指定することができます。

画像から画像生成（Image-to-Image）

入力画像とテキストプロンプトに基づいて、入力画像を変換・編集した新しい画像を生成します。
例えば、入力画像のスタイルを変更したり、新しい要素を追加したりすることができます。

画像のアップスケーリング（Upscaling）

低解像度の画像を入力として、高解像度の画像を生成します。
画質を維持しながら、画像のサイズを拡大することができます。

マスキングによる編集（Inpainting）

画像の一部をマスクで指定し、その部分をテキストプロンプトに基づいて編集・変更します。
例えば、画像の背景を変更したり、オブジェクトを追加・削除したりすることができます。

ということでStable Diffusion APIを利用することで、開発者は以下のようなアプリケーションやサービスを作成できます：

カスタムデザインジェネレーター
画像編集ツール
仮想試着サービス
ゲームやバーチャルワールドのアセット生成
クリエイティブなソーシャルメディアフィルター

などです。

APIを使うことで、開発者は自身でStable Diffusionモデルをトレーニングしたり、高性能なハードウェアを用意したりすることなく、Stable Diffusionの機能を手軽に利用できます。これにより、画像生成AIを活用した新しいサービスやアプリケーションの開発が促進されています。

また、最新のアップデートにより、Stable Video Diffusionモデルによって動画の生成もできるようになりましたので、必要に応じてStable Diffusion APIを経由で動画の生成もできます。

例：Stability.aiの動画出力

Stable Diffusion APIの利用料金

Stable Diffusion APIに新しく登録すると、自動的に25個の無料クレジットが付与されます。このクレジットはDreamStudioとStable Diffusion APIの両方でも使用できます。

その以降、クレジットを追加購入する場合は、100クレジットにつき、1米ドルがかかります。標準のイメージ生成では、ステップ=30で0.2クレジットが必要です。

ご案内："ステップ"とは、イメージ生成プロセスで実行される繰り返し回数やDiffusionステップの回数を指します。

モデルによって生成コストが異なります。以下が比較です。

画像

モデル	Stable Diffusion XL 1.0	Stable Diffusion 1.6
機能	標準	高速処理
価格 (ステップ=30)	0.20	0.24

編集（Editing）

	Search-and-Replace	Inpaint
機能	画像の一部を置き換え	画像の一部を補完
価格	4.00	3.00

アップスケーリング（Upscaling）

	Creative Upscale	Real-ESRGAN x2
機能	4Kへの品質・パフォーマンス改善	細部の強調
価格	25.00	0.2

ビデオ

機能: 短いビデオを生成
価格: 20.00

Stable Diffusion API認証

Stable Diffusion APIを使用する前に、認証するために、APIキーを取得する必要があります。次は、ステップバイステップの認証用APIキーを取得するチュートリアルになります。

stability.aiでアカウントを作成します。

2. アカウントページで右上にあるプロファイルのアイコンをクリックします。

3. ここで左側のメニューから「API Keys」を選択して、「＋Create API Key」ボタンをクリックすることで、APIキーを生成して取得できます。

Stable Diffusion APIの利用を始める

APIキートークンを取得したら、Apidogというツールが使えます。ApidogはAPIの設計、デバッグ、テスト、ドキュメント化、モック化を1つのツールで行えるオールインワンのAPI開発ツールです。ApidogはゼロからAPIを構築したり、既存のAPIをインポートしたりと、柔軟に対応できます。

button

また、ApidogのAPI Hubでは、Stable Diffusion APIプロジェクトを直ちに利用することもできますので、次のページにアクセスすると、オンラインでStable Diffusion APIを利用したり、テストしたりすることができます。

Getting Started - Stability.Ai

Apidog

ApidogでStable Diffusion APIを使用

Apidogを利用することで、簡単にStable Diffusion APIを利用することができます。

使用例1：残高の確認

ApidogのStable Diffusion APIプロジェクトにアクセスすると、左側のメニューからStable Diffusion APIの全てのエンドポイントが表示されます。そこから必要なものを選択できます。例えば、残高を確認するために、「balance」を選択します。

Method: GET
Endpoint: https://api.stability.ai/v1/user/balance

ここで右側パネルで「Try it out」ボタンをクリックして、直ちに利用することができます。

そして、Headersタブに切り替え、AuthorizationフィールドにAPIキーを設定します。

リクエストを送信すると、残高の情報が返されます。

使用例⒉テキストからイメージ生成

また、Stable Diffusion APIを利用して、テキストからイメージを生成する方法を紹介します。同じくApidogでのStable Diffusion APIプロジェクトからtext-to-imageというエンドポイントを選択します。

Method: POST
endpoint: https://api.stability.ai/v1/generation/{engine_id}/text-to-image

そして、必要なパスパラメータを記述:

engine_id: モデルのバージョン (文字列)

本文のパラメータ (必須項目のみ指定):

text_prompts:
"text": "画像に関する説明"
"weight": オプション

例:

"text_prompts": [		
	{
    	"text": "画像に関する説明",		
        "weight": 0.5		
        }	
]

結果:

base64の文字列をコピーし、base64からイメージへの変換ツールを使ってイメージを取得します。

クライアントコードを生成してStable Diffusionに連携

また、Apidogを使って、Stable Diffusion APIをテストして、それが問題なく動作できることを確認した上、Apidogを利用して、Stable Diffusion APIのクライアントコードを生成することもできます。プロジェクトが使用しているプログラミング言語が何であっても、Apidogはその言語のクライアントコードを生成することもできますので、Stable Diffusionサービスに連携することも楽々なことになりますね。

まとめ

この記事では、Stable Diffusion APIの基本情報、料金、及び簡単に利用できる方法を皆さんに紹介しました。

ApidogのAPI Hubでは、Stable Diffusion APIプロジェクトを直ちに利用することもできますので、オンラインでStable Diffusion APIを利用したり、テストしたりすることが必要となる場合、非常に役に立ちます。