社内で話題になった画像・動画生成AIまとめ(2023年2月時点)

米Gartner社が、2022年の「戦略的テクノロジーのトップ・トレンド」で注目すべきキーワードとして発表してから、世界的に注目をあびている「ジェネレーティブAI」。
ジェネレーティブAI(生成AI)は、データやコンテンツから学習し、クリエイティブで現実的なオリジナルのアウトプットを生み出す人工知能(AI)のことです。デジタルの画像や動画、音楽などの音声データ、文章やコードなどのテキストなど様々なものを生成することができ、ハイクオリティなデジタル画像を生成することができる「Stable Diffusion」や、チャット形式で文章や画像の生成をすることができる「ChatGPT」は特に話題となっています。

この記事では昨年度から今年にかけて社内でも話題になった画像、動画生成に便利なサービスをまとめました。

目次

  1. 画像生成AI「Stable Diffusion」
  2. Stable Diffusionへ指示するプロンプトを最適化してくれるツール「Promptist」
  3. ブラウザを介してStable Diffusionを手軽に動かせる「Stable Diffusion web UI」
  4. AIが生成した画像の元になった画像を見つけてくれる「Stable Attribution」
  5. 簡単にデザインが作れる「Canva」にAI機能を搭載
  6. 手本の動画から新しい動画を生成するAI 「Gen-1」
  7. PhotoshopでGenerative AIを実装
  8. Photoshopニューラルフィルターに、顔の角度を変える機能を搭載
  9. Photoshopのビデオ機能で、アニメ風の動画を作成
  10. おわりに

画像生成AI「Stable Diffusion」

MidjoueneyDALL-E2と並び有名な画像生成AIのStable Diffusionは、2022年8月頃に日本に上陸した画像生成AIです。
Stable Diffusionを利用する方法は大きく分けて3通りあります。

1. 高性能なローカルPCで、Stable Diffusionを使って生成
2. Google Colabなどのサービスを用いて、Stable Diffusionを使って生成
3. Stable Diffusion公式が用意しているオンラインサービスを用いて生成

下の画像はStable Diffusion 2.1 Demoを使用し「company,near a lake,fantasy」と試しに入力してできた画像です。このデモサービスは、webブラウザ上で誰でも単語を並べただけでもある程度のクオリティがある画像を瞬時に生成してくれます。Stable Diffusionが公開されてから半年ほどたちますが、今やハイクオリティな画像の作成指示(プロンプト)を発見する人たちがたびたび話題になっています。

より高度な設定をして目的の画像を生成するには、パソコンのGPUを使う方法もありますが、Dream Studio、Google Colaboratoryなどのサービスを利用すれば、高性能PCがなくてもすぐに始めることができます。

「fantasy」寄りではあるが、単語を並べただけでもクオリティが高い画像がすぐできる。
細部のクオリティを高めるのプロンプトを発見する人たちが話題を呼んでいる。

Stable Diffusionへ指示するプロンプトを最適化してくれるツール「Promptist」

また、Stable Diffusionへ指示するプロンプトを最適化してくれるツール「Promptist」がMicrosoft社で公開されています。

このPromptistに生成したい画像の要素を入力してみると、プロンプトが出てきます。

「company,lake,fantasy」と入力してでてきたプロンプト

このプロンプトを使って再びStable Diffusionで画像生成を依頼してみると、このような画像ができました。

細部のクオリティがより高い画像が生成された。「campany」も「fantasy」の世界に溶け込んでいる。

ブラウザを介してStable Diffusionを手軽に動かせる「Stable Diffusion web UI」

Stable Diffusionの高度な機能を、誰でも簡単に動かせる「Stable Diffusion web UI」。ブラウザを介して使用できるので、インスト―ルの時に大変とされていた環境構築をする必要がありません。
使い方は、画面上のテキストボックスにプロンプトを打ち込み、生成ボタンを押すだけ。プロンプトは英語長文でも、単語を「,」で区切って順番に入力することも可能です。

AIが生成した画像の元になった画像を見つけてくれる「Stable Attribution」

画像生成AIは情報がない状態から作品をつくるのではなく、データを学習することで求められるものを出力します。
そこでこの「Stable Attribution」は、出力された画像をもとにどのような画像がもとになったのかを帰属することができます。

簡単にデザインが作れる「Canva」にAI機能を搭載

Canva」は、誰でも簡単にハイクオリティのバナーやチラシなどのデザイン生成することができるサービスとして昨年から話題になっています。このcanvaに、AI画像生成の機能が搭載されました。
テキストを入力し、画像スタイル「写真」を選択するだけで、使いたいデザインが自動で作れるものになっています。

手本の動画から新しい動画を生成するAI 「Gen-1」

アメリカの動画関連スタートアップRunwayが本年2月6日に発表した動画生成AI「Gen-1」は、画像にテキストプロンプトや画像で構図などの情報を適用することで、新しく動画を作成することができる動画生成AIです。
公開されたデモサイトには、5つのモードと作例が掲載されています。

PhotoshopでGenerative AIを実装

Adobeは、ジェネレーティブAIを自社のクリエイティブツールに実装した製品の研究をしていると自社ブログで発表。
先日、同社のTwitterアカウントでは、Photoshopで指定された箇所をAIが別の適するものに変換する機能が取り上げられていました。

Photoshopニューラルフィルターに、顔の角度を変える機能を搭載

Photoshopに搭載されているニューラルフィルターは、写真の表情を変えることができるなど話題となっていましたが、AdobeのTwitterアカウントのこちらの情報によると、今後は顔の角度を変えるなどのより高度な機能も公開予定とのことです。

Photoshopのビデオ機能で、アニメ風の動画を作成

PhotoshopのAIを使った発表はこんなものもあります。こちらはビデオ機能を使って、元の動画をアニメ風にしてくれるもので、今後実装予定とのこと。

おわりに

この記事では、昨年から今年のはじめにかけて社内で話題になった画像、動画生成AIをまとめました。SNSやニュースでは、毎日のように新しい生成AIの機能が発表されています。今後もトンガルマンのブログでは、社内で注目の最新AI機能をご紹介していきたいと思います。

トンガルマンは悩みや課題を抱える皆さまと併走し、最新の技術と型破りのアイデアをもって解決の風穴をあけるお手伝いをさせていただきます。ご相談内容がまとまっていない段階でも、お気軽にご相談ください。

◇お問い合わせはこちら
◇トンガルマンは他にもこんなプロジェクトがあります!くわしくはこちら