TNT SOLUTION RECRUIT 2021

MEMBER BLOG社員ブログ

AI画伯<ね、簡単でしょ?

A.S

皆さまこんにちは、A.Sです。
6月になりいや~な梅雨の時期に突入しますね。
少しでも気分が上がるように、ちょっとイイ傘が欲しいなと思いつつ、
すぐ傘を置き忘れる人間なので後悔する未来しか見えません……(今年はすでに1本失くしている)

話は変わりますが、先月また会社の福利厚生施設を利用させていただきました。
今回宿泊したのは「東京ベイコート倶楽部」です。
館内利用でもドレスコードがあったりして、どんなところかと恐る恐る行きましたが、
何事もなく宿泊できたので良かったです(^_^;)
(Tシャツ、短パン、サンダルみたいな格好でなければ大丈夫そう……)
宿泊したお部屋は「ベイスイート」です。
広いお風呂、大きいテレビ、ネスプレッソ(コーヒーメーカー)があったりと色々堪能しましたが、
一番の感動ポイントはBoseのBluetoothスピーカーあったことです。ちょっと欲しくなりました(良い販促)

近況はこのくらいにして本題へ……前回のテーマが「ChatGPT」でしたので、
今回は「画像生成AI」について取り扱おうと思います。
画像生成AI自体はChatGPTよりも先に話題になっていましたが、
会社で定期購読していただいている雑誌「SoftwareDesign」でも今月号から連載が始まっていたり、
ChatGPTの盛り上がりもあり、改めてどのようなものか注目されているのかもしれません。
(あとは、著作権問題で訴訟が起きていたりとそういう面でも何かと話題です(´д⊂)…ハゥ)

ちなみにSoftwareDesignはソフトウェアだけでなく、
サーバやネットワークの記事や特集も多くて大変為になる雑誌です。

今回のブログも例によって私の勉強も兼ねているので悪しからず\(^o^)/

Stable Diffusion


画像生成AIはいくつかあり、代表的なものだと「Midjourney」「DALL・E2」「Stable Diffusion」などがあります。
今回は「Stable Diffusion」を取り上げます。Stable Diffusionの特徴は、オープンソースとして公開されており、すべての機能を無料で利用できます。オープンソースということもあり、画像生成AIの中で最も規制がゆるく、著名人の顔やキャラクターをそのまま使う傾向があるそうです……工エエェェ(´д`)ェェエエ工
利用者は著作権、倫理問題に十分に配慮する必要があります。

Stable Diffusionを触ってみる

Stable DiffusionはPCにインストールしてローカル環境で使うこともできますが、まず環境構築に手間がかかるのとそれなりのスペックのPCが必要なので、Webサービスを利用するのがお手軽です。
ただ、ローカル環境だと無料かつ無制限で利用できるので、Webサービスを使ってみて本格的に使うとなった場合はローカル環境に移った方がよさそうです。

Webサービスだと「DreamStudio」「Hugging Face」などがあります。
DreamStudioはStable Diffusionの開発元であるStability AIが提供しているWebサービスです。現在25クレジットまでは無料で使えるようです。Styleで絵のタッチを選び、Promptにキーワードを入力、Negative promptには除外したい要素のキーワードを入力、最後にDreamボタンを押すと数十秒程度で画像が生成されます。他にも参考にする画像を読み込ませたりできます。
Hugging FaceはPromptとNegativePromptしか設定項目がなく、画像を生成するまでに時間がかかりますが、ユーザ登録も不要で、無料かつ無制限で画像が生成できます。
以下の画像はDreamStudioで「hawaii sunrise」で生成した画像です。(南の島の美しい風景が見たかった)

そしてお気付きでしょうか……このブログ記事のアイキャッチ画像もDreamStudioで生成しております。
(25クレジットは今回色々と試していたらあっという間に溶けました……(T_T))

画像生成AIが招く問題

最近、米国のアーティストがStability AI、Midjourney、DeviantArtの3社を相手どり集団訴訟を起こしたというニュースを目にしました。画像生成AIは、さまざまな利点と可能性をもたらしていますが、その反面、問題点や課題も浮き彫りになってきています。
その問題点をChatGPTに挙げてもらいました(^o^)<人工知能頼み

  1. 偽造や詐欺への悪用の可能性: 画像生成AIの高度な技術が、偽造文書や詐欺行為に悪用される懸念がある。
  2. プライバシーの侵害と誹謗中傷のリスク: 他人の顔や個人情報を含む画像の生成が容易になり、プライバシーの侵害や誹謗中傷のリスクが増大している。
  3. 偏見や差別の拡大への懸念: 元のデータセットに偏りや差別が含まれると、生成される画像にもその傾向が反映されることで、偏見や差別の拡大が懸念される。
  4. 著作権と知的財産の問題: 画像生成AIが既存の作品やデザインをもとに画像を生成する場合、著作権や知的財産権の侵害が生じる可能性がある。
  5. 倫理と道徳の問題: 他人の許可なく画像を使用することや、AIが人間の顔を合成することによる倫理的な問題が浮上している。
ChatGPT

技術革新のスピードに社会が追いついていなく、現状はほぼ個人の倫理観に任されている印象です。
画像生成AIに限らず人工知能全般に言えることだと思いますが、今後法整備や法規制が進むと思われますので、利用する上で動向を追っておく必要もありそうです。

さいごに

Stable DiffusionやChatGPTを使っていて思ったのは、、、AIに的確な指示をするの難しすぎッ!!笑
SNSでバズっているような画像は、一言二言のキーワードでは生成できないことがよくわかりました。(あとクレジットが全く足りない……!課金待ったなし……!)
どちらも一朝一夕で使いこなせるものでもないので、結局楽な道はないんだな~(ヾノ・∀・`)ナイナイ
ただ話題になっているものに少しでも触れておくことは、世間の流れを把握する上でも重要だなと思いました。
それではまた~( ´ ▽ ` )ノ

シェアする: