私が使うAIは1つではない。4つだ。テクノロジーに取り憑かれているからではなく、何ヶ月もテストし、壊し、限界を見つけた結果、それぞれがプロセスの中で異なる役割を持っていると理解したからだ。各メンバーが最も得意なことをするチームのように。
これが私の実際のワークフローだ。フィルターなし、美化なし。うまくいくこと、いかないこと、そしてなぜ4つすべてを使い続けるのか。
Claude:コーディングパートナー
このウェブサイトでこれを読んでいるなら、Claudeの仕事を見ていることになる。このブログをゼロから作った。WordPressもテンプレートも使わない。純粋なPHP、MySQL、HTML、CSS。個人的な挑戦が予想をはるかに超えるものになった。
Claudeは技術的な問題を解決する必要がある時に話す相手だ。「ウェブサイトを作って」とは言わない。アーキテクチャを説明し、データベースがどう整理されているかを示し、ユーザーが何かした時に何が起きてほしいかを描写する。質問に飽きることのないシニアデベロッパーが横にいるようなものだ。
Claudeで発見したのは、その助けの質が自分の説明の質に直接比例するということだ。曖昧なブリーフを渡せば、曖昧なコードが返ってくる。詳細な完全なコンテキストを説明すれば、時に自分でも思いつかなかった解決策が返ってくる。最近、予約投稿システムの作成を手伝ってもらったが、コードだけでなく、なぜ特定の技術的決定が他よりも優れているかも説明してくれた。
最も価値があるのは、Claudeが私を何も知らない人として扱わないことだ。私の経験を認識し、その上に構築する。10年以上のキャリアを持つデザイナーだと言えば、そのレベルに合わせて回答を調整する。divが何かは説明しない。コンポーネントアーキテクチャについて話す。
Midjourney:無限のフォトスタジオ
Midjourneyはデザイナーの頭が最も自由に感じる場所だ。このツールで画像を生成するのは、無制限の予算を持つフォトスタジオで、誰にも文句を言われずに千回シャッターを切れるようなものだ。
しかしその自由にはコストがある:正確に何を求めるか知る必要がある。そこで何年もの視覚デザイン経験が違いを生む。「人物の写真」とは書かない。照明、カメラアングル、服の質感、レンズの品質、感情的な雰囲気を考えて書く。
私の典型的なプロンプトにはレイヤーがある。最初は被写体を描写する。2番目は写真スタイル。3番目は技術的詳細。よく使う実例:
active lifestyle, casual colorful clothing, sunshine, neutral expressions, DSLR style --v 6 --ar 3:2
そしてイテレーションする。「sunshine」を「golden hour」に変えると結果は完全に変わる。「DSLR style」を「The shot was taken with a Leica Q2」に変えると画像全体のテクスチャが変わる。すべての言葉がデザインの決定だ。
最も習得に苦労したのはローアングルショットだ。数週間頭痛の種だった。Midjourneyは特定のアングルを非常に文字通りに解釈する傾向があり、歪んだパースペクティブになってしまった。しかし忍耐と多くのイテレーションで、必要なものを生み出す言葉の組み合わせを見つけた。
ChatGPT:アイデアエディター
ChatGPTは主要ツールではないが、他にはない役割を果たす:声に出して考えるのを助けてくれる。デザインプロジェクトの半分できたアイデアがある時、同僚に話すように説明する。すると考えていなかった質問や視点が返ってくる。
Midjourneyに持っていく前のプロンプト改善によく使う。視覚的に何を達成したいかを説明し、使える写真用語や芸術用語を提案してもらう。時にその提案は明白だ。時に結果全体を変える一語を投げかけてくる。
よく知らないセクターのデザインをする時のクイックリサーチにも使う。スポーツウェアブランドのプロジェクトがあり、そのセクターのビジュアルトレンドを理解する必要がある場合、ChatGPTは以前PinterestやBehanceで何時間もかかった概要を数分で提供してくれる。
あまり役に立たないのはコードだ。試したことがあるが、その解決策は表面的には正しいが細部では脆い傾向がある。技術的なことには間違いなくClaudeを好む。
Gemini:ピンポイントのスペシャリスト
Geminiは最も使わないAIだが、必要な時に最も驚かされる。長い会話や複雑なプロジェクトには使わない。素早いセカンドオピニオンが必要な非常に具体的なタスクに使う。
例えば、Claudeが技術的な解決策を出し、それを検証したい場合、同じ問題をGeminiに渡してアプローチを比較する。一致することもある。Geminiが異なるものを提案して再考させることもある。手術前に二人の医者に相談するようなものだ。
画像分析が必要な時にも使う。Geminiは画像の中に見えるものを描写する良い能力を持っており、AIが視覚的構図をどう解釈するかを理解するのに役立つ。これらの機械がどう考えるかについて多くを教えてくれた興味深い練習だ。
しかし正直に言わなければならない:Geminiには短い手綱が必要だ。クリエイティブなタスクで自由を与えすぎると逸脱する。タスクが明確に定義され、期待される結果がはっきりしている時により良く機能する。無制限のスペースを与えると問題が生じる。
4つがどう一緒に流れるか
AIを使う典型的な一日はこうだ:アイデアやプロジェクトから始まる。視覚的に探求する必要があればMidjourneyに直行する。実行前にアイデアを考える必要があればChatGPTと話す。プロジェクトにコードやサイトの技術的なことが関わればClaudeと作業する。そしてどの時点でも素早いセカンドオピニオンや特定の分析が必要ならGeminiに頼る。
リニアなプロセスではない。ChatGPTで始め、Midjourneyに移り、ChatGPTに戻ってプロンプトを調整し、Claudeで結果をサイトに実装して終わることもある。午前中ずっとMidjourneyだけ、午後はClaudeだけということもある。
重要なのは各AIに居場所があることだ。一つに他の仕事をさせようとしない。それは最初に犯した間違いだった。一つのツールにすべてをやらせようとした。うまくいかない。PhotoshopにFigmaの仕事をさせたい、あるいはその逆のようなものだ。各ツールに強みがあり、デザイナーとしての仕事はいつどれを使うか知ることだ。
このワークフローがデザインについて教えてくれたこと
毎日4つのAIで作業することで、より良いコミュニケーターになることを余儀なくされた。それぞれが異なる話し方を必要とする。Claudeは詳細な技術的コンテキストが必要だ。Midjourneyは正確な視覚的ボキャブラリーが必要だ。ChatGPTはオープンな会話が必要だ。Geminiは限定された指示が必要だ。
クライアント、開発チーム、アートディレクターに対して私たちがやることとまったく同じだ。相手に合わせて言葉を適応させる。違いは、今や相手が機械であり、フィードバックが即座だということだ。
プロンプトとは何かについての投稿で書いたように、これは新しいスキルではない。すでに知っていることの進化だ。ただベルトにツールが4つ増えただけだ。
そしてベルトはまだ大きくなり続けている。