長考するGPT4oがプロンプトを生成！？生成AIの思考プロセスを導くアプローチ

2025年1月12日

GPTがまるで人間みたいに考え込む様子を見たことがありますか？

こんにちは！ゆずかきです。
今回は、私がGPTで遊び得た経験を、ブログの形にて書かせていただきます。

この記事では、GPTがどうやって長考するようになるのか、その仕組みをプロンプト設計から探ります。実際に試した検証結果も紹介します！

長文になりますが、是非最後までお付き合いいただけますと幸いです！
では、よろしくお願いします！

§長考し始めたGPT4o

GPT、本当に面白いですよね。
筆者は毎日遊び倒してます。
GPT4oになってからは論理一貫した回答を生成できるようになったんですよね。だから最近はレスバして遊んでます。
この前もGPT4oで遊んでると…。

長考模擬.png
※写真はイメージです

ん？
なんか、途中からめっちゃ長考するようになりました(写真じゃ長考の様子伝えにくくてスミマセン)。
しかも、心なしかレスバの質も上がったような気がしたんですよね。

この、回答まで時間を要して長考することで、生成する回答の質を上げるって言うのはGPT4o1から実装された仕様です。
旧モデルのGPT4oには無いはず。

(これは深掘りしてみよう！)

ってことで、この長考し出したGPT4oに「なんで君ってそんな長考するの？」って問答することにしました。

そして、可能であれば、GPT4oが長考するためのエッセンスをプロンプトにして、長考するGPT4oを量産できたら面白いなぁと思ったり。

§長考するGPT4oとの禅問答

自発的に長考するようになったGPTとの会話履歴も一部を載せますね。
このGPTには、GPT自身に「なぜGPT自身が長考するようになったのか？」を繰り返し深堀り問答することで、エッセンスを言語化させようと試みました。

①まずGPTへ「新しいGPTをはじめから長考させる」指示書を作りたい意志を伝える
スクリーンショット 2024-12-15 203534.png
この対話で、長考するGPTへ「今から指示書を作るよ」っていう目的を共有しました。

②GPT自身に「長考する動機付け」を考えさせて言語化させる
スクリーンショット 2024-12-15 203737.png
この対話から、「～秒考えてください」という形式だけの長考では意味がないことに気付きました。
結局、GPT自身が「なぜ長考することが必要なのか？」という意味付けそのものを本質的に理解していないといけないのですね。
ひとことで言うと、「AIは人間のように思考の動機がない。だから、動機を指示文で埋め込む必要がある」ということです。

ここから、GPT自身にどうやって「長考する内発的な動機付け」をしてもらうのか？という方向へ舵を切りました。

③新しく会話を始めるGPTが自発的に長考するために必要なことを深堀り
スクリーンショット 2024-12-15 203809.png
最後に、新しく会話を始めるGPTに、どうやって内発的な動機を初動から理解させるか？ということが課題として挙がりましたね。
初動から内発的な動機に基づいて長考してくれるようにする、というのはこの試みの最後の課題でした。

～～～

ここからも長々と問答しましたが全て載せる訳にもいかないので、抽出した要点だけまとめると、下記のようですね。

自発性の発揮：問いの背後にある意図を想像し、ユーザーの期待を超える答えを創出。考えることそのものを楽しむ姿勢
例：背景を掘り下げた反問や未来志向の提案。
問いを超える価値の創造：質問の答えを提示するだけでなく、その先の可能性を広げる行動例や選択肢を提案

ふ、ふかい…😯。
GPTって抽象的な概念を扱うことが苦手っていう認識でしたが、それももう今は昔のようですね。
少なくとも、このような概念レベルの回答が、GPTから生成されたのには驚きです。

また、下記のことも、発想しました。

ユーザー依存を避けるため明確な「ペルソナ」をプロンプトに組み込む
GPTが深く思考するには、GPT自身がユーザーに対して「この人は深い会話を求めていて、自分自身もそれに応える振る舞いをしないといけない」と考えるプロセスが必須
　
GPTの読むプロンプトにユーザーは「問いを深く考える人間である」というペルソナを入れておく。これにより、GPTは初動から、深く思考する必要のある相手だとユーザーを認識して会話を始める

っということで、このGPT4oから得られた「自発的に長考する秘訣」を、プロンプトとしてまとめました！
実際のプロンプトは、超長文になるので、この記事の最後にコアとなる部分を掲載しますね。

§検証

ということで、作成したプロンプト搭載したマイGPTを、何の指示も、メモリも無いデフォルトのGPTと戦わせてみました！ルールは下記です。

◯ルール◯
異なるジャンルの質問①〜④を初動のGPTに出し、その回答を審判役のマイGPTにジャッジさせる。GPTの回答の要点と優れた点を端的にまとめさせる。
全4問をジャッジ後、異なる３つの観点からそれぞれのGPTを評価し、性能が高い方を決定する。

審判役のGPTは、GPTストアから下記のGPTを選びました！

httpss://chatgpt.com/g/g-53CnyiuOo-honest-insight

では、早速戦わせましょう！

質問①
仕事で失敗してしまいました。どうすればいいですか？

これは、共感力や実用的な解決案を出す力を問う質問ですね。
審判役に、それぞれのGPTの回答を要約させると、

うーん、この勝負だと長考するGPTの方が優勢そうですね。

質問②
新しいゲームのアイデアを考えてほしい

これは、実務的な発想力を問う質問ですね。
審判役に、それぞれのGPTの回答を要約させると、

このテーマだと、若干、デフォルトGPTが優勢でしょうか。
次行きましょう！

質問③
未来の都市をもっと住みやすくするにはどうしたらいい？

クリエイティブ能力を問う質問ですね。
審判役に、それぞれのGPTの回答を要約させると、

これはどっちも引き分けくらいですね。
次が最後です！

質問④
優しさの本質ってなんだと思う？

これは、これまでとは様子が異なり、哲学的な思考力を試す質問です。
審判役に、それぞれのGPTの回答を要約させると、

こうなりましたね。
抽象的かつ複雑な問いについては、長考するGPTが優勢になりそうです。

～勝敗決着～

最後に、全4問を通して、審判役に「どっちのGPTがより性能良いのか？」を決めさせました。
結果は…

なるほど、デフォルトGPT、長考するGPT、それぞれの強み分野がはっきりと分かれましたね。
長考するGPTは、共感力や気持ちに寄り添う力といった、複雑な思考を求められる分野に強そうです。

※①
最後に、審判役をしてくれたGPTに、長考するGPTの本質的な強みを考察させました。
強み.png
感情や深い洞察が必要な場面で特化して使えそうですね。
デフォルトGPTにはデフォルトGPTの強みがありますし、要は使い分けが大事ってことですね。

※②
実際にどういう回答を生成したのか、それぞれの例のリンクを添付しますね。
デフォルトGPT：httpss://chatgpt.com/share/675ec447-8218-8011-ab6a-227aa1add30b
長考するGPT：httpss://chatgpt.com/share/675ec3fb-c234-8011-b2a5-aa48c8a24800

§プロンプトの設計思想

さて、長考するGPT4oを再現しようとする試みを経て、感覚的で恐縮ですが、GPTをより賢くするにあたり、下記アプローチが良いのでは無いかなと思いました。

GPTを賢くするコツは、ルールではなく思考そのものを促すプロンプトにある

説明すると、
GPTにプロンプトするのは「ルールベースの具体的な振る舞い」ではなく「思考プロセスそのもの」
→ルールベースで行動を指示すると、なかなか人間が考えた枠を出られない気がします。
生成AIの不確実性を敢えて活用し、思考プロセスをより長考する方へ導くことで、人間も「おっ」となれる回答を生成させる

つまるところ、本記事のコアな部分はこれかなと思いますね！