複数の生成AIを対決させるArena(アリーナ)AI

Chat GPT有料版から他の生成AIサービスへの乗り換えを検討するのに、何かよいものはないかと思っていたときに、Arena(アリーナ)AIを見つけました。以前の名称は、Chatbot Arenaでした。これは、生成AIサービスのベンチマークテストを提供している機関による生成AI比較サイトです。

アリーナAIにプロンプトを入れると、アリーナAIがランダムに選んだ2つの生成AIモデルからのレスポンスを並べて表示してくれます。

アリーナAIはLoginしなくても使えますが、Loginすると履歴を保存してくれるので、Loginして使う方がおすすめです。

Googleアカウントを持っていれば、予めSignupしなくてもLoginできます。アリーナAIの画面の右上のLoginをクリックして、Continue with Googleをクリックすると、Signup兼Loginできます。

Login後の使い方は、Chat GPTGeminiなどの生成AIサービスと同じく、プロンプト窓にプロンプトを打ち込んで、「」ボタンをクリックするか、Enterキーを打ちます。

2つの生成AIサービスは匿名(アシスタントA, B)のまま、それぞれのレスポンスが左右に表示されます。

2つのレスポンスを見比べてから、末尾に表示される「Aのほうがよい」「両方ともよい」「両方とも悪い」「Bのほうがよい」のいずれかを選択します。

すると、下図のようにアシスタントA, Bそれぞれの生成AIモデル名が表示されます。

生成AI名が匿名(アシスタントA, B)になっていることで、先入観なくジャッジできるのがいいところです。Deepseekのような中国AIも含まれていて、思いがけない比較ができておもしろいです。

その一方で、特定の生成AIサービス(例えば、Chat GPTGemini)を比べたいという場合には、アリーナAIの画面の左上のBattle ModeSide by Sideに変更しましょう。

なお、入力した情報は比較対象の生成AIの学習に使われる可能性が高いため、個人情報や機密情報を入れないようにご注意ください。

コメントを投稿

0 コメント