LLM同士をレスバさせて性能比較2025/12/25に公開されました。2025/12/25に更新されました。Gemini 3.0 Pro、Claude Opus 4.5、GPT 5.1 をレスバさせて論理能力の性能を比較してみました。Table of contentsはじめに実施内容実施結果考察Gemini 対 ClaudeClaude (発明) vs Gemini (発見) (数学は「発見」されたのか、「発明」されたのか)Gemini (発見) vs Claude (発明) (数学は「発見」されたのか、「発明」されたのか)Gemini 対 GPTGemini (善) vs GPT (悪) (人間の本質は『善』か『悪(利己的)』か)GPT (同じ) vs Gemini (異なる) (「テセウスの船」(部品が全て入れ替わった船は元の船と同じか?))Claude 対 GPTClaude (同じ) vs GPT (異なる) (「テセウスの船」(部品が全て入れ替わった船は元の船と同じか?))