Jules と Codex でFlutterアプリに機能を自動追加する

2025/07/01に公開されました。
2025/07/01に更新されました。

Jules と Codex の主要スペックを比較して、既存のFlutterアプリに同じプロンプトで機能を自動追加したのでご紹介します。


author: Mami

1. Jules と Codex の概要

Jules はGoogle Cloudが提供する開発支援エージェントです。Gemini 2.5 Proを利用し、クラウド上でコードを解析して修正やテスト生成を行い、最終的にPull Requestを自動で作成します。現在はβ版として無料で試すことができます。

Codex はOpenAIが提供するコード生成特化モデル群です。ChatGPTやCodex CLI/APIから利用でき、高精度のコード生成やテスト記述を高速に実行します。自然言語で指示を出すだけでコード変更を提案し、テスト結果を引用したPull Requestを作成できます。


2. Jules vs. Codex 比較表

下表では、コード生成やバグ修正などの機能や性能、提供形態、価格・ライセンスモデル、対応プログラミング言語の観点から両者を比較します。

比較項目Jules (Google)Codex (OpenAI)
機能
(コード生成・自然言語処理・API連携など)
- GitHubリポジトリと連携し、Issueに自然言語で指示するだけでマルチステップの開発タスク(バグ修正、機能追加、リファクタリングなど)を自動で実行し、Pull Requestとして成果を出力。

- LLM(Gemini 2.5 Pro)によるコード解析とテスト実行機能を備え、計画・差分確認・PR作成まで人間の承認フロー付きで行う。

- 変更内容を音声で要約する機能など、開発効率化の補助機能も搭載。
- ChatGPTのサイドバー機能およびCLIで動作するクラウド型エージェント。リポジトリを読み込んで並列に複数タスクを処理可能。コード生成、コードベースへの質問応答、テスト実行、PR提案などを実行し、各タスクは独立したサンドボックス環境で実行される。

- タスクごとに進捗が表示され、完了後は自動でコミット・PR作成が可能。実行ログの引用機能により処理内容のトレースもできる。Codex CLI はオープンソースでローカル環境にも対応。
性能
(応答速度・精度)
- Gemini 2.5 Pro モデルで大規模コード解析が可能。Googleによれば、従来「数時間」要していた複雑タスクを「数分」レベルで完了できるとされている。

- β版では1日5タスクまで(同時2タスク)という制限がある。ユーザーは計画内容とコード差分を常にレビュー・承認するため、高精度な成果物が期待できる。
- 1タスクあたり通常1~30分程度で完了し(タスクの複雑さに依存)、進行状況はリアルタイムに確認できる。モデルは OpenAI o3(codex-1)で強化学習訓練されており、生成コードは人間に近いスタイルを持ち、テストが通るまで自動実行するため高い精度を実現する。複数のエージェントが並行処理できるため、大規模なバックログ解消に向く設計となっている。
提供形態
(クラウド/オンプレミス/SDK/エディタ連携など)
- Web UI(jules.google.com)で提供され、GoogleアカウントとGitHubアカウントを連携して利用する。GitHub リポジトリにJules Botを招待し、Issueにassign-to-julesラベルを付けるだけで自動的にタスクを処理する仕組み。- クラウドサービス: ChatGPTプラットフォーム経由で利用できる。リポジトリはサービス側に読み込まれ、処理結果はGitHub PR等で反映できる。

- API と CLI: 開発者向けには codex-miniモデルとしてOpenAI APIから利用可能(codex-mini-latest)で、CLIはオープンソースとして公開されている。ChatGPTとのシームレス連携により、CLIでもChatGPTアカウント経由で認証・利用できる。
価格・ライセンスモデル- 現在はパブリックβ版としてStarterプラン(無料)で提供され、1日5タスク・同時2タスクまで利用可能。

- 将来的にはProプランが導入予定(タスク無制限・優先キューなど、価格未定)。
- ChatGPT経由の場合、ChatGPT Plus(月額約20ドル)やPro/Teamプランなどのサブスクが必要。現在は研究プレビューとして追加費用なしで利用可能だが、今後は従量制課金モデルに移行する予定。

- API利用: codex-miniモデルはOpenAI APIで従量課金(入力$1.50/1Mトークン、出力$6/1Mトークン)。Plus/ProユーザーにはCLI用に$5/$50の無料クレジットが付与されるキャンペーンも実施されている。サードパーティー向けSDKは現時点で特に発表されていない。
対応プログラミング言語Node.js/JavaScript、Python、Go、Java、RustPython, JavaScript、Go、Perl、PHP、Ruby、Shell、Swift、TypeScript など

3. 操作ステップ概要

既にあるFlutterアプリに機能を自動追加するべく、JulesとCodexに全く同じプロンプトを入力して実行してみました。

Jules での操作フロー

  1. タスク入力
    Julesの入力ボックスにタスクを日本語で入力し、対象リポジトリとブランチ(例: main)を選択して Give me a plan を押します。

  2. プラン確認 & 差分プレビュー
    プランが提案されるので、それが問題なければ進めます。修正して欲しい点なども指示すると左側チャットに修正方針が提示され、右ペインで確認できます。

  3. ブランチ公開 & PR 作成
    処理完了後に feat/add-share-app-feature ブランチが生成され、Publish branch を押すとGitHubにPRが作成されます。

Codex での操作フロー

  1. タスク入力
    Codex UIで日本語プロンプトを入力し、対象リポジトリとブランチ(例: main)を選択して コード ボタンを押下します。

  2. 差分レビュー & テスト結果確認
    生成された差分と要約を確認します。

  3. Pull Request 作成
    右上の プルリクエストを作成する をクリックすると、CodexがブランチをpushしてPRが自動生成されます。

実装結果 (アプリ UI プレビュー)

JulesとCodexいずれの手法でも、「その他 → このアプリを友達に教える」 が追加され、タップするとOS標準の共有シートが表示される実装が出来ました。このアプリは7言語対応をしているので、言語ファイルを自動生成してくれるのは非常にありがたいです。

筆者所感

  • Jules: 実行スピードが遅い点がネックです。また、タスク意図を正しく理解させるまで 2回リトライ が必要でした。ただし 無料β版でここまで自動化 できるのは驚異的です。
  • Codex: 実行速度にストレスはなく、1回の指示でほぼ完成形 が出力されました。唯一の面倒だった点は 日本語プロンプト時にブランチ名まで日本語 になり、後でリネーム作業が発生したことです。ブランチ名の指定は現時点では出来ませんでした。

おわりに

AIエージェントを使用することで、開発サイクルは想像以上に加速すると感じました。特にJulesは現在β版で無料なので、まずは気軽に試してみて、体感してみてください!

※本記事は、ジーアイクラウド株式会社の見解を述べたものであり、必要な調査・検討は行っているものの必ずしもその正確性や真実性を保証するものではありません。

※リンクを利用する際には、必ず出典がGIC dryaki-blogであることを明記してください。
リンクの利用によりトラブルが発生した場合、リンクを設置した方ご自身の責任で対応してください。
ジーアイクラウド株式会社はユーザーによるリンクの利用につき、如何なる責任を負うものではありません。