
#19 AIが2Dゲームを丸ごと作る時代
自然言語の要望からコードも画像もBGMも自動生成
2026年4月25日
番組ノート
今回の論文
- タイトル: OpenGame: Open Agentic Coding for Games
- 著者: Yilei Jiang et al.(香港中文大学 MMLab)
- 発表: 2026年4月
このエピソードのポイント
- 自然な言葉の要望から、コード・キャラ画像・BGMまで揃った2Dゲームを丸ごと自動生成するAIエージェント
- 「テンプレートスキル」と「デバッグスキル」という再利用可能な能力を、経験から自然に育てていく仕組みがユニーク
- 横スクロールなど物理ベースのゲームは得意だが、戦略やパズル系は苦手。「論理状態の管理」が次の壁
論文を読み解く
Overview
ひと言でいうと
「マーベルのキャラで自分だけのゲームを作りたい」といった自然な言葉での要望から、コードもキャラ画像もBGMもまとめて自動生成し、ブラウザで遊べる2Dゲームを丸ごと作り上げるオープンソースAIエージェント。
Background
背景
ChatGPTやClaudeなどのAIは、計算機アプリを書いたり関数を実装したりといった「単発のプログラミング」はかなり得意になってきました。ところがゲーム制作となると、途端に失敗します。ゲームは「ゲームループ」「物理演算」「画像と音の管理」「複数ファイルにまたがる状態管理」などが密に絡み合う、リアルタイムシステムだからです。
実際、最先端のAIに「プレイ可能なゲームを作って」と頼むと、(1)グローバルな状態を見失って動かない、(2)ゲームエンジンの作法を無視して車輪の再発明をする、(3)ファイル間の整合性が取れず壊れる、という3パターンで頻繁に転びます。コードは書けても「遊べるゲーム」にはなかなか届かない——これが本研究の出発点です。
Novelty
何が新しいか
OpenGameの核心は、エージェントに「ゲームスキル」という再利用可能な能力を持たせた点です。これは2つの要素から成り立っています。
ひとつは テンプレートスキル。最初は「最低限のゲームの骨組み」しか持たないところから始まり、タスクをこなすたびに「横スクロール(重力あり)」「見下ろし型」「グリッド型」「タワーディフェンス型」「UI中心型」といった5つの定番設計パターンが経験から自然に蓄積されていきます。料理人が「肉じゃがの基本」を覚えれば応用が効くのと似た発想です。
もうひとつは デバッグスキル。エラーに遭遇するたびに「どんな症状か/原因/検証済みの直し方」を記録した「生きたプロトコル」が育っていきます。同じバグを毎回ゼロから解き直さず、過去の修正知識を蓄積していくのです。
さらに土台として、Phaser(Web向けゲームエンジン)に特化させた専用コードLLM「GameCoder-27B」を、(1) 継続事前学習、(2) 教師ありファインチューニング、(3) 実行結果を報酬にした強化学習、という3段階で訓練しています。
Results
どんな結果が出たか
150種類のゲーム要望でテストした結果、OpenGame(Claude Sonnet 4.6 と組み合わせ)は、ビルドの健全性 72.4、視覚的な遊べる度 67.2、要望の満足度 65.1 を達成し、最強ベースラインだったCursor + Claude を全項目で約5〜6ポイント上回りました。
特筆すべきは、自社開発の GameCoder-27B(27Bパラメータ)が、はるかに巨大な GPT-5.1 や Claude Sonnet 4.6 の単体使用を上回った点です。また、ジャンル別ではプラットフォーマー(76.8)など物理ベースのゲームで強く、戦略ゲーム(58.2)やパズル/UIゲーム(52.6)では各システムとも苦戦しており、「論理状態の管理」が次の課題として残っています。
Key Point
なぜ重要か
論文の冒頭イラストには「マーベル好きが自分だけのゲームを作りたい」「先生が授業をゲーム化したい」「YouTuberがバズりたい」という具体的なユーザー像が描かれています。これはゲーム制作の民主化が現実味を帯びてきたことを示唆しています。
ビジネス的に見ると、この研究の本質は「ゲーム制作」よりも「複雑で長時間にわたる対話的ソフトウェアをAIに任せる方法論」にあります。1ファイルのスクリプトと違い、ゲームは多数のファイルが絡み合い、しかも「動くだけでなく面白く遊べる」必要がある。この問題をクリアした手法(テンプレートの自動進化、デバッグ知識の蓄積、ヘッドレスブラウザによる動的検証)は、業務アプリ開発、Webサービス構築、組み込みシステムなど、複雑な長期タスク全般に応用できます。
「AIに丸投げできる仕事」の輪郭が、また一段広がった研究といえるでしょう。
From the Host
解説者ノート
個人的に面白かったのは、テンプレートが「最初から5種類用意される」のではなく、エージェントが経験を重ねるうちに自然と5つのパターンに収束していくところ。物理法則がゲーム設計の本質的な分類軸になっている、という発見が示唆的です。一方で、戦略・パズル系での弱さは「コンパイラが教えてくれない論理エラーは検知が難しい」という根深い課題で、ここを突破する次の一手が気になります。エンタメ用途のデモに見えて、実は汎用的な長期タスク自動化のヒントが詰まった論文です。
キーワード
エージェント(Agent)
自分で計画を立て、ツールを使い、試行錯誤しながらタスクを進めるAI。単に文章を返すLLMより一段賢い動き方をする
Phaser
JavaScriptで2Dゲームを作るためのオープンソースのライブラリ。コードだけで完結するためAIに扱いやすい
テンプレートスキル
ゲームの種類ごとに「骨組みのひな型」を経験から学習・蓄積する仕組み
デバッグスキル
過去に遭遇したエラーと、その正しい直し方をメモとして溜め込み、再利用する仕組み
ヘッドレスブラウザ
画面を表示せずバックグラウンドでWebページを動かす仕組み。AIがゲームの動作を自動チェックするのに使う
OpenGame-Bench
「ビルド成功度」「見た目の遊べる度」「要望との一致度」の3軸でゲームを自動採点する評価システム
トランスクリプト
かなで
ゆい
かなで
ゆい
かなで
ゆい