EP.019

#19 AIが2Dゲームを丸ごと作る時代

自然言語の要望からコードも画像もBGMも自動生成

2026年4月25日

RSS

番組ノート

今回の論文

タイトル: OpenGame: Open Agentic Coding for Games
著者: Yilei Jiang et al.（香港中文大学 MMLab）
発表: 2026年4月

このエピソードのポイント

自然な言葉の要望から、コード・キャラ画像・BGMまで揃った2Dゲームを丸ごと自動生成するAIエージェント
「テンプレートスキル」と「デバッグスキル」という再利用可能な能力を、経験から自然に育てていく仕組みがユニーク
横スクロールなど物理ベースのゲームは得意だが、戦略やパズル系は苦手。「論理状態の管理」が次の壁

#放課後論文ラジオ#AI#AIエージェント#ゲーム開発#OpenGame#LLM#機械学習

論文を読み解く

Overview

ひと言でいうと

「マーベルのキャラで自分だけのゲームを作りたい」といった自然な言葉での要望から、コードもキャラ画像もBGMもまとめて自動生成し、ブラウザで遊べる2Dゲームを丸ごと作り上げるオープンソースAIエージェント。

Background

背景

ChatGPTやClaudeなどのAIは、計算機アプリを書いたり関数を実装したりといった「単発のプログラミング」はかなり得意になってきました。ところがゲーム制作となると、途端に失敗します。ゲームは「ゲームループ」「物理演算」「画像と音の管理」「複数ファイルにまたがる状態管理」などが密に絡み合う、リアルタイムシステムだからです。

実際、最先端のAIに「プレイ可能なゲームを作って」と頼むと、（1）グローバルな状態を見失って動かない、（2）ゲームエンジンの作法を無視して車輪の再発明をする、（3）ファイル間の整合性が取れず壊れる、という3パターンで頻繁に転びます。コードは書けても「遊べるゲーム」にはなかなか届かない——これが本研究の出発点です。

Novelty

何が新しいか

OpenGameの核心は、エージェントに「ゲームスキル」という再利用可能な能力を持たせた点です。これは2つの要素から成り立っています。

ひとつは テンプレートスキル。最初は「最低限のゲームの骨組み」しか持たないところから始まり、タスクをこなすたびに「横スクロール（重力あり）」「見下ろし型」「グリッド型」「タワーディフェンス型」「UI中心型」といった5つの定番設計パターンが経験から自然に蓄積されていきます。料理人が「肉じゃがの基本」を覚えれば応用が効くのと似た発想です。

もうひとつは デバッグスキル。エラーに遭遇するたびに「どんな症状か／原因／検証済みの直し方」を記録した「生きたプロトコル」が育っていきます。同じバグを毎回ゼロから解き直さず、過去の修正知識を蓄積していくのです。

さらに土台として、Phaser（Web向けゲームエンジン）に特化させた専用コードLLM「GameCoder-27B」を、(1) 継続事前学習、(2) 教師ありファインチューニング、(3) 実行結果を報酬にした強化学習、という3段階で訓練しています。

Results

どんな結果が出たか

150種類のゲーム要望でテストした結果、OpenGame（Claude Sonnet 4.6 と組み合わせ）は、ビルドの健全性 72.4、視覚的な遊べる度 67.2、要望の満足度 65.1 を達成し、最強ベースラインだったCursor + Claude を全項目で約5〜6ポイント上回りました。

特筆すべきは、自社開発の GameCoder-27B（27Bパラメータ）が、はるかに巨大な GPT-5.1 や Claude Sonnet 4.6 の単体使用を上回った点です。また、ジャンル別ではプラットフォーマー（76.8）など物理ベースのゲームで強く、戦略ゲーム（58.2）やパズル/UIゲーム（52.6）では各システムとも苦戦しており、「論理状態の管理」が次の課題として残っています。

Key Point

なぜ重要か

論文の冒頭イラストには「マーベル好きが自分だけのゲームを作りたい」「先生が授業をゲーム化したい」「YouTuberがバズりたい」という具体的なユーザー像が描かれています。これはゲーム制作の民主化が現実味を帯びてきたことを示唆しています。

ビジネス的に見ると、この研究の本質は「ゲーム制作」よりも「複雑で長時間にわたる対話的ソフトウェアをAIに任せる方法論」にあります。1ファイルのスクリプトと違い、ゲームは多数のファイルが絡み合い、しかも「動くだけでなく面白く遊べる」必要がある。この問題をクリアした手法（テンプレートの自動進化、デバッグ知識の蓄積、ヘッドレスブラウザによる動的検証）は、業務アプリ開発、Webサービス構築、組み込みシステムなど、複雑な長期タスク全般に応用できます。

「AIに丸投げできる仕事」の輪郭が、また一段広がった研究といえるでしょう。

From the Host

解説者ノート

個人的に面白かったのは、テンプレートが「最初から5種類用意される」のではなく、エージェントが経験を重ねるうちに自然と5つのパターンに収束していくところ。物理法則がゲーム設計の本質的な分類軸になっている、という発見が示唆的です。一方で、戦略・パズル系での弱さは「コンパイラが教えてくれない論理エラーは検知が難しい」という根深い課題で、ここを突破する次の一手が気になります。エンタメ用途のデモに見えて、実は汎用的な長期タスク自動化のヒントが詰まった論文です。

キーワード

エージェント（Agent）

自分で計画を立て、ツールを使い、試行錯誤しながらタスクを進めるAI。単に文章を返すLLMより一段賢い動き方をする

Phaser

JavaScriptで2Dゲームを作るためのオープンソースのライブラリ。コードだけで完結するためAIに扱いやすい

テンプレートスキル

ゲームの種類ごとに「骨組みのひな型」を経験から学習・蓄積する仕組み

デバッグスキル

過去に遭遇したエラーと、その正しい直し方をメモとして溜め込み、再利用する仕組み

ヘッドレスブラウザ

画面を表示せずバックグラウンドでWebページを動かす仕組み。AIがゲームの動作を自動チェックするのに使う

OpenGame-Bench

「ビルド成功度」「見た目の遊べる度」「要望との一致度」の3軸でゲームを自動採点する評価システム

論文情報

2604 18394

arXivで読む alphaXivで読む

トランスクリプト

かなで

はじまりました、放課後論文ラジオです。

ゆい

ゆいです！

かなで

かなでです。

ゆい

この番組は、最新のAI研究を2人で読み解きながらお届けしてます！

かなで

今日もよろしくね。

ゆい

ねえねえ、かなで先輩、聞いてよ。

←前のエピソード

EP.018 #18 見るAIと描くAIがひとつになる

次のエピソード→

EP.020 #20 AIが動画の「時間の流れ」を見抜く

EP.019|#19 AIが2Dゲームを丸ごと作る時代

--:--/--:--