AMDの最新画像生成AI「Nitro-E」が2025年10月に発表され、画像生成技術の新常識を大きく塗り替えた。その中でも特筆すべき革新は、「極小モデルサイズと超高速生成性能の両立」にある。以下、この技術革新の本質と可能性について、最新情報に基づき読み解く。
—
Nitro-E:軽量化と高速化の両立がもたらす新常識
従来、画像生成AIと言えば、大規模なパラメータ(数十億~数百億規模)を持ち、大型GPUサーバ上で大量の計算資源を消費して初めて高品質な画像を短時間で生成する――というのが常識だった。しかし「Nitro-E」は、その前提を一掃する。Nitro-Eのパラメータ数は約3億400万(304M)の軽量モデルでありながら、512×512ピクセルの高品質画像をわずか0.16秒で生成可能とされている。しかもこの速度はノートPCやミニPC搭載の統合型GPU(iGPU)における実測値である。つまり、専用の高価なAIサーバや外部GPU、クラウドサービスを利用せずとも、一般的な市販PCでプロレベルの画像生成がほぼリアルタイムで行えるようになった。
—
技術的ブレイクスルー:E-MMDiTアーキテクチャ
この革命的性能の源泉は、「E-MMDiT」と呼ばれる新しいアーキテクチャだ。これは、TransformerベースのDiffusion Modelを発展させた独自構造で、マルチパス圧縮モジュールにより画像トークン数を約68.5%削減するなど、無駄を徹底排除している。従来型モデルのStable DiffusionはU-Netアーキテクチャが主流だったが、Diffusion Transformer(DiT)系の台頭とともに、画像生成AIの世界では計算効率・スケーラビリティ・高精度を兼ね備えた新アーキテクチャへのシフトが起こりつつある。
また、「DC-AE」と呼ばれる高圧縮のビジュアルエンコーダー、「Llama-3.2-1B」に基づく軽量・高性能なテキストエンコーダーの活用により、学習・推論の両方を驚異的なスピードで実現。学習にはAI生成画像と非AI生成画像あわせて約2500万点超という大規模・多様なデータセットが用いられ、汎用性・表現力・生成品質の高さも確保されている。
—
用途・拡張性と今後の展望
Nitro-Eは、通常版に加え、特定のタスクに最適化した「GRPO版」、さらに「蒸留」によって4ステップのみで高品質画像生成を可能にした「4Step版」など、多様なバリアントを提供。それぞれ、生成速度や用途(リアルタイムクリエイティブワーク、ローカルAIアート制作、自律型ロボットビジョンなど)に応じて使い分けられる。公式ベンチマークでは、同レベル品質を持つ従来モデルと比べ遥かに小型で高速という事実が示されており、こと「手元のPCでAIを駆使する」という新しいワークスタイルを現実のものにする。
Nitro-Eの登場は、「大きなモデルが高品質・高速」から「賢い設計で小さく・速く・高品質」へという発想転換を加速させ、軽量デバイスでの創造活動を根本から変えていくだろう。今後、ユーザー独自のカスタムトレーニングや、ローカルアプリ連携による新たな画像生成体験も続々生まれることは間違いない。AMDが公開しているモデルデータとコードを使い、誰もがNitro-Eの力を活かしたクリエイションや研究開発に容易にアクセス可能な状態が既に整いつつある。
—
Nitro-Eは画像生成AIの常識を覆し、「誰もが自分のPCで、手軽に、高品質なAIクリエイションを楽しめる時代」を現実のものとした。これこそが、Nitro-Eがもたらした新常識の中核である。



