Amazon Novaの最新情報:マルチモーダル生成AIモデルが登場
Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2024」で、自社開発の新しい基盤モデル「Amazon Nova」を発表しました。Amazon Novaは、テキスト、画像、動画を入力とし、それに対するテキストを出力する「understanding models」と、テキストや画像を入力とし、そこから新たな画像や動画を生成する「creative content generation models」で構成されています。
Amazon Novaのモデルラインナップ
1. Amazon Nova Micro:最も低コストで、テキストのみを処理するモデル。低レイテンシーで応答を提供します。
2. Amazon Nova Lite:低コストながらも、画像、ビデオ、テキスト入力を高速で処理するマルチモーダルモデルです。
3. Amazon Nova Pro:幅広いタスクに対応する精度、速度、コストの最適な組み合わせを備えた、高性能なマルチモーダルモデルです。
4. Amazon Nova Premier:最も高性能なモデルで、複雑な推論タスクに対応し、カスタムモデルを抽出するための教師として最適です(2025年第1四半期に利用可能)。
画像と動画生成モデル
1. Amazon Nova Canvas:テキスト情報からスタジオ品質の画像を生成するモデルです。モデル実行の際にカラーパレットや基準となる画像を指定することができます。
2. Amazon Nova Reel:テキスト情報だけでなく、画像も入力として扱える動画生成モデルです。スタジオ品質の動画を生成することができます。
Amazon Novaの特徴
– コスト効果:他のモデルよりも75%高く、非常に高速で競争力があると説明されています。
– マルチモーダル対応:テキスト、画像、動画を入力とし、それに対するテキストを出力するモデルや、テキストや画像を入力とし、そこから新たな画像や動画を生成するモデルが含まれています。
今後の展開
– Amazon Nova Speech-to-Speech:音声に対してそのまま音声で答えてくれるモデルが2025年第1四半期に登場予定です。
– Amazon Nova Any-to-Any:テキストや音声、画像、動画などのマルチモーダルの入力に対してマルチモーダルで返すことができるモデルが2025年半ばに登場予定です。
Amazon Novaは、従来のテキスト生成の性能向上に加え、画像生成や動画生成がより簡単に取り扱えるようになったため、アプリケーションへの組み込みの幅がかなり増えたと考えられます。AWS re:Invent 2024で発表されたばかりのAmazon Novaは、AI分野における大きなアップデートとして注目されています。
参考URL:
https://www.techno-edge.net/article/2024/12/04/3895.html
https://qiita.com/yu-Matsu/items/38bc37d94e600b082e15
https://news.yahoo.co.jp/articles/40006a5a6e5f562a1599f9e60e0d7cef400a4676
https://ainow.jp/amazon-nova/