中国の複合企業アリババグループの子会社であり、世界最大のクラウドコンピューティング企業の一つであるアリババクラウドは、I2VGen-XL AIツールを発表しました。この高度なテキストからビデオへのシステムは、Pika LabsやStability AIがリリースしたトップモデルと競合することを目指しています。先月、会社はモデルの研究論文を公開した後、本日、モデルの重みのリリースを発表しました。
論文によると、I2VGen-XLは階層的拡散モデルを使用して開発されており、生成されるビデオは視覚的に魅力的でありながら、文脈的に一貫しており、意味的に正確であるという高度なAIの技術です。これは2つのステージで操作されます。基本ステージでは、入力テキストと画像との連続性を維持することに焦点を当て、改良ステージではビデオの詳細と解像度を向上させ、最大1280×720ピクセルまで達成します。この手法は、SDXLで画像を生成するために使用される手法に似ているかもしれません。
Stability AIがSD 1.5およびSD 2.1に1つのモデルを使用したのとは異なり、Stability AIはベースとリファイナーの2つの異なるモデルを開発しました。これらを組み合わせることで、可能な限り最高品質の画像を生成します。
アリババクラウドによると、モデルのトレーニングには約3500万のテキストからビデオへのペアと驚異的な60億のテキストからイメージへのペアのデータセットが使用されました。このような広範なデータセットは、モデルの多様性と正確性をさまざまなシナリオや主題にわたって確保します。AI競争の中での新しいモデル
このリリースは、米中の間で特に緊張と競争が高まる中で、グローバルなテックの風景で起こっています。
貿易制限や技術自給自足の推進の背景の中で、アリババの動きは国家にとって時期的にも戦略的にも重要です。アリババの最新のイノベーションは孤立した進展ではありませんが、技術的な対立の長い物語の一部です。米国がチップの輸出を制限し、中国が反撃策をとる中、AIの優位性を競い合うレースが加速しています。
この状況は、両国がAI、半導体技術、5Gイノベーションのリーディングポジションを争う中で、国産技術の進歩を促しています。Pika LabsのモデルやStable Video Diffusionなどの他の注目すべき進歩と比較した場合、I2VGen-XLは独自のアプローチと高い意味的な正確さによって差別化されます。HiGen(拡散モデル)とI2VGen-XLを使用したいくつかの例を示したデモでは、HiGen単体を使用した場合と比較して、時間的およびフレームの連続性が大幅に向上しています。
アリババのI2VGen-XLモデルは、中国のユーザーに対して禁止されるモデルや将来的に米国や中国政府に制限される可能性のあるモデルへの代替手段を提供するため、AIの風景における重要な節目となります。
アリババの新興テックプレイアリババは、単なる電子商取引にとどまらない存在です。AI、メタバース、ソフトウェア、さらにはデジタル通貨の領域で新しい展開を続けています。
AI駆動のアニメーションでは、sI2VGen-XLに加えて、アリババの「Animate Anyone」モデルが際立っています。このツールは、静止画像を動的なアニメーションに変換するもので、ReferenceNetという新しいフレームワークを使用しています。高度な拡散モデルを統合することで、時間的に安定したビジュアル的に一貫したビデオを実現しています。
さらに、アリババクラウドはAvalancheと提携してCloudverseプラットフォームを立ち上げました。この技術は、ビジネスがデジタルなユニバースを作成・維持するためのシームレスな経路を提供します。Avalancheとの戦略的提携やMetaverse Universal Assets DAOのミドルウェアソリューションへの関与は、アリババの協業的アプローチとWeb3テクノロジーの活用への献身を浮き彫りにしています。
さらに、ジャック・マーのデジタル通貨に関する洞察は、アリババがグローバル金融の未来に対する熱い関心を示しています。マー氏のデジタル通貨が新たな金融システムの確立における変革的な役割を慢性していることは、金融のデジタル化の成長トレンドと一致しています。アリババのCEOは自らを暗号通貨の懐疑論者と説明していますが、2018年の悪名高い暗号の冬の中、アリババはブロックチェーンをサービスとする事業を立ち上げるなど、暗号通貨に対するヘイトとは程遠い立場です。
Ryan Ozawaによる編集。仮想通貨ニュースを押さえて、毎日のアップデートをインボックスで取得しましょう。メールアドレスを入力して取得しましょう。