音声生成スタートアップのResemble AIは、古いオーディオを復元することを約束します。- Decrypt

※本記事はPRを含みます

このスタートアップは、企業がリアルな人間のようなナレーションを作成するために使用するAI音声生成器も提供している。そして、ヒストリカルオーディオの品質を大幅に向上させるためのオープンソースツール「Resemble Enhance」を発表した。この新しいサービスは、歪んだぼやけた長い間失われていた歴史的なスピーチの録音を取り、AIを適用してまるで昨日録音されたかのように聞こえるようにすることができるという。カナダのこの会社はResemble Enhanceが、背景のハムやヒスを取り除く洗練されたノイズリダクションと、AIによる音声強化技術を組み合わせたデュアルモジュールアプローチであると述べている。

この組み合わせにより、不要なノイズを除去するだけでなく、オーディオ全体の品質も豊かにすることができる。

他のオーディオリストレーション製品が市場に存在しているにも関わらず、Resembleの技術の組み合わせは意義深い差別化要素となる可能性がある。Resemble AIのノイズリダクションは、録音に現れる異なる種類の音を分離するAIモデルUNetを使用している。

それにより、音声を焦点として残し、不要なノイズをフィルタリングすることが得意なのである。UNetが役割を果たした後、強化モジュールが働き、音声の帯域を拡張し、歪みを修正する。この会社は、このデュアル機能が最終的な出力がノイズフリーだけでなく、現代の録音の豊かさも持っていることを保証すると述べている。

オープンソースツールであるResemble Enhanceは無料で入手できるため、メディアリストレーションサービスという通常は高額な市場において魅力的な選択肢となっている。Resemble Enhanceの主な恩恵を受けるのは、ポッドキャスト、エンターテイメント、教育など、クリアな音質に依存する産業である。さらに、このツールは歴史的な録音に新たな息吹を与え、過去のより明確な理解を提供する可能性がある。

ハイクオリティなデジタルコンテンツの需要が過去最高に高まる中、Resemble Enhanceのオープンソース性は、現在高額な所有権ソリューションが市場を支配している中で、潜在的な破壊的な存在となる可能性がある。音声とビデオのAIによる強化の融合は、より包括的なメディアリストレーションソリューションの実現につながるであろう。

このツールを使用して、生成AIまたは他のモデルを用いて画像や顔をアップスケールや強化する他のビデオ強化ツール(例:GPENや有名なGFPGanなど)と組み合わせれば、自分のコンピュータで最小限の投資でプロの結果を得ることができる。Resemble Enhanceを試すために、ユーザーは公式のResemble AIウェブサイトを訪れるか、プロジェクトの公式Githubページからモデルをダウンロードすることができる。

出典

【最新】仮想通貨をタダでもらう方法
詳細はこちら
【最新】仮想通貨をタダでもらう方法
詳細はこちら
タイトルとURLをコピーしました