思考をテキストに変換し、ALS患者に声を取り戻させるマインドリーディングAI – Decrypt

※本記事はPRを含みます

ニューラルテック企業であるUnbabelは、Project HaloというプロジェクトをWeb Summitカンファレンスで見事なライブデモンストレーションを行いました。このプロジェクトは、人間と機械の間での無音の思考に基づくコミュニケーションを可能にすることを目指しており、非侵襲性の神経インターフェースと生成型AIを組み合わせて、生体電気信号のパターンを言語に変換します。「私たちの脳の中で起こる普遍的な言語があります」とUnbabelのCEOであるVasco Pedroは述べています。「異なる言語を話す人々のfMRI画像を見ると、同じ物を考えているにもかかわらず、基本的には同じ脳の領域が活性化される」と彼は語りました。

Pedroは、Project Haloがユーザーにイヤーバッドを通じてナレーションされたメッセージを受け取り、それに対して黙想だけで返信することができることを示しました。話すことやタイピングを必要としないメッセージへの返信方法を提供することには、Pedroによれば、様々な潜在的な用途があります。例えば、映画館の暗い中で快適にテキストメッセージに返信することから、筋萎縮性側索硬化症(ALS)の人々がテキストや音声ノートを通じてコミュニケーションする能力を持つようにするなど、人生を変えるような状況もあります。

自分の声でテキスト音声モデルを訓練することにより、彼らは実際に話すことさえできます。Pedroは、ALSを患う患者がProject Haloを使用して妻に昼食の注文を黙って伝えることができるようになった感動的な例を示しました。システムは、彼の望ましい返答を神経信号から解読し、彼が話す能力を失う前に録音された彼の元の声のデジタルな近似によるテキストの返答を合成します。

Unbabelは初めての思考読み取りAIではありません。Metaは以前に報告されたように、人間の脳で認識されるイメージをスキャンし、視覚化するシステムを開発しました。AIは、参加者が画像を見ている間に磁気共鳴の測定値をキャプチャし、元の画像の表現を再構築することで、この偉業を達成しました。

さらに、この分野のもう一つの主要なプレイヤーであるNeuralinkは、先進的な神経インターフェースの研究を行っており、人間での脳インプラントのテストを開始する許可を得ています。しかし、Project Haloの主な特徴は、思考を読み取り自然な言語の返答を生成する能力です。Pedroは、これにはユーザーの個人的な文脈、関係、好みなどを学習することができる言語モデルの統合が必要だと述べました。

これは無制限な思考読み取り技術ではありません。デバイスが反応するためには、ユーザーが本当に回答を入力したいと思わなければなりません。「基本的に、私はAirPodsを通じて質問を読み上げられているわけですが、実際にはここに私の腕にあるEMGという神経インターフェースを使用しています」とPedroは説明しました。「生体信号をキャプチャし、私について多くを知っている大規模な言語モデルが、私が伝えたい回答を作成しようとしています。

」このモデルはまた、従来の手法に比べて約15語/分の処理ができ、2倍も遅くなりません。Pedroは、Project Haloが現在早期段階にあるものの、同社は2024年に商業化を予定していると述べました。彼はHaloが身体的な能力に関係なく、すべての人々に無縁なコミュニケーションを可能にすることを考えています。

「私たちの目標は、AIを善のために活用し、すべての人々がすべての言語でコミュニケーションできるようにすることです。言語の欠如が障壁となることを本当に克服することです」とPedroは述べました。

出典

【最新】仮想通貨をタダでもらう方法
詳細はこちら
【最新】仮想通貨をタダでもらう方法
詳細はこちら
タイトルとURLをコピーしました