ホーム / 「NPUとは何で、AIの魔法がどのように起こるのを助けるのですか?」

「NPUとは何で、AIの魔法がどのように起こるのを助けるのですか?」

2024/11/28 3:00:15
スマートフォンのSoC(システムチップ)は、複雑なマイクロ機械で、CPU、GPU、音声とビデオ処理、無線通信、電力管理が詰め込まれています。最近、NPU(ニューラル・プロセッシング・ユニット)が追加され、AI機能を促進しています。NPUは、画像やテキストの認識、テキスト生成、音声をテキストに変換、リアルタイム翻訳、次にタイプしたいと思われる単語の予測など、AIタスクを加速します。NPUの利点は、電力消費量の削減と、クラウド計算に依存性の少ないデバイスでのAI操作です。多くの新しい携帯電話にはNPUが搭載されていますが、一部の携帯電話はAI計算をより速く行うことができます。AIタスクのパフォーマンスを測定する指標はTOPS(毎秒兆オペレーション)です。
「NPUとは何で、AIの魔法がどのように起こるのを助けるのですか?」
現代のスマートフォンの「脳」は、そのSoC(システムチップ)で、驚くほど複雑なマイクロ機械です。SoCには、CPUとGPU、音声とビデオ処理、無線通信、電力管理が fingernail のサイズの半導体チップに詰め込まれています。SoCはさらに高度化しています。最近追加されたのは、AI機能を促進するNPUです。あなたの携帯電話は、最近のモデルであればNPU(ニューラル・プロセッシング・ユニット)を搭載しています。コストが安価なサムスン Galaxy A25も、そのExynos 1280チップにNPUが含まれています。しかし、NPUは何をし、それが何の違いをもたらすのでしょうか?それについて詳しく見てみましょう。NPUはニューラル・プロセッシング・ユニットの略称です。これは、スマートフォンのSoC(システム・オン・チップ)に含まれる計算モジュールで、CPU(中央処理機)やGPU(グラフィックス・プロセッシング・ユニット)と同様に機能します。最近のSnapdragon、Exynos、Dimensity、Apple AシリーズモデルのSoC、そしてIntel、AMD、Appleによって製造された一部のデスクトップとモバイルPCのプロセッサにもNPUが搭載されています。携帯電話SoCには既にNPUが搭載されています。Qualcommは2015年以来、Snapdragon 820でAIエンジン(PDF)を導入し、ハードウェアとソフトウェアの組み合わせでAIタスクを処理しています。Appleは2017年にA11 BionicチップでニューラルエンジンNPUを導入しました。しかし、まだ不完全なかもしれませんが、AIに関する話題とそれが提供する機能により、今日でもより関連性があります。閉じるNPUの役割は、人工知能と機械学習アプリケーションに関連するタスクを加速することです。例には、画像やテキストの認識、テキスト生成、音声をテキストに変換、リアルタイム翻訳、次にタイプしたいと思われる単語の予測などが含まれます。これらの機能を実行するにはNPUが必要ありませんが、それがプロセスを速く、エネルギー効率的で、クラウド計算に依存性が少ないようになります。AIタスクに必要な計算は非常に特定的であるため、その処理単位を最適化することは意味があります。もし興味があり、数学が好きなら、ロンドンのキングズコールのA.C.C. Coolenは神経ネットワークの数学を詳しく掘り下げます。また、Vsauceの名門のマイケル・ステビンズは、彼のYouTubeビデオで動作する神経ネットワークを紹介しています。ネットワークが機能するためには、基本的なが多数の操作が同時に実行されています。

CPUは汎用的な単位で、複雑な数学演算を高速で高精度で行うことができます。しかし、AI作業では多くの計算を並列で実行する必要がありますが、精度はあまり重要ではありません。GPUは、その並列性によりCPUよりも適しています。それでも、IBMはNPUの効率性から優れた性能を発揮していると言っています。NPUは、電力消費量を大幅に削減しながら類似のAIパフォーマンスを提供でき、これによりモバイルやバッテリーパワードデバイスに最適です。

SoCにNPUを含む利点のもう一つは、クラウドで行われるのではなくデバイスで一部のAI操作を行うことです。これは、クラウドの方が遅い場合があります。これは、音声認識などの軽量な負荷に適しています。また、センサー入力が関与し、すぐに結果が必要な場合、例えばカメラアプリでシーン内の物体を検出する場合も最適です。AIモデルは、あなたの入力を処理するコードで、ローカルに保存されています。Google Pixel Studioのようなアプリは、ローカルとクラウドのAIモデルを組み合わせたハイブリッドアプローチを使用しています。デバイス内AIはプライバシーにも優れています。提供する個人データ(音声、テキスト、ビデオ形式)は電話から外に出る必要はありません。これにより、データ漏洩によって悪意のある人物がアクセスする可能性がなくなります。Google Pixel 9のスペックページを確認すると、強調して推奨されているAI機能を持つ電話ですが、NPU(ニューラルプロセッシングユニット)についての任何の記載が見つかりません。これは、TPU(テンソル処理ユニット)を使用しているためです。

NPUと同様に、TPUはAI計算を加速します。違いは、TPUとTPUチップはGoogleによってカスタマイズ設計されていることです。これらはGoogleのハードウェアとデータセンターのみで見つけることができます。テンソル処理単位は、Googleが開発し、機械学習とAIアプリケーションに設計されたオープンソースソフトウェアライブラリであるTensorFlowに最適化されています。

多くの新しい携帯電話にはNPU(ニューラルプロセッサ)が搭載されていますが、一部の携帯電話はAI計算をより速く行うことができます。TOPS(毎秒兆オペレーション)は、AIプロセッサのパフォーマンスを測定する一般的な指標です。Qualcommは、NPUのTOPSを決定する2つの要因を説明します。それは、その動作頻度(クロック速度)と利用可能なMAC(マルチプレクサ・アドダーシン)オペレーション単位の数です。最新のSnapdragon 8 Eliteチップは、その前作であるSnapdragon 8 Gen 3と比べて45%のAI性能の向上が誇られています。Snapdragon 8 Gen 3の最高峰は45 TOPSです。これは、高級のNvidia RTX 4090デスクトップグラフィックスカードが提供する1,300+ TOPSに比べて少ないですが、それでもNvidiaの巨物が450ワットを消費するとは言えません。AIタスクの要件については数字を背景に置くのが難しいですが、MicrosoftのCopilot+ AIチャットボットは最小で40 TOPSが必要です。神経処理単位は、CPUやGPUを置き換えるつもりはありません。代わりに、モバイルSoCの効率を向上させるためにAIタスクを担当しつつバッテリー消費を抑制することを目指しています。AIがスマートフォンに統合されていくにつれて、今後NPUsについてもっと話すことが増えるでしょう。今のところ、AIがあなたに何ができるかを詳しく見るために、お気に入りのSamsung GalaxyのAI機能をおチェックしてみてください。