米エスペラント・テクノロジーズがソフト評価可能なRISC-V「生成AIアプライアンス」を開発

以下の記事は、RISC-V協会が、エスペラント・テクノロジーの記事をもとに作成したもので、より正確な情報は、RISC-V Dayに参加することで得てください。

プログラム月日題目発表者場所
① RISC-V ソリューション2024年1月16日急増する AI / ML / HPC マーケットニーズに応える1088 個の超低消費電力ベクトル RISC-V コアを備えた ET-SoC-1 チップ による アクセラレータソリューション (仮題)アート・スウィフト | 代表取締役社長, エスペラント・テクノロジーズ(米国)地下2階 伊藤謝恩ホール
② RISC-V 開発2024年1月16日エスペラント AI / ML / HPC アクセラレータを使ったデータセンタ製品のソフト評価環境(仮題笠原 栄二 | エスペラントテクノロジーズ(米国)地下1階ギャラリー1

RISC-V Day 参加登録はここをクリック

 

エスペラント・テクノロジーズは、RISC-V技術に基づくスケールアウトが可能な「生成AI家電」を開発した。英語では「Generative AI Appliance」であり、エスペラント語で同様の表現をする場合は、直訳すると「Generativa AI Aparato」となるかもしれない。この開発はAIとコンピューティングの分野における重要な進歩であり、Generative AIの需要と応用を対象としている。さらにエスペラント RISC-V AI半導体ET-SoC-1のAI/HPC プラットフォームはMETA OPTでLLM評価可能。エスペラントの「大規模言語モデル」を評価することができる。RISC-V AI半導体 ET-SoC-1を使用した AI/HPC プラットフォーム上で、META OPTをLLM評価可データプライバシーを維持する必要があるヘルスケア、法律、金融業界などに最適である。エスペラント は、RISC-V 命令セットを活用してプロセッサ設計をすることで、幅広い領域の AI および HPC ワークロードの組み合わせに対し良好なエネルギー効率を提供できる。「生成AI家電」の製品の設計には、機械的、熱的、電気的、ファームウェアの各側面が含まれる。単なるステートメントでないことがわかる。

特筆すべき点は、2023年4月25日に、AIチップET-SoC-1を使って生成AIの評価をできるハードウエアとソフトウエアが揃っていて、ユーザ企業が評価できることである。エスペラントは、自社チップを使ったデータセンターシステムにMetaのOpen Pre-Trained Transformerモデルを移植した。生成AI処理の性能と電力消費を7ナノメータのチップを使用した評価サーバーで実行できる利点は大きい。理論的な性能指標でなく、実アプリケーション環境でのチップの能力を解析する手段が提供されている。AIチップの実用性は、理論的な処理能力や効率だけでなく、具体的なユースケースにおけるパフォーマンスで決まる。エスペラントが実世界アプリケーションに関連するベンチマークを提供することで、顧客が製品を評価し、その利点を理解できる。

この「生成AI家電」は以下の特徴を持っている:

1。先端RISC-Vハードウェア:  7ナノメータのRISC-V技術を利用することで、高性能かつエネルギー効率の良いコンピューティングソリューションを提供する。これにより、生成AIやその他のAI、大規模な高性能コンピューティング(HPC)のワークロードに適している。

2。導入の容易さ: ユーザーフレンドリーに設計されており、開発者は迅速に垂直アプリケーションを作成して展開できる。プリロードされ、自己完結型であるため、最新のモデルをハードウェアプラットフォームにダウンロード、ポート、チューニングする必要がない。

3。データプライバシーと低い総所有コスト(TCO): 統合されたソフトウェア/ハードウェアソリューションにより、プライベートデータセンターやエンタープライズエッジにインストールできます。これにより、高いレベルのデータプライバシーを確保し、TCOを低減する。

4。最新のLLMおよび画像生成モデルの実行: 現在、LLaMA 2、Vicuna、StarCoder、OpenJourney、Stable Diffusionなどの最新のLarge Language Models(LLM)と画像生成モデルをサポートしている。エスペラントは、これらのモデルの最新バージョンをリリースされ次第、システムを継続的にアップデートする予定としている。

5。さまざまな業界向けに設計: このアプライアンスは、迅速かつ正確なデータ処理を必要とし、データプライバシーを維持する必要があるヘルスケア、法律、金融業界などに最適である。

6。エネルギー効率とコスト効率: 伝統的なGPUベースのシステムに比べて、よりエネルギー効率が高くコスト効果の高い代替手段として位置づけられています。高い精度で低いトレーニングおよび推論コストを提供する小型で効率的なLLMおよび拡散モデルへの傾向が高まっている。

7。製品の利用可能性: 現在利用可能で、最大4つのLLMを同時に実行できるET-SoC-1 AIアクセラレータチップが含まれています。標準的な2U高ラックマウントシャーシで提供される。

学習と推論を同時に行う 自然言語型AI実時間対話システムChatGPTは2023年1月にアプリ史上最速で1億アクティブユーザーに到達した。OpenAIはChatGPTが2023年に2億ドルの収益を生むと予測している。AI市場全体は2023年に2079億ドルだが、2030年までには1兆8400億ドルに成長すると見込まれている。さらに、アメリカのAI市場は2025年には4204億6500万ドルに成長すると予想されている。

NVIDIAはAIアクセラレータの市場を独占していて、H100 AI GPUは世界中のデータセンターに導入されている。2024年には約350万台のH100 AI GPUが出荷され、年間約13,000 GWhの電力を消費すると推定される。NVIDIAは次世代のH200 AI GPUやBlackwellGPUアーキテクチャによるB100 AI GPUを計画しており、より効率的な電力性能とAIの性能向上が期待されている。NVIDIA の AI GPUは2024 年までに年間 13,000 GWh の電力を消費すると予測されており、これはグアテマラやリトアニアなどの1国の電力需要に匹敵する。

こうした状況を踏まえて、RISC-V を使用した、エスペラント社は、より持続可能で電力効率の高いコンピューティング ソリューションを目指している。エネルギー効率の高い AI アクセラレーションの代替手段を提供する取り組みは、業界全体の電力消費量を減少させるために社会的に重要な意味を持つ。同社は、高度な AI アプリケーションに必要な計算能力を提供しながら、消費電力の削減を優先する、競争力のある AI アクセラレータの開発をしている。エスペラント社は、AI/HPC RISC-V プラットフォームとしてすでに出荷している。

エスペラント・テクノロジーズは、高性能AIチップ、特にET-SoC-1の性能最適化に注力している。ET-SoC-1は、1,000以上の汎用64ビットRISC-V CPUで構成されており、それぞれAIアプリケーション向けにベクター/テンソルユニットで強化されています。この設計により、ET-SoC-1はAIと非AIの並列ワークロードの両方に適した柔軟なプラットフォームとなっている。同社のAIチップ開発アプローチには、クワッドイシューのアウトオブオーダー実行、ブランチ予測、洗練されたプリフェッチアルゴリズムなどの高度な機能を実装するカスタム64ビット単一スレッドRISC-Vマイクロプロセッサコア、ET-Maxionの使用が含まれています。これらの機能は、高い単一スレッド性能を提供することを目的としています。ET-Maxionコアは、ET-Minionコアの配列全体でのタスク管理、データの移動処理、オペレーティングシステムのホスティングに不可欠です。アクセラレータ構成では、ホスト処理タスクをオフロードし、ドルあたりの全体的なシステム性能を向上させることを目指している。

エスペラント社は、複雑なAIチップのプログラミングをサポートするツールを開発した。これらのツールは、トレーニングされたモデルを複数のチップにまたがる最適化されたアプリケーションに変換するように設計されており、PyTorchやTensorFlowなどの主要な機械学習フレームワークをサポートしています。これは、ジェネレーティブAIで一般的な大規模言語モデル(LLM)に特に関連しています。今後の展望として、エスペラントはすでに、次世代のジェネレーティブAI大規模言語モデルと高性能コンピューティング(HPC)ワークロードを加速するためのアーキテクチャを強化している。今後のチップデザインでは、推論に加えてトレーニングタスクに対応することを目指し、改良されたMinionとMaxionコア、およびRVV互換のベクター/テンソルユニットを使用して、64ビットのHPCワークロードから8ビット浮動小数点AI推論まで幅広いワークロードを処理する予定だそうだ。

エスペラント社がLLM(Large Language Models)やビジョン認識を処理するためのチップ、システム、ソフトウェアなど包括的な提供を持つことは、彼らを強力な競合者として位置付けることができる。半導体設計、システム統合、ソフトウェア開発の専門知識を持つことは、特に広範なAIとコンピューティング分野の文脈で、Esperantoを競争力のある存在としている。

エスペラント社がAIワークロード向けにハードウェアアクセラレータ、システムデザイン、ソフトウェア最適化など、エンドツーエンドのソリューションを提供できる能力は、Google、Facebook(Meta)、Amazonなどの主要プレーヤーと効果的に競争することを可能にしている。これらの大手企業もAIと並行計算に大規模な投資を行っている。

IntelとMotorolaの競争の歴史は、半導体業界における競争がシステム最適性よりも開発時期が重要だということを指摘する点で関連性がある。革新的なソリューションを持つ新興企業が既存のプレーヤーを破壊できる可能性があることを示している。今日の半導体およびAI業界のダイナミクスは、過去とは異なるかもしれないことに注意する必要はある。成功には技術革新、市場の受け入れ、戦略的位置づけなどの要因の組み合わせに依存する。

エスペラント社がAIおよびコンピューティング業界での競争相手として成功するためには、ソリューションの性能と効率、業界パートナーシップ、顧客の採用、迅速に変化する分野で競争力を維持する能力など、さまざまな要因が関与する。エスペラント社はAIおよびコンピューティング業界で強力なコンテンダーであるという結論は動かせないものである。しかし、競争の景色は複雑であり、成功には技術革新や市場のダイナミクスなど、さまざまな要因が影響する。これからも、エスペラント社には特別の注意を払っていく必要がある。