出版社内容情報
分散AIの学習・推論を支えるネットワーク設計と運用を、ジョブ進行の視点から解説する実務書です。一般的なアプリケーションとは異なり、AIのためのネットワーク(AIネットワーク)では、平均指標では見えないテール遅延や同期通信の罠があります。集合通信・輻輳制御・テレメトリなどにより本書ではAIネットワークを、安全かつ予測可能に設計・運用するための原理と実践を示します。
【目次】
Introduction AIネットワーキングの序章
CHAPTER 1 AIワークロードにおける並列処理と分散コンピューティング
CHAPTER 2 AIに最適なネットワーク基盤の設計
CHAPTER 3 RDMAとRoCEの基礎
CHAPTER 4 AIネットワークにおける輻輳制御技術
CHAPTER 5 AIのためのネットワークデザイン戦略
CHAPTER 6 AIのためのコンピューティング
CHAPTER 7 AIネットワークのセキュリティ戦略
CHAPTER 8 AIネットワークの可視化と運用
CHAPTER 9 AIインフラの未来展望 - 次世代プロトコルと物理層の変革



