Nvlinkに関する最新の質問

0
答える

直接NVLINKアクセスなしでGPUのポイントツーポイントメモリコピーを効率的に行う方法

8つのGPUを搭載したDGXワークステーションでポイントツーポイント通信を実行しようとしています。 NVLINKに直接アクセスするGPU間でcudaMemcpyPeerを使用すると、優れたパフォーマンスを実現できます。ただし、一部のGPUは相互に直接アクセスできません。 NVLINKを使用するための中間点として、いくつかのGPUを使用できると思います。したがって、PCIeを使用せずにデータを転送できます。しかし、私が各デバイスのルーティング計画を手動で書くのは難しいです。より良いAPIまたはソリューションはありますか?

nvidia nvlink gpu cuda

1
答える

個別のコンパイルユニットからインラインデバイス関数をnvlinkできますか?

CADE-0への入力として供給される個別のコンパイル単位の場合| __forceinline__とマークされたデバイス関数を呼び出すcudaカーネルとデバイス関数が含まれていますが、これらの関数はインライン化されますか?すべてのソースコードを1つのファイルに配置すると、インライン化されると想定します。

inline link time optimization nvlink cuda

1
答える

cudaMemcpyAsyncの奇妙な動作:1. cudaMemcpyKindは違いを生じません。 2.コピーは失敗しますが、黙って

Pascal P100 GPU + Nvlinkを搭載した新しいクラスターに慣れています。私は、gpu< -> gpuおよびgpu< -> cpuの帯域幅とピアツーピアアクセスをテストするピンポンプログラムを作成しました。 (cudaサンプルにこのようなプログラムが含まれていることは承知していますが、理解を深めるために自分で作成したいと思います。)Nvlink帯域幅は妥当と思われます(双方向で約35 GB/s、理論上の最大値は40)。しかし、ピンポンのデバッグ中に、私はいくつかの奇妙な動作を発見しました。

cuda cuda uva nvlink

ホットタグ

© 2021   KonnichiwaSekai.Com