OpenCV 4.5.3(日本語機械翻訳)
公開メンバ関数 | 全メンバ一覧
cv::cuda::BufferPool クラス

BufferPool for use with CUDA streams [詳解]

#include <cuda.hpp>

公開メンバ関数

BufferPool (Stream &stream)
ストリームのBufferPoolを取得します。
CV_WRAP GpuMat getBuffer (int rows, int cols, int type)
与えられたサイズとタイプの新しいGpuMatを割り当てます。
CV_WRAP GpuMat getBuffer (Size size, int type)
与えられたサイズとタイプの新しいGpuMatを割り当てます。
CV_WRAP Ptr< GpuMat::Allocator > getAllocator () const
ストリームに関連するアロケータを返します。

詳解

BufferPoolCUDAストリームでの使用

BufferPoolを利用します。Streamのアロケータを利用して、新しいバッファをGpuMat's. この機能は #setBufferPoolUsage で有効にした場合のみ有効です。

CV_EXPORTS_W void setBufferPoolUsage(bool on)
BufferPool management (must be called before Stream creation)
覚え書き
setBufferPoolUsage は、#setBufferPoolUsage の前に呼び出されなければなりません。の前に呼び出される必要があります。どんなStream宣言の前に呼び出す必要があります。

ユーザーは、カスタムアロケータをStreamにカスタムアロケータを指定して、同じ基盤のGPUメモリ管理を利用した独自のストリームベースの関数を実装することができます。

カスタムアローケータが指定されていない場合はBufferPoolはデフォルトでStackAllocatorを使用します。StackAllocatorは事前にGPUデバイスメモリのチャンクを確保し、後で宣言されたときにGpuMatが宣言されると,事前に割り当てられたメモリが与えられます。このような戦略により、cudaMallocやcudaMallocPitchなどのメモリ割り当てAPIの呼び出し回数を減らすことができます。

以下は、StackAllocatorを利用した例です。BufferPoolとStackAllocatorを利用した例です。

#include <opencv2/opencv.hpp>
using namespace cv;
using namespace cv::cuda
int main()
{
setBufferPoolUsage(true); // Tell OpenCV that we are going to utilize BufferPool
setBufferPoolConfig(getDevice(), 1024 * 1024 * 64, 2); // Allocate 64 MB, 2 stacks (default is 10 MB, 5 stacks)
Stream stream1, stream2; // Each stream uses 1 stack
BufferPool pool1(stream1), pool2(stream2);
GpuMat d_src1 = pool1.getBuffer(4096, 4096, CV_8UC1); // 16MB
GpuMat d_dst1 = pool1.getBuffer(4096, 4096, CV_8UC3); // 48MB, pool1 is now full
GpuMat d_src2 = pool2.getBuffer(1024, 1024, CV_8UC1); // 1MB
GpuMat d_dst2 = pool2.getBuffer(1024, 1024, CV_8UC3); // 3MB
cvtColor(d_src1, d_dst1, CV_GRAY2BGR, 0, stream1);
cvtColor(d_src2, d_dst2, CV_GRAY2BGR, 0, stream2);
}
BufferPool(Stream &stream)
Gets the BufferPool for the given stream.
CV_EXPORTS_W int getDevice()
Returns the current device index set by cuda::setDevice or initialized by default.
CV_EXPORTS_W void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0)
Converts an image from one color space to another.
cv
"black box" representation of the file storage associated with a file on disk.
Definition: aruco.hpp:75

上の例でプール1にもう1つGpuMatをプール1に割り当てると、プール1のスタックがいっぱいになるため、DefaultAllocatorによって実行されます。

GpuMat d_add1 = pool1.getBuffer(1024, 1024, CV_8UC1); // Stack for pool1 is full, memory is allocated with DefaultAllocator

上の例で3つ目のストリームが宣言されている場合、そのストリーム内でのgetBufferを使用してそのストリーム内に割り当てても、スタックが不足しているため、DefaultAllocatorによって実行されます。

Stream stream3; // Only 2 stacks were allocated, we've run out of stacks
BufferPool pool3(stream3);
GpuMat d_src3 = pool3.getBuffer(1024, 1024, CV_8UC1); // Memory is allocated with DefaultAllocator
警告
StackAllocatorを利用する際には、deallocationの順番が重要です。

スタックと同じように、デアロケーションはLIFO順に行われなければなりません。以下は、LIFO ルールに違反する誤った使用方法の例です。OpenCV を Debug モードでコンパイルした場合,このサンプルコードは CV_Assert エラーを出します.

int main()
{
setBufferPoolUsage(true); // Tell OpenCV that we are going to utilize BufferPool
Stream stream; // A default size (10 MB) stack is allocated to this stream
BufferPool pool(stream);
GpuMat mat1 = pool.getBuffer(1024, 1024, CV_8UC1); // Allocate mat1 (1MB)
GpuMat mat2 = pool.getBuffer(1024, 1024, CV_8UC1); // Allocate mat2 (1MB)
mat1.release(); // erroneous usage : mat2 must be deallocated before mat1
}

C++ のローカル変数は,構築時とは逆の順序で破棄されるので,以下のコードサンプルは LIFO 規則を満たしています.ローカルGpuMatが解放されると,対応するメモリが自動的にプールに戻され,後で使用できるようになります.

int main()
{
setBufferPoolUsage(true); // Tell OpenCV that we are going to utilize BufferPool
setBufferPoolConfig(getDevice(), 1024 * 1024 * 64, 2); // Allocate 64 MB, 2 stacks (default is 10 MB, 5 stacks)
Stream stream1, stream2; // Each stream uses 1 stack
BufferPool pool1(stream1), pool2(stream2);
for (int i = 0; i < 10; i++)
{
GpuMat d_src1 = pool1.getBuffer(4096, 4096, CV_8UC1); // 16MB
GpuMat d_dst1 = pool1.getBuffer(4096, 4096, CV_8UC3); // 48MB, pool1 is now full
GpuMat d_src2 = pool2.getBuffer(1024, 1024, CV_8UC1); // 1MB
GpuMat d_dst2 = pool2.getBuffer(1024, 1024, CV_8UC3); // 3MB
d_src1.setTo(Scalar(i), stream1);
d_src2.setTo(Scalar(i), stream2);
cvtColor(d_src1, d_dst1, CV_GRAY2BGR, 0, stream1);
cvtColor(d_src2, d_dst2, CV_GRAY2BGR, 0, stream2);
// The order of destruction of the local variables is:
// d_dst2 => d_src2 => d_dst1 => d_src1
// LIFO rule is satisfied, this code runs without error
}
}

このクラス詳解は次のファイルから抽出されました: