BufferPoolCUDAストリームでの使用
BufferPoolを利用します。Streamのアロケータを利用して、新しいバッファをGpuMat's. この機能は #setBufferPoolUsage で有効にした場合のみ有効です。
CV_EXPORTS_W void setBufferPoolUsage(bool on)
BufferPool management (must be called before Stream creation)
- 覚え書き
- setBufferPoolUsage は、#setBufferPoolUsage の前に呼び出されなければなりません。の前に呼び出される必要があります。どんなStream宣言の前に呼び出す必要があります。
ユーザーは、カスタムアロケータをStreamにカスタムアロケータを指定して、同じ基盤のGPUメモリ管理を利用した独自のストリームベースの関数を実装することができます。
カスタムアローケータが指定されていない場合はBufferPoolはデフォルトでStackAllocatorを使用します。StackAllocatorは事前にGPUデバイスメモリのチャンクを確保し、後で宣言されたときにGpuMatが宣言されると,事前に割り当てられたメモリが与えられます。このような戦略により、cudaMallocやcudaMallocPitchなどのメモリ割り当てAPIの呼び出し回数を減らすことができます。
以下は、StackAllocatorを利用した例です。BufferPoolとStackAllocatorを利用した例です。
#include <opencv2/opencv.hpp>
using namespace
cv::cuda
int
main()
{
setBufferPoolConfig(
getDevice(), 1024 * 1024 * 64, 2);
Stream stream1, stream2;
GpuMat d_src1 = pool1.getBuffer(4096, 4096, CV_8UC1);
GpuMat d_dst1 = pool1.getBuffer(4096, 4096, CV_8UC3);
GpuMat d_src2 = pool2.getBuffer(1024, 1024, CV_8UC1);
GpuMat d_dst2 = pool2.getBuffer(1024, 1024, CV_8UC3);
cvtColor(d_src1, d_dst1, CV_GRAY2BGR, 0, stream1);
cvtColor(d_src2, d_dst2, CV_GRAY2BGR, 0, stream2);
}
BufferPool(Stream &stream)
Gets the BufferPool for the given stream.
CV_EXPORTS_W int getDevice()
Returns the current device index set by cuda::setDevice or initialized by default.
CV_EXPORTS_W void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0)
Converts an image from one color space to another.
"black box" representation of the file storage associated with a file on disk.
Definition:
aruco.hpp:75
上の例でプール1にもう1つGpuMatをプール1に割り当てると、プール1のスタックがいっぱいになるため、DefaultAllocatorによって実行されます。
GpuMat d_add1 = pool1.getBuffer(1024, 1024, CV_8UC1);
上の例で3つ目のストリームが宣言されている場合、そのストリーム内でのgetBufferを使用してそのストリーム内に割り当てても、スタックが不足しているため、DefaultAllocatorによって実行されます。
Stream stream3;
GpuMat d_src3 = pool3.getBuffer(1024, 1024, CV_8UC1);
- 警告
- StackAllocatorを利用する際には、deallocationの順番が重要です。
スタックと同じように、デアロケーションはLIFO順に行われなければなりません。以下は、LIFO ルールに違反する誤った使用方法の例です。OpenCV を Debug モードでコンパイルした場合,このサンプルコードは CV_Assert エラーを出します.
int
main()
{
Stream stream;
GpuMat mat1 = pool.getBuffer(1024, 1024, CV_8UC1);
GpuMat mat2 = pool.getBuffer(1024, 1024, CV_8UC1);
mat1.release();
}
C++ のローカル変数は,構築時とは逆の順序で破棄されるので,以下のコードサンプルは LIFO 規則を満たしています.ローカルGpuMatが解放されると,対応するメモリが自動的にプールに戻され,後で使用できるようになります.
int
main()
{
setBufferPoolConfig(
getDevice(), 1024 * 1024 * 64, 2);
Stream stream1, stream2;
for
(int
i = 0; i < 10; i++)
{
GpuMat d_src1 = pool1.getBuffer(4096, 4096, CV_8UC1);
GpuMat d_dst1 = pool1.getBuffer(4096, 4096, CV_8UC3);
GpuMat d_src2 = pool2.getBuffer(1024, 1024, CV_8UC1);
GpuMat d_dst2 = pool2.getBuffer(1024, 1024, CV_8UC3);
d_src1.setTo(Scalar(i), stream1);
d_src2.setTo(Scalar(i), stream2);
cvtColor(d_src1, d_dst1, CV_GRAY2BGR, 0, stream1);
cvtColor(d_src2, d_dst2, CV_GRAY2BGR, 0, stream2);
}
}