詳細説明

このセクションの関数は2D画像に対してさまざまな幾何学的変換を行う。これらは画像の内容を変更しないが、ピクセルグリッドを変形させ、その変形したグリッドをデスティネーション画像にマッピングする。実際には、サンプリングのアーティファクトを避けるため、マッピングは逆順、すなわちデスティネーションからソースへの順で行われる。つまり、デスティネーション画像の各ピクセル \((x, y)\) について、関数はソース画像内の対応する「ドナー」ピクセルの座標を計算し、そのピクセル値をコピーする:

\[\texttt{dst} (x,y)= \texttt{src} (f_x(x,y), f_y(x,y))\]

順方向マッピング \(\left<g_x, g_y\right>: \texttt{src} \rightarrow \texttt{dst}\) を指定した場合、OpenCV の関数はまず対応する逆マッピング \(\left<f_x, f_y\right>: \texttt{dst} \rightarrow \texttt{src}\) を計算し、その後で上記の式を使用する。

幾何学的変換の実際の実装は、最も汎用的な remap から最も単純で最も高速な resize まで、上記の式に関する2つの主要な問題を解決する必要がある:

存在しないピクセルの外挿。前のセクションで説明したフィルタリング関数と同様に、ある \((x,y)\) について、\(f_x(x,y)\) または \(f_y(x,y)\) のいずれか、あるいはその両方が画像の外に落ちる場合がある。この場合、外挿方法を使用する必要がある。OpenCV はフィルタリング関数と同じ外挿方法の選択肢を提供する。さらに、BORDER_TRANSPARENT という方法も提供する。これはデスティネーション画像の対応するピクセルがまったく変更されないことを意味する。
ピクセル値の補間。通常 \(f_x(x,y)\) と \(f_y(x,y)\) は浮動小数点数である。これは \(\left<f_x, f_y\right>\) がアフィン変換または透視変換、あるいは放射状のレンズ歪み補正などになりうることを意味する。そのため、小数座標におけるピクセル値を取得する必要がある。最も単純な場合、座標を最も近い整数座標に丸めて、対応するピクセルを使用できる。これは最近傍補間と呼ばれる。しかし、より洗練された補間方法を使用することでより良い結果が得られる。この方法では、計算されたピクセル \((f_x(x,y), f_y(x,y))\) のある近傍に多項式関数を当てはめ、\((f_x(x,y), f_y(x,y))\) における多項式の値を補間されたピクセル値とする。OpenCV では複数の補間方法から選択できる。詳細は resize を参照。

覚え書き: 幾何学的変換は CV_8S または CV_32S 画像では機能しない。

名前空間
namespace	cv::fisheye
	この名前空間のメソッドは、いわゆる魚眼カメラモデルを用いる。

列挙型
enum	cv::InterpolationFlags { cv::INTER_NEAREST = 0 , cv::INTER_LINEAR = 1 , cv::INTER_CUBIC = 2 , cv::INTER_AREA = 3 , cv::INTER_LANCZOS4 = 4 , cv::INTER_LINEAR_EXACT = 5 , cv::INTER_NEAREST_EXACT = 6 , cv::INTER_MAX = 7 , cv::WARP_FILL_OUTLIERS = 8 , cv::WARP_INVERSE_MAP = 16 , cv::WARP_RELATIVE_MAP = 32 }
	補間アルゴリズム続き...

enum	cv::InterpolationMasks { cv::INTER_BITS = 5 , cv::INTER_BITS2 = INTER_BITS * 2 , cv::INTER_TAB_SIZE = 1 << INTER_BITS , cv::INTER_TAB_SIZE2 = INTER_TAB_SIZE * INTER_TAB_SIZE }

enum	cv::UndistortTypes { cv::PROJ_SPHERICAL_ORTHO = 0 , cv::PROJ_SPHERICAL_EQRECT = 1 }
	cv::undistort モード続き...

enum	cv::WarpPolarMode { cv::WARP_POLAR_LINEAR = 0 , cv::WARP_POLAR_LOG = 256 }
	極座標マッピングモードを指定する。続き...

関数
void	cv::convertMaps (InputArray map1, InputArray map2, OutputArray dstmap1, OutputArray dstmap2, int dstmap1type, bool nninterpolation=false)
	画像変換マップをある表現から別の表現に変換する。

void	cv::getRectSubPix (InputArray image, Size patchSize, Point2f center, OutputArray patch, int patchType=-1)
	画像からサブピクセル精度でピクセル矩形を取得する。

void	cv::initInverseRectificationMap (InputArray cameraMatrix, InputArray distCoeffs, InputArray R, InputArray newCameraMatrix, const Size &size, int m1type, OutputArray map1, OutputArray map2)
	射影および逆整列変換マップを計算する。本質的には、これはプロジェクタ・カメラ対におけるプロジェクタ（「逆カメラ」）のステレオ整列に対応するための initUndistortRectifyMap の逆変換である。

void	cv::initUndistortRectifyMap (InputArray cameraMatrix, InputArray distCoeffs, InputArray R, InputArray newCameraMatrix, Size size, int m1type, OutputArray map1, OutputArray map2)
	歪み補正および矯正変換マップを計算する。

float	cv::initWideAngleProjMap (InputArray cameraMatrix, InputArray distCoeffs, Size imageSize, int destImageWidth, int m1type, OutputArray map1, OutputArray map2, enum UndistortTypes projType=PROJ_SPHERICAL_EQRECT, double alpha=0)
	広角向けの remap 用マップを初期化する

static float	cv::initWideAngleProjMap (InputArray cameraMatrix, InputArray distCoeffs, Size imageSize, int destImageWidth, int m1type, OutputArray map1, OutputArray map2, int projType, double alpha=0)

void	cv::remap (InputArray src, OutputArray dst, InputArray map1, InputArray map2, int interpolation, int borderMode=BORDER_CONSTANT, const Scalar &borderValue=Scalar(), AlgorithmHint hint=cv::ALGO_HINT_DEFAULT)
	画像に汎用的な幾何学的変換を適用する。

void	cv::resize (InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR)
	画像をリサイズする。

void	cv::undistort (InputArray src, OutputArray dst, InputArray cameraMatrix, InputArray distCoeffs, InputArray newCameraMatrix=noArray())
	レンズ歪みを補正するために画像を変換する。

void	cv::warpAffine (InputArray src, OutputArray dst, InputArray M, Size dsize, int flags=INTER_LINEAR, int borderMode=BORDER_CONSTANT, const Scalar &borderValue=Scalar(), AlgorithmHint hint=cv::ALGO_HINT_DEFAULT)
	画像にアフィン変換を適用する。

void	cv::warpPerspective (InputArray src, OutputArray dst, InputArray M, Size dsize, int flags=INTER_LINEAR, int borderMode=BORDER_CONSTANT, const Scalar &borderValue=Scalar(), AlgorithmHint hint=cv::ALGO_HINT_DEFAULT)
	画像に透視変換を適用する。

void	cv::warpPolar (InputArray src, OutputArray dst, Size dsize, Point2f center, double maxRadius, int flags)
	画像を極座標または準対数極座標空間へ再マッピングする。

列挙値
INTER_NEAREST Python: cv.INTER_NEAREST	最近傍補間
INTER_LINEAR Python: cv.INTER_LINEAR	双線形補間
INTER_CUBIC Python: cv.INTER_CUBIC	バイキュービック補間
INTER_AREA Python: cv.INTER_AREA	ピクセル領域の関係を用いたリサンプリング。モアレのない結果が得られるため、画像の縮小に適した方法である。ただし画像を拡大する場合は INTER_NEAREST 法と同様の結果になる。
INTER_LANCZOS4 Python: cv.INTER_LANCZOS4	8x8 近傍にわたる Lanczos 補間
INTER_LINEAR_EXACT Python: cv.INTER_LINEAR_EXACT	ビット精度の双線形補間
INTER_NEAREST_EXACT Python: cv.INTER_NEAREST_EXACT	ビット精度の最近傍補間。これは PIL, scikit-image, Matlab における最近傍法と同じ結果を生成する。
INTER_MAX Python: cv.INTER_MAX	補間コード用のマスク
WARP_FILL_OUTLIERS Python: cv.WARP_FILL_OUTLIERS	フラグ。デスティネーション画像のすべてのピクセルを埋める。そのうちのいくつかがソース画像の外れ値に対応する場合、それらはゼロに設定される
WARP_INVERSE_MAP Python: cv.WARP_INVERSE_MAP	フラグ、逆変換
WARP_RELATIVE_MAP Python: cv.WARP_RELATIVE_MAP

列挙値
INTER_BITS Python: cv.INTER_BITS
INTER_BITS2 Python: cv.INTER_BITS2
INTER_TAB_SIZE Python: cv.INTER_TAB_SIZE
INTER_TAB_SIZE2 Python: cv.INTER_TAB_SIZE2

列挙値
PROJ_SPHERICAL_ORTHO Python: cv.PROJ_SPHERICAL_ORTHO
PROJ_SPHERICAL_EQRECT Python: cv.PROJ_SPHERICAL_EQRECT

列挙値
WARP_POLAR_LINEAR Python: cv.WARP_POLAR_LINEAR	画像を極座標空間との間で再マッピングする。
WARP_POLAR_LOG Python: cv.WARP_POLAR_LOG	画像を半対数極座標空間との間で再マッピングする。

void cv::convertMaps	(	InputArray	map1,
		InputArray	map2,
		OutputArray	dstmap1,
		OutputArray	dstmap2,
		int	dstmap1type,
		bool	nninterpolation = false )

map1	型が CV_16SC2, CV_32FC1, または CV_32FC2 の1番目の入力マップ。
map2	それぞれ型が CV_16UC1, CV_32FC1, または none (空の行列) の2番目の入力マップ。
dstmap1	型が dstmap1type で src と同じサイズを持つ1番目の出力マップ。
dstmap2	2つ目の出力マップ。
dstmap1type	CV_16SC2, CV_32FC1, または CV_32FC2 とすべき1番目の出力マップの型。
nninterpolation	固定小数点マップを最近傍補間に用いるか、より複雑な補間に用いるかを示すフラグ。

void cv::getRectSubPix	(	InputArray	image,
		Size	patchSize,
		Point2f	center,
		OutputArray	patch,
		int	patchType = -1 )

image	入力画像。
patchSize	抽出するパッチのサイズ。
center	ソース画像内で抽出する矩形の中心の浮動小数点座標。中心は画像内になければならない。
patch	サイズが patchSize で src と同じチャンネル数を持つ、抽出されたパッチ。
patchType	抽出されるピクセルのビット深度。デフォルトでは src と同じビット深度を持つ。

void cv::initInverseRectificationMap	(	InputArray	cameraMatrix,
		InputArray	distCoeffs,
		InputArray	R,
		InputArray	newCameraMatrix,
		const Size &	size,
		int	m1type,
		OutputArray	map1,
		OutputArray	map2 )

cameraMatrix	入力カメラ行列 \(A=\vecthreethree{f_x}{0}{c_x}{0}{f_y}{c_y}{0}{0}{1}\) 。
distCoeffs	歪み係数の入力ベクトル \((k_1, k_2, p_1, p_2[, k_3[, k_4, k_5, k_6[, s_1, s_2, s_3, s_4[, \tau_x, \tau_y]]]])\) で、4, 5, 8, 12, または 14 要素。ベクトルが NULL/空の場合、歪み係数は 0 と仮定される。
R	オブジェクト空間における省略可能な平行化(rectification)変換(3x3行列)。stereoRectify で計算された R1 または R2 をここに渡すことができる。行列が空の場合は、恒等変換が仮定される。
newCameraMatrix	新しいカメラ行列 \(A'=\vecthreethree{f_x'}{0}{c_x'}{0}{f_y'}{c_y'}{0}{0}{1}\)。
size	歪んだ画像のサイズ。
m1type	1つ目の出力マップの型。CV_32FC1, CV_32FC2 または CV_16SC2 のいずれかを指定できる。convertMaps を参照。
map1	remap 用の1つ目の出力マップ。
map2	remap 用の2つ目の出力マップ。

src	入力画像。
dst	デスティネーション画像。map1 と同じサイズを持ち、src と同じ型を持つ。
map1	(x,y) 点、または x 値のみの1番目のマップで、型は CV_16SC2 , CV_32FC1, または CV_32FC2。浮動小数点表現を高速化のために固定小数点へ変換する詳細については convertMaps を参照。
map2	y 値の2つ目のマップで、型はそれぞれ CV_16UC1、CV_32FC1、または none（map1 が (x,y) 点の場合は空のマップ）。
interpolation	補間方法 (InterpolationFlags を参照)。INTER_AREA INTER_LINEAR_EXACT および INTER_NEAREST_EXACT の各方法はこの関数ではサポートされていない。補間方法に追加フラグ WARP_RELATIVE_MAP をOR結合できる（例: INTER_LINEAR \| WARP_RELATIVE_MAP）。
borderMode	ピクセルの外挿方法 (BorderTypes を参照)。borderMode=BORDER_TRANSPARENT の場合、ソース画像の「外れ値」に対応するデスティネーション画像のピクセルがこの関数によって変更されないことを意味する。
borderValue	定数境界の場合に使われる値。デフォルトは 0。
hint	実装の動作変更フラグ。線形計算をより高速に行うために、FP16精度(利用可能な場合)を使用するには ALGO_HINT_APPROX を設定する。AlgorithmHint を参照。

src	入力画像。
dst	出力画像。サイズは dsize（非ゼロの場合）、または src.size(), fx, fy から計算されたサイズを持つ。dst の型は src と同じである。
dsize	出力画像のサイズ。ゼロ（Pythonでは `None`）に等しい場合、次のように計算される: \[\texttt{dsize = Size(round(fxsrc.cols), round(fysrc.rows))}\] dsize、または fx と fy の両方のいずれかが非ゼロでなければならない。
fx	水平軸方向のスケール係数。0 の場合は次のように計算される \[\texttt{(double)dsize.width/src.cols}\]
fy	垂直軸方向のスケール係数。0 の場合は次のように計算される \[\texttt{(double)dsize.height/src.rows}\]
interpolation	補間方法。InterpolationFlags を参照

void cv::warpAffine	(	InputArray	src,
		OutputArray	dst,
		InputArray	M,
		Size	dsize,
		int	flags = INTER_LINEAR,
		int	borderMode = BORDER_CONSTANT,
		const Scalar &	borderValue = Scalar(),
		AlgorithmHint	hint = cv::ALGO_HINT_DEFAULT )

src	入力画像。
dst	サイズが dsize で src と同じ型を持つ出力画像。
M	\(2\times 3\) 変換行列。
dsize	出力画像のサイズ。
flags	補間方法 (InterpolationFlags を参照) と、省略可能なフラグ WARP_INVERSE_MAP の組み合わせ。後者は M が逆変換 ( \(\texttt{dst}\rightarrow\texttt{src}\) ) であることを意味する。
borderMode	ピクセルの外挿方法 (BorderTypes を参照)。borderMode=BORDER_TRANSPARENT の場合、ソース画像の「外れ値」に対応するデスティネーション画像のピクセルがこの関数によって変更されないことを意味する。
borderValue	定数境界の場合に使われる値。デフォルトは 0。
hint	実装の動作変更フラグ。線形計算をより高速に行うために、FP16精度(利用可能な場合)を使用するには ALGO_HINT_APPROX を設定する。AlgorithmHint を参照。

void cv::initUndistortRectifyMap	(	InputArray	cameraMatrix,
		InputArray	distCoeffs,
		InputArray	R,
		InputArray	newCameraMatrix,
		Size	size,
		int	m1type,
		OutputArray	map1,
		OutputArray	map2 )

float cv::initWideAngleProjMap	(	InputArray	cameraMatrix,
		InputArray	distCoeffs,
		Size	imageSize,
		int	destImageWidth,
		int	m1type,
		OutputArray	map1,
		OutputArray	map2,
		enum UndistortTypes	projType = PROJ_SPHERICAL_EQRECT,
		double	alpha = 0 )

void cv::remap	(	InputArray	src,
		OutputArray	dst,
		InputArray	map1,
		InputArray	map2,
		int	interpolation,
		int	borderMode = BORDER_CONSTANT,
		const Scalar &	borderValue = Scalar(),
		AlgorithmHint	hint = cv::ALGO_HINT_DEFAULT )

void cv::resize	(	InputArray	src,
		OutputArray	dst,
		Size	dsize,
		double	fx = 0,
		double	fy = 0,
		int	interpolation = INTER_LINEAR )

void cv::undistort	(	InputArray	src,
		OutputArray	dst,
		InputArray	cameraMatrix,
		InputArray	distCoeffs,
		InputArray	newCameraMatrix = noArray() )

src	入力（歪んだ）画像。
dst	src と同じサイズおよび型を持つ出力（補正済み）画像。
cameraMatrix	入力カメラ行列 \(A = \vecthreethree{f_x}{0}{c_x}{0}{f_y}{c_y}{0}{0}{1}\) 。
distCoeffs	歪み係数の入力ベクトル \((k_1, k_2, p_1, p_2[, k_3[, k_4, k_5, k_6[, s_1, s_2, s_3, s_4[, \tau_x, \tau_y]]]])\) で、4, 5, 8, 12, または 14 要素。ベクトルが NULL/空の場合、歪み係数は 0 と仮定される。
newCameraMatrix	歪んだ画像のカメラ行列。デフォルトでは cameraMatrix と同じだが、異なる行列を使って結果をさらにスケールおよびシフトすることもできる。

void cv::warpPerspective	(	InputArray	src,
		OutputArray	dst,
		InputArray	M,
		Size	dsize,
		int	flags = INTER_LINEAR,
		int	borderMode = BORDER_CONSTANT,
		const Scalar &	borderValue = Scalar(),
		AlgorithmHint	hint = cv::ALGO_HINT_DEFAULT )

src	入力画像。
dst	サイズが dsize で src と同じ型を持つ出力画像。
M	\(3\times 3\) 変換行列。
dsize	出力画像のサイズ。
flags	補間方法 (INTER_LINEAR または INTER_NEAREST) と、省略可能なフラグ WARP_INVERSE_MAP の組み合わせ。後者は M を逆変換 ( \(\texttt{dst}\rightarrow\texttt{src}\) ) として設定する。
borderMode	ピクセル外挿方法（BORDER_CONSTANT または BORDER_REPLICATE）。
borderValue	定数境界の場合に使われる値。デフォルトは 0。
hint	実装の動作変更フラグ。線形計算をより高速に行うために、FP16精度(利用可能な場合)を使用するには ALGO_HINT_APPROX を設定する。AlgorithmHint を参照。

void cv::warpPolar	(	InputArray	src,
		OutputArray	dst,
		Size	dsize,
		Point2f	center,
		double	maxRadius,
		int	flags )

src	入力画像。
dst	デスティネーション画像。src と同じ型を持つ。
dsize	デスティネーション画像のサイズ（有効なオプションについては説明を参照）。
center	変換の中心。
maxRadius	変換するバウンディング円の半径。これは逆数の倍率スケール引数も決定する。
flags	補間方法と InterpolationFlags + WarpPolarMode の組み合わせ。線形極座標マッピング（デフォルト）を選択するには WARP_POLAR_LINEAR を追加する半対数極座標マッピングを選択するには WARP_POLAR_LOG を追加する逆マッピングには WARP_INVERSE_MAP を追加する。

詳細説明

名前空間

列挙型

関数

列挙型詳解

◆ InterpolationFlags

◆ InterpolationMasks

◆ UndistortTypes

◆ WarpPolarMode

関数詳解

◆ convertMaps()

◆ getRectSubPix()

◆ initInverseRectificationMap()

◆ initUndistortRectifyMap()

◆ initWideAngleProjMap() [1/2]

◆ initWideAngleProjMap() [2/2]

◆ remap()

◆ resize()

◆ undistort()

◆ warpAffine()

◆ warpPerspective()

◆ warpPolar()