このクラスはテキスト認識ネットワークの高レベルAPIを表す。詳細...

#include <opencv2/dnn/dnn.hpp>

Collaboration diagram for cv::dnn::TextRecognitionModel:

公開メンバ関数
	TextRecognitionModel ()

	TextRecognitionModel (const Net &network)
	ディープラーニングネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

	TextRecognitionModel (CV_WRAP_FILE_PATH const std::string &model, CV_WRAP_FILE_PATH const std::string &config="")
	サポートされている形式のいずれかで表現されたネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

const std::string &	getDecodeType () const
	デコード方式を取得する。

const std::vector< std::string > &	getVocabulary () const
	認識用の語彙を取得する。

std::string	recognize (InputArray frame) const
	`input` フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

void	recognize (InputArray frame, InputArrayOfArrays roiRects, std::vector< std::string > &results) const
	`input` フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

TextRecognitionModel &	setDecodeOptsCTCPrefixBeamSearch (int beamSize, int vocPruneSize=0)
	`"CTC-prefix-beam-search"` デコードを使用する際のデコード方式オプションを設定する。

TextRecognitionModel &	setDecodeType (const std::string &decodeType)
	ネットワーク出力を文字列に変換するデコード方式を設定する。

TextRecognitionModel &	setVocabulary (const std::vector< std::string > &vocabulary)
	認識用の語彙を設定する。

Public Member Functions inherited from cv::dnn::Model
	Model ()

	Model (const Model &)=default

	Model (const Net &network)
	ディープラーニングのネットワークからモデルを作成する。

	Model (CV_WRAP_FILE_PATH const String &model, CV_WRAP_FILE_PATH const String &config="")
	サポートされている形式のいずれかで表現されたディープラーニングのネットワークからモデルを作成する。`model` と `config` 引数の順序は問わない。

	Model (Model &&)=default

Model &	enableWinograd (bool useWinograd)

Impl *	getImpl () const

Impl &	getImplRef () const

Net &	getNetwork_ ()

Net &	getNetwork_ () const

	operator Net & () const

Model &	operator= (const Model &)=default

Model &	operator= (Model &&)=default

void	predict (InputArray frame, OutputArrayOfArrays outs) const
	`input` フレームを与え、入力blobを作成し、netを実行して出力 `blobs` を返す。

Model &	setInputCrop (bool crop)
	フレームに対するcropフラグを設定する。

Model &	setInputMean (const Scalar &mean)
	フレームに対する平均値を設定する。

void	setInputParams (double scale=1.0, const Size &size=Size(), const Scalar &mean=Scalar(), bool swapRB=false, bool crop=false)
	フレームの前処理パラメータを設定する。

Model &	setInputScale (const Scalar &scale)
	フレームのscalefactor値を設定する。

Model &	setInputSize (const Size &size)
	フレームの入力サイズを設定する。

Model &	setInputSize (int width, int height)

Model &	setInputSwapRB (bool swapRB)
	フレームのフラグswapRBを設定する。

Model &	setOutputNames (const std::vector< String > &outNames)
	フレームの出力名を設定する。

Model &	setPreferableBackend (dnn::Backend backendId)

Model &	setPreferableTarget (dnn::Target targetId)

Additional Inherited Members
Protected Attributes inherited from cv::dnn::Model
Ptr< Impl >	impl

詳細説明

このクラスはテキスト認識ネットワークの高レベルAPIを表す。

TextRecognitionModel では入力画像の前処理用の引数を設定できる。TextRecognitionModel は学習済み重みと構成を含むファイルからネットワークを生成し、入力の前処理を設定し、順伝播を実行して認識結果を返す。TextRecognitionModel では CRNN-CTC がサポートされている。

例: samples/dnn/text_detection.cpp.

構築子と解体子の詳解

◆ TextRecognitionModel() [1/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel ( )

Python:
	cv.dnn.TextRecognitionModel(	network	) ->	<dnn_TextRecognitionModel object>
	cv.dnn.TextRecognitionModel(	model[, config]	) ->	<dnn_TextRecognitionModel object>

◆ TextRecognitionModel() [2/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel ( const Net & network )

Python:
	cv.dnn.TextRecognitionModel(	network	) ->	<dnn_TextRecognitionModel object>
	cv.dnn.TextRecognitionModel(	model[, config]	) ->	<dnn_TextRecognitionModel object>

ディープラーニングネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

引数

[in] network Net オブジェクト

◆ TextRecognitionModel() [3/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel	(	CV_WRAP_FILE_PATH const std::string &	model,
		CV_WRAP_FILE_PATH const std::string &	config = "" )

inline

Python:
	cv.dnn.TextRecognitionModel(	network	) ->	<dnn_TextRecognitionModel object>
	cv.dnn.TextRecognitionModel(	model[, config]	) ->	<dnn_TextRecognitionModel object>

サポートされている形式のいずれかで表現されたネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

引数

[in]	model	学習済み重みを含むバイナリファイル
[in]	config	ネットワーク構成を含むテキストファイル

この関数の呼び出しグラフ:

メンバ関数詳解

◆ getDecodeType()

const std::string & cv::dnn::TextRecognitionModel::getDecodeType ( ) const

Python:
	cv.dnn.TextRecognitionModel.getDecodeType(		) ->	retval

デコード方式を取得する。

戻り値: デコード方式

◆ getVocabulary()

const std::vector< std::string > & cv::dnn::TextRecognitionModel::getVocabulary ( ) const

Python:
	cv.dnn.TextRecognitionModel.getVocabulary(		) ->	retval

認識用の語彙を取得する。

戻り値: vocabulary 関連付けられた語彙

◆ recognize() [1/2]

std::string cv::dnn::TextRecognitionModel::recognize ( InputArray frame ) const

Python:
	cv.dnn.TextRecognitionModel.recognize(	frame	) ->	retval
	cv.dnn.TextRecognitionModel.recognize(	frame, roiRects	) ->	results

input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

引数

[in] frame 入力画像

戻り値: テキスト認識結果

◆ recognize() [2/2]

void cv::dnn::TextRecognitionModel::recognize	(	InputArray	frame,
		InputArrayOfArrays	roiRects,
		std::vector< std::string > &	results ) const

Python:
	cv.dnn.TextRecognitionModel.recognize(	frame	) ->	retval
	cv.dnn.TextRecognitionModel.recognize(	frame, roiRects	) ->	results

input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

引数

[in]	frame	入力画像
[in]	roiRects	対象とするテキスト検出領域のリスト（cv::Rect, CV_32SC4）。ROIはネットワークの入力として切り出される
[out]	results	テキスト認識結果の集合。

◆ setDecodeOptsCTCPrefixBeamSearch()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setDecodeOptsCTCPrefixBeamSearch	(	int	beamSize,
		int	vocPruneSize = 0 )

Python:
	cv.dnn.TextRecognitionModel.setDecodeOptsCTCPrefixBeamSearch(	beamSize[, vocPruneSize]	) ->	retval

"CTC-prefix-beam-search" デコードを使用する際のデコード方式オプションを設定する。

引数

[in]	beamSize	探索のビームサイズ
[in]	vocPruneSize	大規模な語彙の探索を最適化するための引数。各探索ステップで上位 `vocPruneSize` 個のトークンのみを採用する。`vocPruneSize` <= 0 はこの枝刈りを無効にすることを意味する。

◆ setDecodeType()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setDecodeType ( const std::string & decodeType )

Python:
	cv.dnn.TextRecognitionModel.setDecodeType(	decodeType	) ->	retval

ネットワーク出力を文字列に変換するデコード方式を設定する。

引数

[in]

decodeType

ネットワーク出力を文字列に変換するデコード方式。現在サポートされている型:

"CTC-greedy" CTCベース手法の出力に対する貪欲デコード
"CTC-prefix-beam-search" CTCベース手法の出力に対するプレフィックスビームサーチデコード

◆ setVocabulary()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setVocabulary ( const std::vector< std::string > & vocabulary )

Python:
	cv.dnn.TextRecognitionModel.setVocabulary(	vocabulary	) ->	retval

認識用の語彙を設定する。

引数

[in] vocabulary ネットワークに関連付けられた語彙。

このクラス詳解は次のファイルから抽出されました:

opencv2/dnn/dnn.hpp

公開メンバ関数

Additional Inherited Members

詳細説明

構築子と解体子の詳解

◆ TextRecognitionModel() [1/3]

◆ TextRecognitionModel() [2/3]

◆ TextRecognitionModel() [3/3]

メンバ関数詳解

◆ getDecodeType()

◆ getVocabulary()

◆ recognize() [1/2]

◆ recognize() [2/2]

◆ setDecodeOptsCTCPrefixBeamSearch()

◆ setDecodeType()

◆ setVocabulary()