OCRHMMDecoder クラスは、隠れマルコフモデルを用いた OCR のためのインターフェースを提供する。さらに表示...

#include <opencv2/text/ocr.hpp>

Collaboration diagram for cv::text::OCRHMMDecoder:

クラス
class	ClassifierCallback
	文字分類器を備えたコールバックがクラスとして作られる。さらに表示...

公開メンバ関数
String	run (InputArray image, InputArray mask, int min_confidence, int component_level=0)

String	run (InputArray image, int min_confidence, int component_level=0)

virtual void	run (Mat &image, Mat &mask, std::string &output_text, std::vector< Rect > component_rects=NULL, std::vector< std::string > component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
	HMM を使ってテキストを認識する。

virtual void	run (Mat &image, std::string &output_text, std::vector< Rect > component_rects=NULL, std::vector< std::string > component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
	HMM を使ってテキストを認識する。

Public Member Functions inherited from cv::text::BaseOCR
virtual	~BaseOCR ()

静的公開メンバ関数
static Ptr< OCRHMMDecoder >	create (const Ptr< OCRHMMDecoder::ClassifierCallback > classifier, const String &vocabulary, InputArray transition_probabilities_table, InputArray emission_probabilities_table, int mode=OCR_DECODER_VITERBI)
	OCRHMMDecoder クラスのインスタンスを生成する。HMMDecoder を初期化する。

static Ptr< OCRHMMDecoder >	create (const String &filename, const String &vocabulary, InputArray transition_probabilities_table, InputArray emission_probabilities_table, int mode=OCR_DECODER_VITERBI, int classifier=OCR_KNN_CLASSIFIER)
	OCRHMMDecoder クラスのインスタンスを生成する。指定したパスから HMMDecoder を読み込んで初期化する。

限定公開変数類
Ptr< OCRHMMDecoder::ClassifierCallback >	classifier

Mat	emission_p

decoder_mode	mode

Mat	transition_p

std::string	vocabulary

詳細説明

OCRHMMDecoder クラスは、隠れマルコフモデルを用いた OCR のためのインターフェースを提供する。

覚え書き

(C++) シーンテキスト検出と組み合わせた OCRHMMDecoder 認識の使用例は、webcam_demo サンプルにある: https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/webcam_demo.cpp

メンバ関数詳解

◆ create() [1/2]

static Ptr< OCRHMMDecoder > cv::text::OCRHMMDecoder::create	(	const Ptr< OCRHMMDecoder::ClassifierCallback >	classifier,
		const String &	vocabulary,
		InputArray	transition_probabilities_table,
		InputArray	emission_probabilities_table,
		int	mode = OCR_DECODER_VITERBI )

static


cv.text.OCRHMMDecoder.create(	classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]	) ->	retval
cv.text.OCRHMMDecoder.create(	filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]	) ->	retval
cv.text.OCRHMMDecoder_create(	classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]	) ->	retval
cv.text.OCRHMMDecoder_create(	filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]	) ->	retval

OCRHMMDecoder クラスのインスタンスを生成する。HMMDecoder を初期化する。

引数

classifier	特徴抽出器を内蔵した文字分類器。
vocabulary	言語の語彙（ASCII 英語テキストの場合は文字）。vocabulary.size() は分類器のクラス数と等しくなければならない。
transition_probabilities_table	文字ペア間の遷移確率の表。cols == rows == vocabulary.size()。
emission_probabilities_table	観測出力確率の表。cols == rows == vocabulary.size()。
mode	HMM デコードアルゴリズム。現時点では OCR_DECODER_VITERBI のみが利用可能（http://en.wikipedia.org/wiki/Viterbi_algorithm）。

◆ create() [2/2]

static Ptr< OCRHMMDecoder > cv::text::OCRHMMDecoder::create	(	const String &	filename,
		const String &	vocabulary,
		InputArray	transition_probabilities_table,
		InputArray	emission_probabilities_table,
		int	mode = OCR_DECODER_VITERBI,
		int	classifier = OCR_KNN_CLASSIFIER )

static


cv.text.OCRHMMDecoder.create(	classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]	) ->	retval
cv.text.OCRHMMDecoder.create(	filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]	) ->	retval
cv.text.OCRHMMDecoder_create(	classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]	) ->	retval
cv.text.OCRHMMDecoder_create(	filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]	) ->	retval

OCRHMMDecoder クラスのインスタンスを生成する。指定したパスから HMMDecoder を読み込んで初期化する。

これは利便性のために提供されているオーバーロードされたメンバ関数である。上記の関数とは、受け取る引数のみが異なる。

◆ run() [1/4]

String cv::text::OCRHMMDecoder::run	(	InputArray	image,
		InputArray	mask,
		int	min_confidence,
		int	component_level = 0 )

Python:
	cv.text.OCRHMMDecoder.run(	image, min_confidence[, component_level]	) ->	retval
	cv.text.OCRHMMDecoder.run(	image, mask, min_confidence[, component_level]	) ->	retval

◆ run() [2/4]

String cv::text::OCRHMMDecoder::run	(	InputArray	image,
		int	min_confidence,
		int	component_level = 0 )

Python:
	cv.text.OCRHMMDecoder.run(	image, min_confidence[, component_level]	) ->	retval
	cv.text.OCRHMMDecoder.run(	image, mask, min_confidence[, component_level]	) ->	retval

◆ run() [3/4]

virtual void cv::text::OCRHMMDecoder::run	(	Mat &	image,
		Mat &	mask,
		std::string &	output_text,
		std::vector< Rect > *	component_rects = NULL,
		std::vector< std::string > *	component_texts = NULL,
		std::vector< float > *	component_confidences = NULL,
		int	component_level = 0 )

virtual

Python:
	cv.text.OCRHMMDecoder.run(	image, min_confidence[, component_level]	) ->	retval
	cv.text.OCRHMMDecoder.run(	image, mask, min_confidence[, component_level]	) ->	retval

HMM を使ってテキストを認識する。

画像とマスク（各連結成分がセグメンテーションされた1文字に対応する）を入力として受け取り、認識されたテキストを output_text 引数で返す。必要に応じて、見つかった個々のテキスト要素（例: 単語）の Rect、およびそれらのテキスト要素とその信頼度値のリストも提供する。

引数

image	単一のテキスト行（または単語）を含む CV_8UC1 または CV_8UC3 の入力画像。
mask	入力画像と同じサイズの CV_8UC1 の入力二値画像。mask 内の各連結成分は、入力画像内でセグメンテーションされた1文字に対応する。
output_text	出力テキスト。HMM デコーダによって見つかった最も尤もらしい文字列。
component_rects	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の Rect のリストを出力する。
component_texts	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の認識結果のテキスト文字列のリストを出力する。
component_confidences	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の認識に対する信頼度値のリストを出力する。
component_level	OCR_LEVEL_WORD のみがサポートされている。

cv::text::BaseOCR を実装する。

◆ run() [4/4]

virtual void cv::text::OCRHMMDecoder::run	(	Mat &	image,
		std::string &	output_text,
		std::vector< Rect > *	component_rects = NULL,
		std::vector< std::string > *	component_texts = NULL,
		std::vector< float > *	component_confidences = NULL,
		int	component_level = 0 )

virtual

Python:
	cv.text.OCRHMMDecoder.run(	image, min_confidence[, component_level]	) ->	retval
	cv.text.OCRHMMDecoder.run(	image, mask, min_confidence[, component_level]	) ->	retval

HMM を使ってテキストを認識する。

二値画像を入力として受け取り、認識されたテキストを output_text 引数で返す。必要に応じて、見つかった個々のテキスト要素（例: 単語）の Rect、およびそれらのテキスト要素とその信頼度値のリストも提供する。

引数

image	単一のテキスト行（または単語）を含む CV_8UC1 の入力二値画像。
output_text	出力テキスト。HMM デコーダによって見つかった最も尤もらしい文字列。
component_rects	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の Rect のリストを出力する。
component_texts	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の認識結果のテキスト文字列のリストを出力する。
component_confidences	指定された場合、このメソッドは見つかった個々のテキスト要素（例: 単語）の認識に対する信頼度値のリストを出力する。
component_level	OCR_LEVEL_WORD のみがサポートされている。

cv::text::BaseOCR を実装する。

メンバ変数詳解

◆ classifier

Ptr<OCRHMMDecoder::ClassifierCallback> cv::text::OCRHMMDecoder::classifier

protected

◆ emission_p

Mat cv::text::OCRHMMDecoder::emission_p

protected

◆ mode

decoder_mode cv::text::OCRHMMDecoder::mode

protected

◆ transition_p

Mat cv::text::OCRHMMDecoder::transition_p

protected

◆ vocabulary

std::string cv::text::OCRHMMDecoder::vocabulary

protected

このクラス詳解は次のファイルから抽出されました:

opencv2/text/ocr.hpp

クラス

公開メンバ関数

静的公開メンバ関数

限定公開変数類

詳細説明

メンバ関数詳解

◆ create() [1/2]

◆ create() [2/2]

◆ run() [1/4]

◆ run() [2/4]

◆ run() [3/4]

◆ run() [4/4]

メンバ変数詳解

◆ classifier

◆ emission_p

◆ mode

◆ transition_p

◆ vocabulary