OpenCV 4.13.0
Open Source Computer Vision
読み込み中...
検索中...
見つかりません
🤖 AIによる機械翻訳(非公式) — これは OpenCV 4.13.0 公式リファレンス(英語)を AI (Claude) で自動翻訳したものです。訳に誤りを含む場合があります。正確な情報は 公式英語版(原文) を参照してください。

OCRHMMDecoder クラスは、隠れマルコフモデルを用いた OCR のためのインターフェースを提供する。さらに表示...

#include <opencv2/text/ocr.hpp>

Collaboration diagram for cv::text::OCRHMMDecoder:

クラス

class  ClassifierCallback
 文字分類器を備えたコールバックがクラスとして作られる。さらに表示...
 

公開メンバ関数

String run (InputArray image, InputArray mask, int min_confidence, int component_level=0)
 
String run (InputArray image, int min_confidence, int component_level=0)
 
virtual void run (Mat &image, Mat &mask, std::string &output_text, std::vector< Rect > *component_rects=NULL, std::vector< std::string > *component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
 HMM を使ってテキストを認識する。
 
virtual void run (Mat &image, std::string &output_text, std::vector< Rect > *component_rects=NULL, std::vector< std::string > *component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
 HMM を使ってテキストを認識する。
 
- Public Member Functions inherited from cv::text::BaseOCR
virtual ~BaseOCR ()
 

静的公開メンバ関数

static Ptr< OCRHMMDecodercreate (const Ptr< OCRHMMDecoder::ClassifierCallback > classifier, const String &vocabulary, InputArray transition_probabilities_table, InputArray emission_probabilities_table, int mode=OCR_DECODER_VITERBI)
 OCRHMMDecoder クラスのインスタンスを生成する。HMMDecoder を初期化する。
 
static Ptr< OCRHMMDecodercreate (const String &filename, const String &vocabulary, InputArray transition_probabilities_table, InputArray emission_probabilities_table, int mode=OCR_DECODER_VITERBI, int classifier=OCR_KNN_CLASSIFIER)
 OCRHMMDecoder クラスのインスタンスを生成する。指定したパスから HMMDecoder を読み込んで初期化する。
 

限定公開変数類

Ptr< OCRHMMDecoder::ClassifierCallbackclassifier
 
Mat emission_p
 
decoder_mode mode
 
Mat transition_p
 
std::string vocabulary
 

詳細説明

OCRHMMDecoder クラスは、隠れマルコフモデルを用いた OCR のためのインターフェースを提供する。

覚え書き

メンバ関数詳解

◆ create() [1/2]

static Ptr< OCRHMMDecoder > cv::text::OCRHMMDecoder::create ( const Ptr< OCRHMMDecoder::ClassifierCallback > classifier,
const String & vocabulary,
InputArray transition_probabilities_table,
InputArray emission_probabilities_table,
int mode = OCR_DECODER_VITERBI )
static
Python:
cv.text.OCRHMMDecoder.create(classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]) -> retval
cv.text.OCRHMMDecoder.create(filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]) -> retval
cv.text.OCRHMMDecoder_create(classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]) -> retval
cv.text.OCRHMMDecoder_create(filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]) -> retval

OCRHMMDecoder クラスのインスタンスを生成する。HMMDecoder を初期化する。

引数
classifier特徴抽出器を内蔵した文字分類器。
vocabulary言語の語彙(ASCII 英語テキストの場合は文字)。vocabulary.size() は分類器のクラス数と等しくなければならない。
transition_probabilities_table文字ペア間の遷移確率の表。cols == rows == vocabulary.size()。
emission_probabilities_table観測出力確率の表。cols == rows == vocabulary.size()。
modeHMM デコードアルゴリズム。現時点では OCR_DECODER_VITERBI のみが利用可能(http://en.wikipedia.org/wiki/Viterbi_algorithm)。

◆ create() [2/2]

static Ptr< OCRHMMDecoder > cv::text::OCRHMMDecoder::create ( const String & filename,
const String & vocabulary,
InputArray transition_probabilities_table,
InputArray emission_probabilities_table,
int mode = OCR_DECODER_VITERBI,
int classifier = OCR_KNN_CLASSIFIER )
static
Python:
cv.text.OCRHMMDecoder.create(classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]) -> retval
cv.text.OCRHMMDecoder.create(filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]) -> retval
cv.text.OCRHMMDecoder_create(classifier, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode]) -> retval
cv.text.OCRHMMDecoder_create(filename, vocabulary, transition_probabilities_table, emission_probabilities_table[, mode[, classifier]]) -> retval

OCRHMMDecoder クラスのインスタンスを生成する。指定したパスから HMMDecoder を読み込んで初期化する。

これは利便性のために提供されているオーバーロードされたメンバ関数である。上記の関数とは、受け取る引数のみが異なる。

◆ run() [1/4]

String cv::text::OCRHMMDecoder::run ( InputArray image,
InputArray mask,
int min_confidence,
int component_level = 0 )
Python:
cv.text.OCRHMMDecoder.run(image, min_confidence[, component_level]) -> retval
cv.text.OCRHMMDecoder.run(image, mask, min_confidence[, component_level]) -> retval

◆ run() [2/4]

String cv::text::OCRHMMDecoder::run ( InputArray image,
int min_confidence,
int component_level = 0 )
Python:
cv.text.OCRHMMDecoder.run(image, min_confidence[, component_level]) -> retval
cv.text.OCRHMMDecoder.run(image, mask, min_confidence[, component_level]) -> retval

◆ run() [3/4]

virtual void cv::text::OCRHMMDecoder::run ( Mat & image,
Mat & mask,
std::string & output_text,
std::vector< Rect > * component_rects = NULL,
std::vector< std::string > * component_texts = NULL,
std::vector< float > * component_confidences = NULL,
int component_level = 0 )
virtual
Python:
cv.text.OCRHMMDecoder.run(image, min_confidence[, component_level]) -> retval
cv.text.OCRHMMDecoder.run(image, mask, min_confidence[, component_level]) -> retval

HMM を使ってテキストを認識する。

画像とマスク(各連結成分がセグメンテーションされた1文字に対応する)を入力として受け取り、認識されたテキストを output_text 引数で返す。必要に応じて、見つかった個々のテキスト要素(例: 単語)の Rect、およびそれらのテキスト要素とその信頼度値のリストも提供する。

引数
image単一のテキスト行(または単語)を含む CV_8UC1 または CV_8UC3 の入力画像。
mask入力画像と同じサイズの CV_8UC1 の入力二値画像。mask 内の各連結成分は、入力画像内でセグメンテーションされた1文字に対応する。
output_text出力テキスト。HMM デコーダによって見つかった最も尤もらしい文字列。
component_rects指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の Rect のリストを出力する。
component_texts指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の認識結果のテキスト文字列のリストを出力する。
component_confidences指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の認識に対する信頼度値のリストを出力する。
component_levelOCR_LEVEL_WORD のみがサポートされている。

cv::text::BaseOCR を実装する。

◆ run() [4/4]

virtual void cv::text::OCRHMMDecoder::run ( Mat & image,
std::string & output_text,
std::vector< Rect > * component_rects = NULL,
std::vector< std::string > * component_texts = NULL,
std::vector< float > * component_confidences = NULL,
int component_level = 0 )
virtual
Python:
cv.text.OCRHMMDecoder.run(image, min_confidence[, component_level]) -> retval
cv.text.OCRHMMDecoder.run(image, mask, min_confidence[, component_level]) -> retval

HMM を使ってテキストを認識する。

二値画像を入力として受け取り、認識されたテキストを output_text 引数で返す。必要に応じて、見つかった個々のテキスト要素(例: 単語)の Rect、およびそれらのテキスト要素とその信頼度値のリストも提供する。

引数
image単一のテキスト行(または単語)を含む CV_8UC1 の入力二値画像。
output_text出力テキスト。HMM デコーダによって見つかった最も尤もらしい文字列。
component_rects指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の Rect のリストを出力する。
component_texts指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の認識結果のテキスト文字列のリストを出力する。
component_confidences指定された場合、このメソッドは見つかった個々のテキスト要素(例: 単語)の認識に対する信頼度値のリストを出力する。
component_levelOCR_LEVEL_WORD のみがサポートされている。

cv::text::BaseOCR を実装する。

メンバ変数詳解

◆ classifier

Ptr<OCRHMMDecoder::ClassifierCallback> cv::text::OCRHMMDecoder::classifier
protected

◆ emission_p

Mat cv::text::OCRHMMDecoder::emission_p
protected

◆ mode

decoder_mode cv::text::OCRHMMDecoder::mode
protected

◆ transition_p

Mat cv::text::OCRHMMDecoder::transition_p
protected

◆ vocabulary

std::string cv::text::OCRHMMDecoder::vocabulary
protected

このクラス詳解は次のファイルから抽出されました: