OpenCV 4.5.3(日本語機械翻訳)
クラス | 列挙型 | 関数
Text_recognize

クラス

class cv::text::BaseOCR
class cv::text::OCRTesseract
OCRTesseractクラスは、C++のtesseract-ocr API (v3.02.02)とのインターフェースを提供します。[【詳解】(英語]
class cv::text::OCRHMMDecoder
OCRHMMDecoderクラスは,隠れマルコフモデルを使った OCR のためのインターフェースを提供します.[【詳解】(英語]

列挙型

enum { OCR_LEVEL_WORD , OCR_LEVEL_TEXTLINE }
enum cv::text::page_seg_mode {
PSM_OSD_ONLY , PSM_AUTO_OSD , PSM_AUTO_ONLY , PSM_AUTO ,
PSM_SINGLE_COLUMN , PSM_SINGLE_BLOCK_VERT_TEXT , PSM_SINGLE_BLOCK , PSM_SINGLE_LINE ,
PSM_SINGLE_WORD , PSM_CIRCLE_WORD , PSM_SINGLE_CHAR
}
Tesseract.PageSegMode イニュメレーション
enum cv::text::ocr_engine_mode { OEM_TESSERACT_ONLY , OEM_CUBE_ONLY , OEM_TESSERACT_CUBE_COMBINED , OEM_DEFAULT }
Tesseract.OcrEngineMode Enumeration(テッセラクト・エンジンモード・イニュメレーション
enum decoder_mode { OCR_DECODER_VITERBI = 0 }
enum classifier_type { OCR_KNN_CLASSIFIER = 0 , OCR_CNN_CLASSIFIER = 1 }

関数

CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierNM (const String &filename)
を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。[【詳解】(英語]
CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierCNN (const String &filename)
を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。[【詳解】(英語]
CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifier (const String &filename, int classifier)
を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。[【詳解】(英語]

詳解

関数詳解

loadOCRHMMClassifier()

CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifier ( const String & filename,
int classifier
)

を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。

引数
filename 分類器モデルを含むXMLまたはYAMLファイル(例: OCRBeamSearch_CNN_model_data.xml.gz)
classifier classifier_type enum の値の1つを指定します。

loadOCRHMMClassifierCNN()

CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierCNN ( const String & filename )

を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。

引数
filename 分類器モデルを含むXMLまたはYAMLファイル(例: OCRBeamSearch_CNN_model_data.xml.gz)

CNNのデフォルト分類器は,Adam CoatesとAndrew NGが[Coates11a]で提案したシーンテキスト認識法に基づいています.文字分類器は,単層の畳み込みニューラルネットワークと線形分類器で構成されています.この分類器は,スライディング・ウィンドウ方式で入力画像に適用され,各ウィンドウの位置で一連の認識結果を提供する.

非推奨:
代わりにloadOCRHMMClassifierを使用する

loadOCRHMMClassifierNM()

CV_EXPORTS_W Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierNM ( const String & filename )

を作成する際に,デフォルトの文字分類器を暗黙的にロードすることを許可する。OCRHMMDecoderオブジェクトを作成します。

引数
filename 分類器モデルの XML または YAML ファイル(例: OCRHMM_knn_model_data.xml)

KNNデフォルト分類器は、Lukás Neumann & Jiri Matasが[Neumann11b]で提案したシーンテキスト認識方法に基づいています。基本的には,入力画像中の領域(輪郭)を,重心と縦横比を保ったまま一定の大きさに正規化し,その周囲のチェーンコードに沿った勾配の向きに基づいて特徴ベクトルを抽出します.そして、異なる標準フォントタイプでレンダリングされた文字の合成データで学習したKNNモデルを用いて領域を分類します。

非推奨:
代わりにloadOCRHMMClassifierを使用する