詳細説明

クラス
class	cv::text::BaseOCR

class	cv::text::OCRBeamSearchDecoder
	OCRBeamSearchDecoder クラスは、Beam Search アルゴリズムを用いた OCR のためのインターフェースを提供する。詳細...

class	cv::text::OCRHMMDecoder
	OCRHMMDecoder クラスは、隠れマルコフモデル (Hidden Markov Models) を用いた OCR のためのインターフェースを提供する。詳細...

class	cv::text::OCRHolisticWordRecognizer
	OCRHolisticWordRecognizer クラスは、セグメント化された word spotting の機能を提供する。あらかじめ定義された語彙が与えられると、DictNet を用いて入力画像に対して最も確率の高い単語を選択する。詳細...

class	cv::text::OCRTesseract
	OCRTesseract クラスは、C++ における tesseract-ocr API (v3.02.02) とのインターフェースを提供する。詳細...

列挙型
enum	{ cv::text::OCR_LEVEL_WORD , cv::text::OCR_LEVEL_TEXTLINE }

enum	cv::text::classifier_type { cv::text::OCR_KNN_CLASSIFIER = 0 , cv::text::OCR_CNN_CLASSIFIER = 1 }

enum	cv::text::decoder_mode { cv::text::OCR_DECODER_VITERBI = 0 }

enum	cv::text::ocr_engine_mode { cv::text::OEM_TESSERACT_ONLY , cv::text::OEM_CUBE_ONLY , cv::text::OEM_TESSERACT_CUBE_COMBINED , cv::text::OEM_DEFAULT }
	Tesseract.OcrEngineMode 列挙型。続き...

enum	cv::text::page_seg_mode { cv::text::PSM_OSD_ONLY , cv::text::PSM_AUTO_OSD , cv::text::PSM_AUTO_ONLY , cv::text::PSM_AUTO , cv::text::PSM_SINGLE_COLUMN , cv::text::PSM_SINGLE_BLOCK_VERT_TEXT , cv::text::PSM_SINGLE_BLOCK , cv::text::PSM_SINGLE_LINE , cv::text::PSM_SINGLE_WORD , cv::text::PSM_CIRCLE_WORD , cv::text::PSM_SINGLE_CHAR }
	Tesseract.PageSegMode 列挙型。続き...

関数
Mat	cv::text::createOCRHMMTransitionsTable (const String &vocabulary, std::vector< cv::String > &lexicon)

void	cv::text::createOCRHMMTransitionsTable (std::string &vocabulary, std::vector< std::string > &lexicon, OutputArray transition_probabilities_table)
	与えられた単語リスト (語彙) から、目的に合わせた言語モデルの遷移テーブルを生成するユーティリティ関数。

Ptr< OCRBeamSearchDecoder::ClassifierCallback >	cv::text::loadOCRBeamSearchClassifierCNN (const String &filename)
	OCRBeamSearchDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifier (const String &filename, int classifier)
	OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifierCNN (const String &filename)
	OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifierNM (const String &filename)
	OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

列挙型詳解

◆ anonymous enum

anonymous enum

#include <opencv2/text/ocr.hpp>

列挙値
OCR_LEVEL_WORD Python: cv.text.OCR_LEVEL_WORD
OCR_LEVEL_TEXTLINE Python: cv.text.OCR_LEVEL_TEXTLINE

◆ classifier_type

enum cv::text::classifier_type

#include <opencv2/text/ocr.hpp>

列挙値
OCR_KNN_CLASSIFIER Python: cv.text.OCR_KNN_CLASSIFIER
OCR_CNN_CLASSIFIER Python: cv.text.OCR_CNN_CLASSIFIER

◆ decoder_mode

enum cv::text::decoder_mode

#include <opencv2/text/ocr.hpp>

列挙値
OCR_DECODER_VITERBI Python: cv.text.OCR_DECODER_VITERBI

◆ ocr_engine_mode

enum cv::text::ocr_engine_mode

#include <opencv2/text/ocr.hpp>

Tesseract.OcrEngineMode 列挙型。

列挙値
OEM_TESSERACT_ONLY Python: cv.text.OEM_TESSERACT_ONLY
OEM_CUBE_ONLY Python: cv.text.OEM_CUBE_ONLY
OEM_TESSERACT_CUBE_COMBINED Python: cv.text.OEM_TESSERACT_CUBE_COMBINED
OEM_DEFAULT Python: cv.text.OEM_DEFAULT

◆ page_seg_mode

enum cv::text::page_seg_mode

#include <opencv2/text/ocr.hpp>

Tesseract.PageSegMode 列挙型。

列挙値
PSM_OSD_ONLY Python: cv.text.PSM_OSD_ONLY
PSM_AUTO_OSD Python: cv.text.PSM_AUTO_OSD
PSM_AUTO_ONLY Python: cv.text.PSM_AUTO_ONLY
PSM_AUTO Python: cv.text.PSM_AUTO
PSM_SINGLE_COLUMN Python: cv.text.PSM_SINGLE_COLUMN
PSM_SINGLE_BLOCK_VERT_TEXT Python: cv.text.PSM_SINGLE_BLOCK_VERT_TEXT
PSM_SINGLE_BLOCK Python: cv.text.PSM_SINGLE_BLOCK
PSM_SINGLE_LINE Python: cv.text.PSM_SINGLE_LINE
PSM_SINGLE_WORD Python: cv.text.PSM_SINGLE_WORD
PSM_CIRCLE_WORD Python: cv.text.PSM_CIRCLE_WORD
PSM_SINGLE_CHAR Python: cv.text.PSM_SINGLE_CHAR

関数詳解

◆ createOCRHMMTransitionsTable() [1/2]

Mat cv::text::createOCRHMMTransitionsTable	(	const String &	vocabulary,
		std::vector< cv::String > &	lexicon )

Python:
	cv.text.createOCRHMMTransitionsTable(	vocabulary, lexicon	) ->	retval

#include <opencv2/text/ocr.hpp>

◆ createOCRHMMTransitionsTable() [2/2]

void cv::text::createOCRHMMTransitionsTable	(	std::string &	vocabulary,
		std::vector< std::string > &	lexicon,
		OutputArray	transition_probabilities_table )

Python:
	cv.text.createOCRHMMTransitionsTable(	vocabulary, lexicon	) ->	retval

#include <opencv2/text/ocr.hpp>

与えられた単語リスト（語彙）から、用途に合わせた言語モデルの遷移テーブルを作成するユーティリティ関数。

引数

vocabulary	言語の語彙（ASCII英語テキストの場合は文字）。
lexicon	特定の画像内で見つかると想定される単語のリスト。
transition_probabilities_table	文字ペア間の遷移確率を格納する出力テーブル。cols == rows == vocabulary.size()。

この関数は与えられた語彙から文字ペアの出現頻度統計を計算し、出力 transition_probabilities_table にそれらを格納する。transition_probabilities_table は OCRHMMDecoder::create() および OCRBeamSearchDecoder::create() メソッドの入力として使用できる。

覚え書き

(C++) もう一つの方法として、text モジュールの samples フォルダに用意されているデフォルトの汎用言語遷移テーブル（ispell の42869の英単語リストから作成）を読み込むこともできる: https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/OCRHMM_transitions_table.xml

◆ loadOCRBeamSearchClassifierCNN()

Ptr< OCRBeamSearchDecoder::ClassifierCallback > cv::text::loadOCRBeamSearchClassifierCNN ( const String & filename )

Python:
	cv.text.loadOCRBeamSearchClassifierCNN(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

OCRBeamSearchDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数

filename 分類器モデルを格納したXMLまたはYAMLファイル（例: OCRBeamSearch_CNN_model_data.xml.gz）

CNNのデフォルト分類器は、Adam Coates と Andrew NG が [Coates11a] で提案したシーンテキスト認識手法に基づく。この文字分類器は、単層の畳み込みニューラルネットワークと線形分類器から構成される。入力画像にスライディングウィンドウ方式で適用され、各ウィンドウ位置で一連の認識結果を返す。

◆ loadOCRHMMClassifier()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifier	(	const String &	filename,
		int	classifier )

Python:
	cv.text.loadOCRHMMClassifier(	filename, classifier	) ->	retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数

filename	分類器モデルを格納したXMLまたはYAMLファイル（例: OCRBeamSearch_CNN_model_data.xml.gz）
classifier	classifier_type 列挙値のいずれかを指定できる。

◆ loadOCRHMMClassifierCNN()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierCNN ( const String & filename )

Python:
	cv.text.loadOCRHMMClassifierCNN(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数

filename 分類器モデルを格納したXMLまたはYAMLファイル（例: OCRBeamSearch_CNN_model_data.xml.gz）

CNNのデフォルト分類器は、Adam Coates と Andrew NG が [Coates11a] で提案したシーンテキスト認識手法に基づく。この文字分類器は、単層の畳み込みニューラルネットワークと線形分類器から構成される。入力画像にスライディングウィンドウ方式で適用され、各ウィンドウ位置で一連の認識結果を返す。

非推奨Deprecated: 代わりに loadOCRHMMClassifier を使用すること

◆ loadOCRHMMClassifierNM()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierNM ( const String & filename )

Python:
	cv.text.loadOCRHMMClassifierNM(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数

filename 分類器モデルを格納したXMLまたはYAMLファイル（例: OCRHMM_knn_model_data.xml）

KNNのデフォルト分類器は、Lukás Neumann と Jiri Matas が [Neumann11b] で提案したシーンテキスト認識手法に基づく。基本的には、入力画像内の領域（輪郭）を、重心とアスペクト比を保持したまま固定サイズに正規化し、輪郭線のチェーンコードに沿った勾配方向に基づく特徴ベクトルを抽出する。その後、異なる標準フォントタイプでレンダリングした文字の合成データで学習したKNNモデルを用いて領域を分類する。

非推奨Deprecated: 代わりに loadOCRHMMClassifier を使用すること

詳細説明

クラス

列挙型

関数

列挙型詳解

◆ anonymous enum

◆ classifier_type

◆ decoder_mode

◆ ocr_engine_mode

◆ page_seg_mode

関数詳解

◆ createOCRHMMTransitionsTable() [1/2]

◆ createOCRHMMTransitionsTable() [2/2]

◆ loadOCRBeamSearchClassifierCNN()

◆ loadOCRHMMClassifier()

◆ loadOCRHMMClassifierCNN()

◆ loadOCRHMMClassifierNM()