OpenCV 4.5.3(日本語機械翻訳)
公開メンバ関数 | 静的公開メンバ関数 | 全メンバ一覧
cv::text::OCRTesseract クラス abstract

OCRTesseract class provides an interface with the tesseract-ocr API (v3.02.02) in C++. [詳解]

#include <ocr.hpp>

cv::text::BaseOCRを継承しています。

公開メンバ関数

virtual void run (Mat &image, std::string &output_text, std::vector< Rect > *component_rects=NULL, std::vector< std::string > *component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
tesseract-ocr APIを使ってテキストを認識します。[【詳解】(英語]
virtual void run (Mat &image, Mat &mask, std::string &output_text, std::vector< Rect > *component_rects=NULL, std::vector< std::string > *component_texts=NULL, std::vector< float > *component_confidences=NULL, int component_level=0) CV_OVERRIDE
CV_WRAP String run (InputArray image, int min_confidence, int component_level=0)
CV_WRAP String run (InputArray image, InputArray mask, int min_confidence, int component_level=0)
virtual CV_WRAP void setWhiteList (const String &char_whitelist)=0

静的公開メンバ関数

static CV_WRAP Ptr< OCRTesseract > create (const char *datapath=NULL, const char *language=NULL, const char *char_whitelist=NULL, int oem=OEM_DEFAULT, int psmode=PSM_AUTO)
クラスのインスタンスを作成します。OCRTesseractクラスを作成します。Tesseractを初期化します。[【詳解】(英語]

詳解

OCRTesseractクラスは、C++のtesseract-ocr API (v3.02.02)とのインターフェースを提供します。

このクラスは,tesseract-ocrが正しくインストールされている場合にのみコンパイルされることに注意してください。

覚え書き

関数詳解

create()

static CV_WRAP Ptr< OCRTesseract > cv::text::OCRTesseract::create ( const char * datapath = NULL,
const char * language = NULL,
const char * char_whitelist = NULL,
int oem = OEM_DEFAULT,
int psmode = PSM_AUTO
)
static

クラスのインスタンスを作成します。OCRTesseractクラスを作成します。Tesseractを初期化します。

引数
datapath tessdataの親ディレクトリの名前で"/"で終わるもの、またはシステムのデフォルトディレクトリを使用する場合はNULL。
language ISO 639-3コードまたはNULLの場合はデフォルトで "eng "となります。
char_whitelist は,認識に使用する文字のリストを指定します.NULLの場合、デフォルトでは「0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ」となります。
oem tesseract-ocrは異なるOCR Engine Modes (OEM)を提供しますが、デフォルトではtesseract::OEM_DEFAULTが使用されます。他の可能な値についてはtesseract-ocrのAPIドキュメントを参照してください。
psmode tesseract-ocrは異なるページ分割モード(PSM)を提供します。デフォルトではtesseract::PSM_AUTO(完全自動レイアウト分析)が使用されます。他の可能な値についてはtesseract-ocrのAPIドキュメントを参照してください。

run() [1/2]

virtual void cv::text::OCRTesseract::run ( Mat & image,
Mat & mask,
std::string & output_text,
std::vector< Rect > * component_rects = NULL,
std::vector< std::string > * component_texts = NULL,
std::vector< float > * component_confidences = NULL,
int component_level = 0
)
virtual

cv::text::BaseOCRを実装します。

run() [2/2]

virtual void cv::text::OCRTesseract::run ( Mat & image,
std::string & output_text,
std::vector< Rect > * component_rects = NULL,
std::vector< std::string > * component_texts = NULL,
std::vector< float > * component_confidences = NULL,
int component_level = 0
)
virtual

tesseract-ocr APIを使ってテキストを認識します。

入力として画像を受け取り、認識したテキストを output_text パラメータで返します。オプションとして,検出された個々のテキスト要素(単語など)のRectsや,それらのテキスト要素のリストとその信頼度の値も提供します.

引数
image 入力画像 CV_8UC1 または CV_8UC3
output_text tesseract-ocrのテキストを出力します。
component_rects 提供された場合、このメソッドは見つかった個々のテキスト要素(単語やテキストラインなど)のRectsのリストを出力する。
component_texts 提供された場合、このメソッドは見つかった個々のテキスト要素(例:単語やテキストライン)の認識のためのテキスト文字列のリストを出力します。
component_confidences このメソッドが提供されると、検出された個々のテキスト要素(単語やテキスト行など)の認識に関する信頼値のリストが出力されます。
component_level OCR_LEVEL_WORD (デフォルト)、または OCR_LEVEL_TEXTLINE を使用します。

cv::text::BaseOCRを実装します。


このクラス詳解は次のファイルから抽出されました: