OpenCV 5.0.0
Open Source Computer Vision
読み込み中...
検索中...
見つかりません
🤖 AIによる機械翻訳(非公式) — これは OpenCV 5.0.0 公式リファレンス(英語)を AI (Claude) で自動翻訳したものです。訳に誤りを含む場合があります。正確な情報は 公式英語版(原文) を参照してください。
シーンテキスト認識

詳細説明

クラス

class  cv::text::BaseOCR
 
class  cv::text::OCRBeamSearchDecoder
 OCRBeamSearchDecoder クラスは、Beam Search アルゴリズムを用いた OCR のためのインターフェースを提供する。詳細...
 
class  cv::text::OCRHMMDecoder
 OCRHMMDecoder クラスは、隠れマルコフモデル (Hidden Markov Models) を用いた OCR のためのインターフェースを提供する。詳細...
 
class  cv::text::OCRHolisticWordRecognizer
 OCRHolisticWordRecognizer クラスは、セグメント化された word spotting の機能を提供する。あらかじめ定義された語彙が与えられると、DictNet を用いて入力画像に対して最も確率の高い単語を選択する。詳細...
 
class  cv::text::OCRTesseract
 OCRTesseract クラスは、C++ における tesseract-ocr API (v3.02.02) とのインターフェースを提供する。詳細...
 

列挙型

enum  {
  cv::text::OCR_LEVEL_WORD ,
  cv::text::OCR_LEVEL_TEXTLINE
}
 
enum  cv::text::classifier_type {
  cv::text::OCR_KNN_CLASSIFIER = 0 ,
  cv::text::OCR_CNN_CLASSIFIER = 1
}
 
enum  cv::text::decoder_mode { cv::text::OCR_DECODER_VITERBI = 0 }
 
enum  cv::text::ocr_engine_mode {
  cv::text::OEM_TESSERACT_ONLY ,
  cv::text::OEM_CUBE_ONLY ,
  cv::text::OEM_TESSERACT_CUBE_COMBINED ,
  cv::text::OEM_DEFAULT
}
 Tesseract.OcrEngineMode 列挙型。 続き...
 
enum  cv::text::page_seg_mode {
  cv::text::PSM_OSD_ONLY ,
  cv::text::PSM_AUTO_OSD ,
  cv::text::PSM_AUTO_ONLY ,
  cv::text::PSM_AUTO ,
  cv::text::PSM_SINGLE_COLUMN ,
  cv::text::PSM_SINGLE_BLOCK_VERT_TEXT ,
  cv::text::PSM_SINGLE_BLOCK ,
  cv::text::PSM_SINGLE_LINE ,
  cv::text::PSM_SINGLE_WORD ,
  cv::text::PSM_CIRCLE_WORD ,
  cv::text::PSM_SINGLE_CHAR
}
 Tesseract.PageSegMode 列挙型。 続き...
 

関数

Mat cv::text::createOCRHMMTransitionsTable (const String &vocabulary, std::vector< cv::String > &lexicon)
 
void cv::text::createOCRHMMTransitionsTable (std::string &vocabulary, std::vector< std::string > &lexicon, OutputArray transition_probabilities_table)
 与えられた単語リスト (語彙) から、目的に合わせた言語モデルの遷移テーブルを生成するユーティリティ関数。
 
Ptr< OCRBeamSearchDecoder::ClassifierCallbackcv::text::loadOCRBeamSearchClassifierCNN (const String &filename)
 OCRBeamSearchDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。
 
Ptr< OCRHMMDecoder::ClassifierCallbackcv::text::loadOCRHMMClassifier (const String &filename, int classifier)
 OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。
 
Ptr< OCRHMMDecoder::ClassifierCallbackcv::text::loadOCRHMMClassifierCNN (const String &filename)
 OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。
 
Ptr< OCRHMMDecoder::ClassifierCallbackcv::text::loadOCRHMMClassifierNM (const String &filename)
 OCRHMMDecoder オブジェクトの生成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。
 

列挙型詳解

◆ anonymous enum

anonymous enum

#include <opencv2/text/ocr.hpp>

列挙値
OCR_LEVEL_WORD 
Python: cv.text.OCR_LEVEL_WORD
OCR_LEVEL_TEXTLINE 
Python: cv.text.OCR_LEVEL_TEXTLINE

◆ classifier_type

#include <opencv2/text/ocr.hpp>

列挙値
OCR_KNN_CLASSIFIER 
Python: cv.text.OCR_KNN_CLASSIFIER
OCR_CNN_CLASSIFIER 
Python: cv.text.OCR_CNN_CLASSIFIER

◆ decoder_mode

#include <opencv2/text/ocr.hpp>

列挙値
OCR_DECODER_VITERBI 
Python: cv.text.OCR_DECODER_VITERBI

◆ ocr_engine_mode

#include <opencv2/text/ocr.hpp>

Tesseract.OcrEngineMode 列挙型。

列挙値
OEM_TESSERACT_ONLY 
Python: cv.text.OEM_TESSERACT_ONLY
OEM_CUBE_ONLY 
Python: cv.text.OEM_CUBE_ONLY
OEM_TESSERACT_CUBE_COMBINED 
Python: cv.text.OEM_TESSERACT_CUBE_COMBINED
OEM_DEFAULT 
Python: cv.text.OEM_DEFAULT

◆ page_seg_mode

#include <opencv2/text/ocr.hpp>

Tesseract.PageSegMode 列挙型。

列挙値
PSM_OSD_ONLY 
Python: cv.text.PSM_OSD_ONLY
PSM_AUTO_OSD 
Python: cv.text.PSM_AUTO_OSD
PSM_AUTO_ONLY 
Python: cv.text.PSM_AUTO_ONLY
PSM_AUTO 
Python: cv.text.PSM_AUTO
PSM_SINGLE_COLUMN 
Python: cv.text.PSM_SINGLE_COLUMN
PSM_SINGLE_BLOCK_VERT_TEXT 
Python: cv.text.PSM_SINGLE_BLOCK_VERT_TEXT
PSM_SINGLE_BLOCK 
Python: cv.text.PSM_SINGLE_BLOCK
PSM_SINGLE_LINE 
Python: cv.text.PSM_SINGLE_LINE
PSM_SINGLE_WORD 
Python: cv.text.PSM_SINGLE_WORD
PSM_CIRCLE_WORD 
Python: cv.text.PSM_CIRCLE_WORD
PSM_SINGLE_CHAR 
Python: cv.text.PSM_SINGLE_CHAR

関数詳解

◆ createOCRHMMTransitionsTable() [1/2]

Mat cv::text::createOCRHMMTransitionsTable ( const String & vocabulary,
std::vector< cv::String > & lexicon )
Python:
cv.text.createOCRHMMTransitionsTable(vocabulary, lexicon) -> retval

◆ createOCRHMMTransitionsTable() [2/2]

void cv::text::createOCRHMMTransitionsTable ( std::string & vocabulary,
std::vector< std::string > & lexicon,
OutputArray transition_probabilities_table )
Python:
cv.text.createOCRHMMTransitionsTable(vocabulary, lexicon) -> retval

#include <opencv2/text/ocr.hpp>

与えられた単語リスト(語彙)から、用途に合わせた言語モデルの遷移テーブルを作成するユーティリティ関数。

引数
vocabulary言語の語彙(ASCII英語テキストの場合は文字)。
lexicon特定の画像内で見つかると想定される単語のリスト。
transition_probabilities_table文字ペア間の遷移確率を格納する出力テーブル。cols == rows == vocabulary.size()。

この関数は与えられた語彙から文字ペアの出現頻度統計を計算し、出力 transition_probabilities_table にそれらを格納する。transition_probabilities_table は OCRHMMDecoder::create() および OCRBeamSearchDecoder::create() メソッドの入力として使用できる。

覚え書き

◆ loadOCRBeamSearchClassifierCNN()

Ptr< OCRBeamSearchDecoder::ClassifierCallback > cv::text::loadOCRBeamSearchClassifierCNN ( const String & filename)
Python:
cv.text.loadOCRBeamSearchClassifierCNN(filename) -> retval

#include <opencv2/text/ocr.hpp>

OCRBeamSearchDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数
filename分類器モデルを格納したXMLまたはYAMLファイル(例: OCRBeamSearch_CNN_model_data.xml.gz)

CNNのデフォルト分類器は、Adam Coates と Andrew NG が [Coates11a] で提案したシーンテキスト認識手法に基づく。この文字分類器は、単層の畳み込みニューラルネットワークと線形分類器から構成される。入力画像にスライディングウィンドウ方式で適用され、各ウィンドウ位置で一連の認識結果を返す。

◆ loadOCRHMMClassifier()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifier ( const String & filename,
int classifier )
Python:
cv.text.loadOCRHMMClassifier(filename, classifier) -> retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数
filename分類器モデルを格納したXMLまたはYAMLファイル(例: OCRBeamSearch_CNN_model_data.xml.gz)
classifierclassifier_type 列挙値のいずれかを指定できる。

◆ loadOCRHMMClassifierCNN()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierCNN ( const String & filename)
Python:
cv.text.loadOCRHMMClassifierCNN(filename) -> retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数
filename分類器モデルを格納したXMLまたはYAMLファイル(例: OCRBeamSearch_CNN_model_data.xml.gz)

CNNのデフォルト分類器は、Adam Coates と Andrew NG が [Coates11a] で提案したシーンテキスト認識手法に基づく。この文字分類器は、単層の畳み込みニューラルネットワークと線形分類器から構成される。入力画像にスライディングウィンドウ方式で適用され、各ウィンドウ位置で一連の認識結果を返す。

非推奨Deprecated
代わりに loadOCRHMMClassifier を使用すること

◆ loadOCRHMMClassifierNM()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierNM ( const String & filename)
Python:
cv.text.loadOCRHMMClassifierNM(filename) -> retval

#include <opencv2/text/ocr.hpp>

OCRHMMDecoder オブジェクトの作成時に、デフォルトの文字分類器を暗黙的に読み込めるようにする。

引数
filename分類器モデルを格納したXMLまたはYAMLファイル(例: OCRHMM_knn_model_data.xml)

KNNのデフォルト分類器は、Lukás Neumann と Jiri Matas が [Neumann11b] で提案したシーンテキスト認識手法に基づく。基本的には、入力画像内の領域(輪郭)を、重心とアスペクト比を保持したまま固定サイズに正規化し、輪郭線のチェーンコードに沿った勾配方向に基づく特徴ベクトルを抽出する。その後、異なる標準フォントタイプでレンダリングした文字の合成データで学習したKNNモデルを用いて領域を分類する。

非推奨Deprecated
代わりに loadOCRHMMClassifier を使用すること