OpenCV 5.0.0
Open Source Computer Vision
読み込み中...
検索中...
見つかりません
🤖 AIによる機械翻訳(非公式) — これは OpenCV 5.0.0 公式リファレンス(英語)を AI (Claude) で自動翻訳したものです。訳に誤りを含む場合があります。正確な情報は 公式英語版(原文) を参照してください。

このクラスはテキスト認識ネットワークの高レベルAPIを表す。 詳細...

#include <opencv2/dnn/dnn.hpp>

Collaboration diagram for cv::dnn::TextRecognitionModel:

公開メンバ関数

 TextRecognitionModel ()
 
 TextRecognitionModel (const Net &network)
 ディープラーニングネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。
 
 TextRecognitionModel (CV_WRAP_FILE_PATH const std::string &model, CV_WRAP_FILE_PATH const std::string &config="")
 サポートされている形式のいずれかで表現されたネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。
 
const std::string & getDecodeType () const
 デコード方式を取得する。
 
const std::vector< std::string > & getVocabulary () const
 認識用の語彙を取得する。
 
std::string recognize (InputArray frame) const
 input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。
 
void recognize (InputArray frame, InputArrayOfArrays roiRects, std::vector< std::string > &results) const
 input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。
 
TextRecognitionModelsetDecodeOptsCTCPrefixBeamSearch (int beamSize, int vocPruneSize=0)
 "CTC-prefix-beam-search" デコードを使用する際のデコード方式オプションを設定する。
 
TextRecognitionModelsetDecodeType (const std::string &decodeType)
 ネットワーク出力を文字列に変換するデコード方式を設定する。
 
TextRecognitionModelsetVocabulary (const std::vector< std::string > &vocabulary)
 認識用の語彙を設定する。
 
- Public Member Functions inherited from cv::dnn::Model
 Model ()
 
 Model (const Model &)=default
 
 Model (const Net &network)
 ディープラーニングのネットワークからモデルを作成する。
 
 Model (CV_WRAP_FILE_PATH const String &model, CV_WRAP_FILE_PATH const String &config="")
 サポートされている形式のいずれかで表現されたディープラーニングのネットワークからモデルを作成する。modelconfig 引数の順序は問わない。
 
 Model (Model &&)=default
 
ModelenableWinograd (bool useWinograd)
 
Impl * getImpl () const
 
Impl & getImplRef () const
 
NetgetNetwork_ ()
 
NetgetNetwork_ () const
 
 operator Net & () const
 
Modeloperator= (const Model &)=default
 
Modeloperator= (Model &&)=default
 
void predict (InputArray frame, OutputArrayOfArrays outs) const
 input フレームを与え、入力blobを作成し、netを実行して出力 blobs を返す。
 
ModelsetInputCrop (bool crop)
 フレームに対するcropフラグを設定する。
 
ModelsetInputMean (const Scalar &mean)
 フレームに対する平均値を設定する。
 
void setInputParams (double scale=1.0, const Size &size=Size(), const Scalar &mean=Scalar(), bool swapRB=false, bool crop=false)
 フレームの前処理パラメータを設定する。
 
ModelsetInputScale (const Scalar &scale)
 フレームのscalefactor値を設定する。
 
ModelsetInputSize (const Size &size)
 フレームの入力サイズを設定する。
 
ModelsetInputSize (int width, int height)
 
ModelsetInputSwapRB (bool swapRB)
 フレームのフラグswapRBを設定する。
 
ModelsetOutputNames (const std::vector< String > &outNames)
 フレームの出力名を設定する。
 
ModelsetPreferableBackend (dnn::Backend backendId)
 
ModelsetPreferableTarget (dnn::Target targetId)
 

Additional Inherited Members

- Protected Attributes inherited from cv::dnn::Model
Ptr< Impl > impl
 

詳細説明

このクラスはテキスト認識ネットワークの高レベルAPIを表す。

TextRecognitionModel では入力画像の前処理用の引数を設定できる。TextRecognitionModel は学習済み重みと構成を含むファイルからネットワークを生成し、入力の前処理を設定し、順伝播を実行して認識結果を返す。TextRecognitionModel では CRNN-CTC がサポートされている。

samples/dnn/text_detection.cpp.

構築子と解体子の詳解

◆ TextRecognitionModel() [1/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel ( )
Python:
cv.dnn.TextRecognitionModel(network) -> <dnn_TextRecognitionModel object>
cv.dnn.TextRecognitionModel(model[, config]) -> <dnn_TextRecognitionModel object>

◆ TextRecognitionModel() [2/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel ( const Net & network)
Python:
cv.dnn.TextRecognitionModel(network) -> <dnn_TextRecognitionModel object>
cv.dnn.TextRecognitionModel(model[, config]) -> <dnn_TextRecognitionModel object>

ディープラーニングネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

引数
[in]networkNet オブジェクト

◆ TextRecognitionModel() [3/3]

cv::dnn::TextRecognitionModel::TextRecognitionModel ( CV_WRAP_FILE_PATH const std::string & model,
CV_WRAP_FILE_PATH const std::string & config = "" )
inline
Python:
cv.dnn.TextRecognitionModel(network) -> <dnn_TextRecognitionModel object>
cv.dnn.TextRecognitionModel(model[, config]) -> <dnn_TextRecognitionModel object>

サポートされている形式のいずれかで表現されたネットワークからテキスト認識モデルを生成する。デコード方式を初期化するには、コンストラクタの後に setDecodeType() および setVocabulary() を呼び出すこと。

引数
[in]model学習済み重みを含むバイナリファイル
[in]configネットワーク構成を含むテキストファイル
この関数の呼び出しグラフ:

メンバ関数詳解

◆ getDecodeType()

const std::string & cv::dnn::TextRecognitionModel::getDecodeType ( ) const
Python:
cv.dnn.TextRecognitionModel.getDecodeType() -> retval

デコード方式を取得する。

戻り値
デコード方式

◆ getVocabulary()

const std::vector< std::string > & cv::dnn::TextRecognitionModel::getVocabulary ( ) const
Python:
cv.dnn.TextRecognitionModel.getVocabulary() -> retval

認識用の語彙を取得する。

戻り値
vocabulary 関連付けられた語彙

◆ recognize() [1/2]

std::string cv::dnn::TextRecognitionModel::recognize ( InputArray frame) const
Python:
cv.dnn.TextRecognitionModel.recognize(frame) -> retval
cv.dnn.TextRecognitionModel.recognize(frame, roiRects) -> results

input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

引数
[in]frame入力画像
戻り値
テキスト認識結果

◆ recognize() [2/2]

void cv::dnn::TextRecognitionModel::recognize ( InputArray frame,
InputArrayOfArrays roiRects,
std::vector< std::string > & results ) const
Python:
cv.dnn.TextRecognitionModel.recognize(frame) -> retval
cv.dnn.TextRecognitionModel.recognize(frame, roiRects) -> results

input フレームを与えると、入力ブロブを生成し、ネットワークを実行して認識結果を返す。

引数
[in]frame入力画像
[in]roiRects対象とするテキスト検出領域のリスト(cv::Rect, CV_32SC4)。ROIはネットワークの入力として切り出される
[out]resultsテキスト認識結果の集合。

◆ setDecodeOptsCTCPrefixBeamSearch()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setDecodeOptsCTCPrefixBeamSearch ( int beamSize,
int vocPruneSize = 0 )
Python:
cv.dnn.TextRecognitionModel.setDecodeOptsCTCPrefixBeamSearch(beamSize[, vocPruneSize]) -> retval

"CTC-prefix-beam-search" デコードを使用する際のデコード方式オプションを設定する。

引数
[in]beamSize探索のビームサイズ
[in]vocPruneSize大規模な語彙の探索を最適化するための引数。各探索ステップで上位 vocPruneSize 個のトークンのみを採用する。vocPruneSize <= 0 はこの枝刈りを無効にすることを意味する。

◆ setDecodeType()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setDecodeType ( const std::string & decodeType)
Python:
cv.dnn.TextRecognitionModel.setDecodeType(decodeType) -> retval

ネットワーク出力を文字列に変換するデコード方式を設定する。

引数
[in]decodeTypeネットワーク出力を文字列に変換するデコード方式。現在サポートされている型:
  • "CTC-greedy" CTCベース手法の出力に対する貪欲デコード
  • "CTC-prefix-beam-search" CTCベース手法の出力に対するプレフィックスビームサーチデコード

◆ setVocabulary()

TextRecognitionModel & cv::dnn::TextRecognitionModel::setVocabulary ( const std::vector< std::string > & vocabulary)
Python:
cv.dnn.TextRecognitionModel.setVocabulary(vocabulary) -> retval

認識用の語彙を設定する。

引数
[in]vocabularyネットワークに関連付けられた語彙。

このクラス詳解は次のファイルから抽出されました: