WAV ファイルを文字起こし
sapi_transcribe_wav handle, "wav_path", out_text, out_len
(プラグイン / モジュール : hspsapi_64.dll)
SPBindToFile で WAV を ISpStream として開いて recognizer の入力に セット → SetRecoState(SPRST_ACTIVE) → 認識完了まで GetEvents で イベントループ → SPEI_RECOGNITION で ISpRecoResult::GetText を取得 → 全 phrase を空白区切りで連結して out_text に返します。 最大 ~10 分でタイムアウト。 戻り値: 書き込んだ byte 数 / -1 失敗
| プラグイン / モジュール | hspsapi_64.dll |
| バージョン | 1.0 |
| 作成日 | 2026-04-14 |
| 著作者 | IronHSP / hspsapi |
| URL | https://github.com/inovia/IronHSP |
| 備考 | hspsapi.dll は Windows 標準の SAPI 5 (sapi.dll) を ISpRecognizer +
ISpRecoContext + ISpRecoGrammar の COM 階層で叩いて、HSP から オフライン音声認識をできるようにする helper DLL です。 特徴: * Windows 標準、追加 DL 不要 (sapi.dll は OS 同梱) * ディクテーションモード (連続音声認識) * 多言語: OS の Speech Recognition Language に依存 注意: * 認識品質は whisper.cpp / Vosk より低い (英語専用想定) * 日本語認識は Windows 設定 → 言語 → 音声認識 で日本語パックの インストールが必要 (デフォルトでは入っていない) * ライブマイク入力は未実装 (WAV ファイルからの認識のみ) * SpInprocRecognizer + SPBindToFile + SPRS_ACTIVE のフロー HSP からは package/win32/common/iron_speech.hsp を SPEECH_BACKEND_SAPI で使うのが推奨です。 |
| タイプ | 拡張命令 |
| グループ | hspsapi |
| 対応環境 |
|
| hs ファイル | hsphelp\hspsapi.hs |