whisper_transcribe_pcm

生 float32 PCM を文字起こし

whisper_transcribe_pcm handle, pcm_var, sample_count, "lang", out_text, text_len

(プラグイン / モジュール : hspwhisper_64.dll)

解説

16kHz mono float32 PCM 配列を直接渡して文字起こし。
WAV loader を経由しないので、自前でリサンプル済みの音声 (例えば
mfcam_audio_read_pcm の生 PCM) をそのまま渡せます。

情報

プラグイン / モジュールhspwhisper_64.dll
バージョン1.0
作成日2026-04-14
著作者IronHSP / hspwhisper
URLhttps://github.com/inovia/IronHSP
備考hspwhisper.dll は OpenAI Whisper の高速 C++ 移植版 whisper.cpp
(ggerganov 製) を HSP からラップしたオフライン音声認識プラグイン。

特徴:
* オフライン (ネットワーク不要、API キー不要)
* 多言語対応 (日本語含む 99 言語)
* GGML 量子化モデル (tiny 75MB / base 140MB / small 470MB / medium 1.5GB / large 3GB)
* CPU 推論 (4 thread デフォルト)

依存:
third_party/whisper.cpp の cmake build 済 whisper.lib + ggml*.lib
GGML model file (別途 DL)

HSP からは package/win32/common/iron_speech.hsp を SPEECH_BACKEND_WHISPER
で使うのが推奨です。生 API は本ヘルプ参照。

ビルド + モデル DL の手順:
plugins/win32/hspwhisper/README.md 参照
タイプ拡張命令
グループhspwhisper
対応環境
  • その他 : Win64 専用 (whisper.cpp の SIMD 依存)
hs ファイルhsphelp\hspwhisper.hs