chat 形式の補完 (同期, chat template 適用)
llama_chat h, "system", "user", max_tokens, var_result_str, buf_size
h : セッションハンドル "system" : system プロンプト "user" : user プロンプト max_tokens : 生成する最大トークン数 var_result_str : 結果を受け取る str 変数 (sdim 済) buf_size : var_result_str に sdim で確保したバッファサイズ
(プラグイン / モジュール : hspllama.dll)
モデル組み込みの chat template を適用して system + user を 適切な形式に整形し、assistant の返答を生成します。 var_result_str は事前に sdim で十分なサイズを確保し、その sdim サイズを buf_size に指定してください。
| プラグイン / モジュール | hspllama.dll |
| バージョン | 1.0 |
| 作成日 | 2026-04-15 |
| 著作者 | IronHSP / hspllama |
| URL | https://github.com/inovia/IronHSP |
| 備考 | hspllama.dll は llama.cpp (https://github.com/ggerganov/llama.cpp) を
embed した local LLM 推論プラグインです。HSP から GGUF 形式の 量子化済モデルを読み込み、同期または streaming で補完 / チャットが 可能です。 ビルドには llama.cpp の static lib または dll 配置が必要です。 plugins/win32/hspllama/third_party/llamacpp/README.md の手順で CMake ビルド → hspllama.vcxproj に lib を追加してください。 llama.cpp 未配置でもスタブとしてビルドは通ります (実推論は不可)。 同時に 4 モデルまで保持できます。LLM は VRAM / RAM を大量に 消費するので、使わないモデルは llama_close で速やかに開放して ください。 iron_ai.hsp に LOCAL_LLAMA バックエンドを追加しており、 通常は iron_ai_set_backend / iron_ai_chat 経由で呼び出すのが 簡単です (iron_ai.hsp 参照)。 |
| タイプ | 拡張命令 |
| グループ | hspllama ― 推論 |
| 対応環境 |
|
| hs ファイル | hsphelp\hspllama.hs |