llama_complete

単発補完 (同期)

llama_complete h, "prompt", max_tokens, var_result_str, buf_size

h               : セッションハンドル
"prompt"        : プロンプト文字列
max_tokens      : 生成する最大トークン数
var_result_str  : 結果を受け取る str 変数 (sdim 済)
buf_size        : var_result_str に sdim で確保したバッファサイズ

(プラグイン / モジュール : hspllama.dll)

解説

プロンプトを流し込み、最大 max_tokens 個のトークンを生成して
結果文字列を var_result_str に格納します。EOS トークンに到達した
時点で打ち切られます。
var_result_str は事前に sdim で十分なサイズを確保し、その sdim
サイズを buf_size に指定してください。

サンプル逆引き (1)

sample_llama.hsp

情報

プラグイン / モジュールhspllama.dll
バージョン1.0
作成日2026-04-15
著作者IronHSP / hspllama
URLhttps://github.com/inovia/IronHSP
備考hspllama.dll は llama.cpp (https://github.com/ggerganov/llama.cpp)
embed した local LLM 推論プラグインです。HSP から GGUF 形式の
量子化済モデルを読み込み、同期または streaming で補完 / チャットが
可能です。

ビルドには llama.cpp の static lib または dll 配置が必要です。
plugins/win32/hspllama/third_party/llamacpp/README.md の手順で
CMake ビルド → hspllama.vcxproj に lib を追加してください。
llama.cpp 未配置でもスタブとしてビルドは通ります (実推論は不可)。

同時に 4 モデルまで保持できます。LLM は VRAM / RAM を大量に
消費するので、使わないモデルは llama_close で速やかに開放して
ください。

iron_ai.hsp に LOCAL_LLAMA バックエンドを追加しており、
通常は iron_ai_set_backend / iron_ai_chat 経由で呼び出すのが
簡単です (iron_ai.hsp 参照)。
タイプ拡張命令
グループhspllama ― 推論
対応環境
  • その他 : Win32 / Win64
hs ファイルhsphelp\hspllama.hs