Ollama
Ollama は大規模 言語 モデルを本地 で実行 するためのオープンソースツールです。
導入
基本 コマンド
run
nohup ollama serve &> ollama.log &check alive
curl http://127.0.0.1:11434/v1/modelspull
ollama pull qwen2.5:0.5bprompt
curl http://127.0.0.1:11434/api/generate \
-H "Content-Type: application/json" \
-d '{
"model": "qwen2.5:0.5b",
"prompt": "who are you?",
"stream": false
}'