https://github.com/onllama/Onllama.LiteGateway
wget https://git.apad.pro/github.com/onllama/Onllama.LiteGateway/releases/latest/download/Onllama.LiteGateway.linux-x64 -O /usr/bin/Onllama.LiteGateway
wget https://git.apad.pro/raw.githubusercontent.com/onllama/Onllama.LiteGateway/refs/heads/main/[email protected] -O /etc/systemd/system/[email protected]
chmod +x /usr/bin/Onllama.LiteGateway 
systemctl enable onllama-litegateway@sk-just-for-example --now
# 请替换 'sk-just-for-example' 为你想要设置的 apikey 。
# curl http://127.0.0.1:22434
同时已支持:
|  |      1gzlock      239 天前  1 好一个 onllama... | 
|      2YsHaNg      239 天前 ollama 这样的后端不应该只放内网吗 前端暴露公网就好了 | 
|  |      3musi      238 天前 via iPhone ollama 也不支持并发,为什么有暴露到公网的想法 | 
|      5mili100 OP @gzlock 意指站在巨人的肩膀上,或者是羊驼的背上(? @musi Ollama 从 [v0.1.33]( https://github.com/ollama/ollama/releases/tag/v0.1.33) 开始就已经支持并发和同时加载多个模型了,已经足以能够胜任一些中小规模的生产环境了 |