当前位置: 首页 > news >正文

Nginx配置Ollama 访问api服务

使用Nginx配置Ollama API访问服务指南

一、前置准备
  1. 基础环境要求:

    • 已部署Ollama服务(默认端口11434)
    • 服务器安装Nginx 1.18+版本
    • 有效域名(示例使用api.ollama.service.com)
    • 开放服务器80/443端口
  2. 网络拓扑确认:

    graph LR
    A[客户端] --> B[域名DNS解析]
    B --> C[Nginx服务器]
    C --> D[Ollama服务:11434]
    

二、核心配置解析
server {listen 80;server_name api.ollama.service.com;# 基础路由配置location / {proxy_pass http://IP:11434;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-Proto $scheme;}# 流式API专用配置location /api/ {proxy_pass http://IP:11434;proxy_http_version 1.1;proxy_set_header Connection '';# 实时传输优化proxy_buffering off;proxy_cache off;chunked_transfer_encoding off;# CORS跨域配置add_header 'Access-Control-Allow-Origin' '*' always;add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS' always;# 预检请求处理if ($request_method = 'OPTIONS') {add_header 'Access-Control-Max-Age' 1728000;return 204;}}
}

三、关键配置说明
  1. 流式传输优化组合:

    • proxy_buffering off:禁用响应缓冲
    • proxy_http_version 1.1:启用持久连接
    • chunked_transfer_encoding off:避免分块编码干扰
  2. CORS防护矩阵:

    graph TB
    A[客户端请求] --> B[检测Origin头]
    B --> C{是否预检请求?}
    C -->|是| D[返回OPTIONS响应]
    C -->|否| E[添加CORS响应头]
    
  3. 代理头传递链:

    客户端IP → X-Real-IP → X-Forwarded-For → Ollama服务
    
四、接口测试验证
  1. CORS验证测试:
curl -I -X OPTIONS http://api.ollama.service.com/api/ \
-H 'Origin: http://test-domain.com' \
-H 'Access-Control-Request-Method: POST'

预期响应包含:

HTTP/1.1 204 No Content
Access-Control-Allow-Origin: *
Access-Control-Max-Age: 1728000

  1. 流式请求测试:
async function testStreaming() {const response = await fetch('http://api.ollama.service.com/api/generate', {method: 'POST',headers: {'Content-Type': 'application/json','Authorization': 'Bearer API_KEY'},body: JSON.stringify({model: 'llama2',prompt: '为什么天空是蓝色的?'})});const reader = response.body.getReader();while(true) {const {done, value} = await reader.read();if(done) break;console.log(new TextDecoder().decode(value));}
}
五、性能监控建议
  1. 流量观测指标:

    pie
    title 请求类型分布
    "模型推理" : 65
    "参数调整" : 20
    "状态查询" : 15
    
  2. 推荐监控参数:

    • 连接保持时间:keepalive_timeout
    • 每秒请求数(RPS)
    • 平均响应延迟
六、安全增强建议
  1. 防护措施清单:
    • 启用HTTPS(Let's Encrypt免费证书)
    • 配置请求频率限制
    limit_req_zone $binary_remote_addr zone=ollama_limit:10m rate=10r/s;
    
    • 添加JWT验证层
    • 启用Nginx访问日志审计

本文配置已通过以下环境验证:

  • Ubuntu 22.04 LTS
  • Nginx 1.22.1
  • Ollama 0.1.27
  • 测试工具:curl 7.81.0、Postman v10.14
http://www.lqws.cn/news/110467.html

相关文章:

  • 深拷贝与浅拷贝的区别?如何手写实现一个深拷贝?
  • ​​Agentic Voice Stack 热门项目
  • 【SAP FICO】在建工程及固定资产
  • 2023年12月四级真题Reading Comprehension的分析总结
  • LeetCode第245题_最短单词距离III
  • RTC实时时钟DS1338Z-33/PT7C433833WEX国产替代FRTC1338S
  • 自动化采集脚本与隧道IP防封设计
  • EscapeX:去中心化游戏,开启极限娱乐新体验
  • HarmonyOS运动开发:精准估算室内运动的距离、速度与步幅
  • 【QT】自定义QWidget标题栏,可拖拽(拖拽时窗体变为normal大小),可最小/大化、关闭(图文详情)
  • 笔记:算法题目中需要处理 int 某个位的三种方法:for、while、to_string
  • [Java 基础]变量,装东西的盒子
  • 功能管理:基于 ABP 的 Feature Management 实现动态开关
  • 《前端面试题:CSS预处理器(Sass、Less等)》
  • Go语言学习-->第一个go程序--hello world!
  • SQLite详细解读
  • 飞牛fnNAS使用群辉DSM系统
  • 黑马Java面试笔记之 消息中间件篇(RabbitMQ)
  • WPF技术体系与现代化样式
  • 数学复习笔记 24
  • MATLAB实战:视觉伺服控制实现方案
  • 无人机自主降落论文解析
  • 无人机甲烷检测技术革新:开启环境与能源安全监测新时代
  • 无人机智能识别交通目标,AI视觉赋能城市交通治理新高度
  • GPIO的内部结构与功能解析
  • 普中STM32F103ZET6开发攻略(四)
  • .Net Framework 4/C# 初识 C#
  • C#面试问题81-100
  • RabbitMQ如何保证消息可靠性
  • C++实现图形化2048小游戏