华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试
华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试
- 1. 概述
- 2. Dify高可用方案验证与测试
- 2.1. FlexusX实例
- 2.2. 分布式缓存服务Redis
- 2.3. 云数据库RDS
- 2.4. 云搜索服务CSS OpenSearch集群
- 2.5. 云容器引擎 CCE Turbo集群
- 3. Dify高可用集群测试总结
1. 概述
根据架构图咱们依次对各个组件进行高可用方案测试
我们还是使用在部署完Dify-LLM高可用平台后的“旅游Agent”作为高可用方案验证的例子,在我们关停某个组件后如果“旅游Agent”不受影响,那么就满足高可用方案。
未进行高可用操作之前先验证下“旅游Agent”功能,确保“旅游Agent”功能是完全正常的。
2. Dify高可用方案验证与测试
2.1. FlexusX实例
因为有三台FlexusX实例,三台FlexusX实例安装部署Dify5个核心插件,接下来我们关闭其中一台FlexusX实例
执行关机后,确保FlexusX实例状态变为关机状态:
验证一下目前“旅游Agent”,结论是不受任何影响,可以继续使用
因为一共三台FlexusX实例安装部署Dify5个核心插件,上面已经关闭了一台,如果再关闭其中一台FlexusX实例呢?
接下来我们再关闭一个FlexusX实例,确保有两台FlexusX实例状态变为关机状态:
结论:虽然功能不受影响,但是智能体的响应速度人为感知明显变慢了很多
为了后续验证工作的继续,先恢复一个FlexusX实例节点,接下来再验证下将部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例关闭
确保部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例状态变为关机状态
结论:验证Dify平台功能不受影响,性能几乎也不受影响
2.2. 分布式缓存服务Redis
Redis服务是主从架构,但是不能单独操作主从节点,如果主节点出现故障后会自动切换从节点
现在Redis主节点是192.168.1.119,接下来模拟主节点故障,然后手动进行主从切换
现在主从节点切换完成,原来的主节点变为了从节点,从节点变为了主节点
结论:验证Dify平台功能不受影响,性能几乎也不受影响
2.3. 云数据库RDS
云数据库PostgreSQL实例,使用主备方式部署,同样也不能单独操作主从节点,如果主节点出现故障后会自动切换从节点
现在模拟主节点故障,然后手动进行主从切换,生产环境会自动进行主从切换
点击“是”按钮后会进行主从节点切换
主备切换过程中会导致Dify平台不可用
结论:主备切换完成之后服务恢复正常,验证功能正常,性能不受影响
2.4. 云搜索服务CSS OpenSearch集群
直接对集群进行重启,验证一下重启过程中以及重启后Dify是否有影响
状态显示为“重启中”
结论:验证功能正常,性能不受影响
2.5. 云容器引擎 CCE Turbo集群
CCE Turbo集群是容器的管理工具,最后验证将CCE Turbo集群删除
结论:Dify平台访问无影响,但是聊天交互基本上已无应答,功能受到影响
3. Dify高可用集群测试总结
本篇博文对华为云Dify高可用集群进行的测试,主要验证了高可用系统的稳定性与性能。测试中模拟了节点故障场景,结果显示主备服务节点能够快速切换至备用节点,持续提供服务,验证了高可用架构的有效性。同时,性能测试表明,集群在负载均衡下运行平稳,无明显性能瓶颈。不过在测试中发现部分场景下主从切换过程会导致集群不可用,日志监控输出不够完善。希望加强系统主从切换日志的一些输出,以进一步提升系统的响应速度和可维护性。总体而言,本次测试华为云Dify高可用平台无论是在性能还是稳定性上都能满足企业的开发需求。