当前位置: 首页 > news >正文

华为云Flexus+DeepSeek征文|一键部署知识库搜索增强版搭建AI Agent

前言

这次用部署知识搜索增强的版本来进行体验,学习基于Dify平台开发AI Agent的完整流程,部署流程参考我上一篇基础版本部署。这里只说明详细功能部分,部署部分不做过多的述说。

知识库搜索增强版配置内容

1. 创建一台FlexusX实例,用于搭建Dify-LLM应用开发平台

2. 创建一台FlexusX实例,用于部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型

3. 创建两个弹性公网IP EIP并分别关联两个FlexusX实例,提供访问公网和被公网访问能力

4. 创建一个云搜索服务 CSS OpenSearch集群,提供在线分布式搜索及语义搜索等功能

5. 创建一个安全组,通过配置安全组规则,为云服务器提供安全防护

费用明细

具体详细内容可以参考资源和成本规划_快速搭建Dify-LLM应用开发平台_AI-华为云

部署过程

部署之后生成事件,生成需要估计10分钟

生成失败

部署的时候填写密码的时候要注意⚠️,密码必须包含以下字符类型的至少三个:小写字母、大写字母、数字和特殊字符

huaweicloud_compute_instance.compute_instance_dify: Creation errored after 3s, Diagnostic details : [Error: error creating server: Bad request with: [POST https://ecs.cn-north-4.myhuaweicloud.com/v1.1/072d3b47a400265d2fe9c00fc372e772/cloudservers], request_id: a9f6591fff597814f9d2ddeb0564abd9, error message: {"error":{"message":"The password must contain at least three of the following character types: lowercase letters, uppercase letters, digits, and special characters","code":"Ecs.0011"}} Diagnostic range : {"filename":"main.tf.json","start":{"line":294,"column":13,"byte":14020},"end":{"line":294,"column":14,"byte":14021}} Diagnostic snippet : resource.huaweicloud_compute_instance.compute_instance_dify] 

生成成功

看到 Apply required resource success.代表成功了,等待了20分钟有。

查看事件输出查看访问链接

跳转访问之后要先配置账户名密码

与MaaS服务对接

在线推理获取服务

进入ModelArts Studio控制台,点击在线推理,获取免费的模型服务

领取之后点击调用说明,里面有详细的对接说明保存好api地址,之后要用

创建Api Key

当你要用MaaS部署的模型服务时,得填个API Key来做验证。你可以在左边的导航栏里点“API Key管理”来搞这个(最多能整30个密钥哦)。记住,每个密钥在创建的时候只会显示一次,所以千万要保存好。

配置模型

点击用户头像设置,进入模型提供商,安装插件

配置模型

这里是配置MaaS的Api服务也可以自己配置第三方

知识库

创建自己的知识库,可以更快的根据你的提问,检索对应的信息。

经济型

每个块使用 10 个关键词进行检索,不消耗 tokens,但会降低检索准确性。

高质量型

选择高质量模块,在Embedding模型栏目选择添加的模型,在检索设置栏目,选择混合检索(可同时使用向量检索和关键词检索,并控制两者权重),在下方开启Score阈值开关,并滑动下方的滑动按钮来选择阈值,推荐0.5,下方还有TOP K的选项,可以控制最终被使用的文档分片的最大数量。调用嵌入模型来处理文档以实现更精确的检索,可以帮助大语言模型生成高质量的回答。

知识库 API

可以使用api的方式来调用api

创建工作流应用

开发AI Agent

导入DSL工作流示例

https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_searXNG%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml

填入上面的url导入工作流模版

成功显示工作流

配置知识库

点击知识库标签栏目,配置之前添加的知识库。

一切没有问题就可以点击发布了

聊天对话

发布应用之后就可以进行应用的对话了,这里访问的方式有三种。

嵌入网页

Api的方式

开始对话

询问一些简单的问题

最后

本文详细记录了基于Dify开发AI Agent的全过程,包括代码片段和效果展示。同时介绍了Dify-LLM平台的部署过程,并探讨了遇到的问题及解决方案。此外,还记录了MaaS服务开通的流程和使用体验。

http://www.lqws.cn/news/536635.html

相关文章:

  • 《仿盒马》app开发技术分享-- 逻辑优化第三弹(83)
  • 新手向:Neo4j的安装与使用
  • 供应链数据可视化大屏
  • OneCode框架 Tree 相关注解使用说明
  • 服务器的安装与安全设置 域环境的搭建和管理 Windows基本配置 网络服务常用网络命令的应用 安全管理Windows Server 2019
  • 独立开发还能做吗
  • Git-git worktree的使用
  • 测试方法的分类
  • recipes的版本比较老如何更新到新版本?
  • 板凳-------Mysql cookbook学习 (十--11)
  • AAAI 2025论文分享│面向生物医学的具有像素级洞察力的多模态大语言模型
  • day43 打卡
  • Redis主从架构哨兵模式
  • Rk3568驱动开发_Key驱动_13
  • Flink部署与应用——Flink架构概览
  • 如何在 Manjaro Linux 上启用 AUR 仓库来安装软件包
  • 关于如何在 Git 中切换到之前创建的分支的方法
  • 机器学习17-发展历史补充
  • 云财乐企新华网专访:以数字引擎驱动财税普惠化变革,赋能企业高质量发展
  • 可视化大屏展示
  • ubuntu部署woodpecker依赖gitea
  • 2-深度学习挖短线股-1-股票范围选择
  • Linux 高效网络调试命令
  • 同步互斥与通信-有缺陷的同步示例FreeRTOS笔记
  • window显示驱动开发—支持 DXGI DDI(四)
  • 21.合并两个有序链表
  • vscode运行c++文件和插件的方法
  • C语言专题:15.宏定义与控制指令(#define、#ifndef、#undef、#defined)
  • MySQL(基础篇)
  • [特殊字符] Windows 查看端口占用及服务来源教程(以 9018 端口为例)