当前位置：首页 > news >正文

NebulaGraph 图数据库介绍

news 2025/6/27 21:12:42

NebulaGraph 图数据库介绍

NebulaGraph 是一款开源的分布式图数据库，专为处理千亿级顶点和万亿级边的超大规模数据集设计。其核心概念围绕图数据模型展开，通过独特的架构和功能优化，实现了高效的关系查询与复杂网络分析。以下是其特有概念的详细介绍：

1. 数据模型核心概念

图空间（Space）
- 逻辑隔离的数据单元，类似关系型数据库中的“数据库”，支持多图空间独立管理，不同空间的数据物理隔离，可设置不同副本数以应对可用性需求。
- 示例：社交网络数据与金融风控数据可存储在不同图空间，实现资源隔离。
点（Vertex）
- 实体对象，由 VID（顶点标识符） 唯一标识，支持 int64 或 fixed_string(N) 类型。
- 必须关联至少一个 Tag（标签），Tag 定义点的属性结构（类似表的 Schema）。
- 示例：用户顶点可包含 name, age, gender 等属性。
边（Edge）
- 表示点间关系，由四元组 <起点VID, Edge Type, Rank, 终点VID> 唯一标识。
- Edge Type 定义边的属性结构（如 Follow, Transfer），支持有向关系。
- Rank 用于区分同一对顶点间相同 Edge Type 的多条边（默认值为 0）。
- 示例：用户 A 关注用户 B 的边可记录时间戳属性。
标签（Tag）与边类型（Edge Type）
- Tag：点的类型模板，定义属性集合（如 User(name, age)）。
- Edge Type：边的类型模板，定义关系属性（如 Follow(time)）。
- 支持模式扩展，一个点可关联多个 Tag，一条边仅关联一种 Edge Type。
属性（Property）
- 键值对形式存储，支持多种数据类型（如 int, string, timestamp）。
- 可附加到点和边，例如边属性记录交易金额或关系强度。

2. 分布式架构特性

存储与计算分离
- Meta 服务：管理元数据（Schema、权限、分片信息），基于 Raft 协议保证高可用。
- Graph 服务：处理查询请求，解析、校验并生成执行计划，支持横向扩展。
- Storage 服务：使用 RocksDB 存储引擎，通过 Raft 实现数据多副本一致性。
数据分片与负载均衡
- 数据按哈希或随机策略分片，结合 Raft 协议确保副本一致性。
- 支持动态扩容，存储与计算资源可独立扩展，避免资源浪费。

3. 查询语言：nGQL

声明式查询语言，兼容 OpenCypher，支持模式匹配、路径查询、聚合等操作。

核心语法示例：

-- 查询年龄大于 30 的用户
MATCH (v:User) WHERE v.age > 30 RETURN v;-- 查询用户 A 关注的用户及其关系时间
MATCH (a:User)-[e:Follow]->(b:User)
WHERE a.name = 'A'
RETURN b.name, e.time;-- 查找两节点间的最短路径
FIND SHORTEST PATH FROM "user1" TO "user2" OVER *;

4. 高级功能特性

索引与优化
- 支持 原生索引（基于 RocksDB）和 全文索引（基于 Elasticsearch），加速属性条件查询。
- 示例：为 User 标签的 name 属性创建索引，提升按姓名查询效率。
图算法集成
- 内置最短路径、PageRank、社区发现等算法，支持自定义扩展。
- 示例：检测金融交易网络中的异常资金流向。
数据生命周期管理
- TTL：设置数据有效期，自动清理过期数据释放资源。
- Job 管理：支持 Compaction/Flush 等后台任务调度。
安全与权限
- 内置 ACL 机制，支持角色访问控制（GOD/ADMIN/DBA/USER/GUEST）。
- 可对接 LDAP 等外部认证系统，满足企业级安全需求。