Jupyter Notebook 遇上 NebulaGraph，可视化探索图数据库-低调大师

Jupyter Notebook 遇上 NebulaGraph，可视化探索图数据库

2023-08-08 810

在之前的《手把手教你用 NebulaGraph AI 全家桶跑图算法》中，除了介绍了 ngai 这个小工具之外，还提到了一件事有了 Jupyter Notebook 插件: https://github.com/wey-gu/ipython-ngql，可以更便捷地操作 NebulaGraph。

本文就手把手教你咋在 Jupyter Notebook 中，愉快地玩图数据库。

只要你仔细读完本文，一条 %ngql MATCH p=(n:player)->() RETURN p 命令就可以直接查询出数据，再接上 %ng_draw 就可以画出返回结果。

下面，进入今天的主菜——Jupyter Notebook 扩展：ipython-ngql。

其实，ipython-ngql 这个扩展断断续续地开发了两年，我一直没有开发完成。恰好之前有空，并完成了一直以来的心愿，把 ipython-ngql 重构并正式发布了。它除了完全适配 NebulaGrpah 3.x 所有查询之外，还支持了 Notebook 内的返回结果可视化。

在介绍 ipython-ngql 是什么之前，我先做个简单的 Jupyter Notebook 介绍，虽然大多数的 Python 开发都知道。

什么是 Jupyter Notebook

Jupyter Notebook / Jupyter Labs 项目最初起源自 IPython 这个项目，后者是一个命令行上的交互式 Python 解释环境。因为有很好的补全、高亮和丰富的扩展能力，IPython 很快就成为了 Python 的第一 IDLE 替代项目，并且后来衍生出来了可以在浏览器里做更多事情的笔记本模式。

Jupyter 的笔记本模式改变了数据科学和相关科研、工业领域里人们协作、开发、分享面向数据的工作方式。有了它，我们可以在一个笔记本中可复现、可分享地进行代码执行、科学计算、数据可视化等等操作，是数据科学家、科研工作者的非常喜欢的工具，而且它还早就引入了 Python 之外的很多其他语言作为执行内核支持。

因为在 Jupyter Notebook 中进行 NebulaGraph 的查询、计算、可视化一直是很多社区同学的心愿，在前阵子 NebulaGrpah AI Suite 的开发过程中，我并实现了 Jupyter 中方便进行 NetworkX / PySpark 的计算。既然有图计算了，索性我就把相关的查询、可视化功能一起做掉，并作为 Jupyter 的扩展一起发布出来给大家使用啦。

ipython-ngql 的安装

因为 ipython-ngql 本文就是一个基于 Jupyter Notebook 的扩展，所以它的安装非常简单。只需要在 Jupyter Notebook 中执行 %pip install ipython-ngql ，再加载它就好：

%pip install ipython-ngql
%load_ext ngql

然后，我们就可以用 %ngql 这个 Jupyter Magic word 连接 NebulaGraph 了：

%ngql --address 127.0.0.1 --port 9669 --user root --password nebula #填入 ip 地址和 graphd 的端口号

当成功连接服务之后，SHOW SPACES 的结果会返回在 notebook cell 下。

除了上面的扩展安装方法之外，你可以从 Docker 桌面版的扩展市场里搜索 NebulaGraph，一键安装本地开发环境。安装完毕之后，进入 NebulaGraph Docker 扩展内部，点击 NebulaGraph AI ，点击 Install NX Mode 安装本地的 NebulaGraph + Jupyter Notebook 开发环境。

数据查询

ipython-ngql 现在支持两种语法 %ngql 接单行查询和 %%ngql 接多行查询。

单行查询

例如：

%ngql USE basketballplayer;
%ngql MATCH (v:player{name:"Tim Duncan"})-->(v2:player) RETURN v2.player.name AS Name;

多行查询

例如：

%%ngql
ADD HOSTS "storaged3":9779,"storaged4":9779;
SHOW HOSTS;

渲染结果

在任意一个查询后面紧跟着一个 %ng_draw 指令，就可以把结果可视化渲染出来。像是这样：

# one query
%ngql GET SUBGRAPH 2 STEPS FROM "player101" YIELD VERTICES AS nodes, EDGES AS relationships;
%ng_draw

# another query
%ngql match p=(:player)-[]->() return p LIMIT 5
%ng_draw

效果：

此外，你的渲染的结果还会被保存为单文件 html ，方便我们可以内嵌到任意网页中。

像是下面，其实就是一个内嵌的页面：

高阶用法

下面，我们来展示一些便捷的高阶用法。比如 %ngql help，可以获得更多帮助信息。

操作查询结果为 pandas DF

你的每次查询，返回的结果会被存到 _ 变量中，方便我们对它进行读取。像是这样：

返回原始 ResultSet

ipython-ngql 默认返回的结果格式是 pandas DF，如果我们想在 Jupyter Notebook 中交互地调试 Python 的 NebulaGraph 应用代码，可以将返回结果设置为原始的 ResultSet 格式，方便直观进行 query 与结果解析。例如：

In [1] : %config IPythonNGQL.ngql_result_style="raw"

In [2] : %%ngql USE pokemon_club;
    ...: GO FROM "Tom" OVER owns_pokemon YIELD owns_pokemon._dst as pokemon_id
    ...: | GO FROM $-.pokemon_id OVER owns_pokemon REVERSELY YIELD owns_pokemon._dst AS Trainer_Name;
    ...:
    ...:
Out[3]:
ResultSet(ExecutionResponse(
    error_code=0,
    latency_in_us=3270,
    data=DataSet(
        column_names=[b'Trainer_Name'],
        rows=[Row(
            values=[Value(
                sVal=b'Tom')]),
...
        Row(
            values=[Value(
                sVal=b'Wey')])]),
    space_name=b'pokemon_club'))

In [4]: r = _

In [5]: r.column_values(key='Trainer_Name')[0].cast()
Out[5]: 'Tom'

查询模板

除了上面那些功能，我还支持了模板功能，语法沿用了 Jinja2 的 {{ variable }}。详见这个例子：

未来

后续，我打算增强可视化的自定义选项，也欢迎社区里的大伙来贡献新的 feature、idea。

项目的 repo 在 👉🏻https://github.com/wey-gu/ipython-ngql

谢谢你读完本文 (///▽///)

如果你想尝鲜图数据库 NebulaGraph，记得去 GitHub 下载、使用、(^з^)-☆ star 它 -> GitHub；和其他的 NebulaGraph 用户一起交流图数据库技术和应用技能，留下「你的名片」一起玩耍呀~

微信关注我们

原文链接：https://my.oschina.net/u/4169309/blog/10093876

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

实时入库不用愁，HStore帮分忧

本文分享自华为云社区《直播回顾 | 实时入库不用愁，HStore帮分忧》，作者：汀丶。海量数据时代，如何实现数据实时入库与实时查询？GaussDB(DWS) HStore表为数据高效存储与查询提供了哪些助力？本期《数仓实时入库利器—HStore表原理与应用实践详解》的主题直播中，我们邀请到华为云EI DTSE技术布道师马俊松，针对GaussDB(DWS)HStore表与开发者和伙伴朋友们展开交流互动。通过4部分内容帮助开发者快速了解HStore表。 GaussDB(DWS)表存储类型演进传统的数据存储类型有行存储和列存储，GaussDB(DWS) 基于列存储格式设计和实现了全新的HStore表，同时提供高效的并发插入、更新入库，以及高性能实时查询。行存储：数据以行为单位存储在数据块中，适用于传统OLTP场景，数据需要进行频繁的增删改查，数据量不会很大。行存储的优点是：点查性能好，更新效率高。实时并发入库使用行存表，能获得较好的并发更新入库性能，但分析查询性能与空间压缩往往不及预期列存储：为了解决行存表的分析查询性能问题以及空间压缩问题，GaussDB(DWS)自研了列存储，适用...

2023-08-08

914

1 背景随着自动化测试左移实践深入，越来越多不同类型的需求开始用自动化测试左移来实践，在实践的过程中也有了新的提效诉求，比如技改类的服务拆分项目或者BC流量拆分的项目，在实践过程中，这类需求会期望不同染色环境在相同的配置条件下，拆分后的代码和基准release代码的接口响应response有全量对比结果才能更好达到需求验证点。 2 实践成果在这种需要对接口返回response做全量json对比的背景下，商家域新的自动化平台新增了json全量对比的组件。在多个技改项目，比如服务拆分和BC流量拆分项目中这种比较大，花费人日比较多的项目测试中，应用了json全量对比验证。在实践过程中，比如原来要先写自动化，把响应结果挨个验证，或者在不同染色请求跟拆分前代码分别执行再对比结果。在这种技改需求诉求下，全量json对比组件很好地满足了需要验证大量的服务拆分前接口和服务拆分后的接口返回json值全量对比。以商家服务拆分技改为例，技改跨几个迭代，需要回归大量的接口（目前该技改测试的接口已过千，还在跨迭代测试中）。测试过程利用全量json对比组件，不光测试一轮极大提高了测试效率，在二轮还可以用自动...

2023-08-08

445

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。