使用 Python 和 Py2Neo 构建 Neo4j 管理脚本

Neo4j 是一个强大的图数据库,适合处理复杂的关系型数据。借助 Python 的 py2neo 库,我们可以快速实现对 Neo4j 数据库的管理和操作。本文介绍一个功能丰富的 Python 脚本,帮助用户轻松管理 Neo4j 数据库,包含启动/停止服务、清空数据、统计分析、图谱可视化等功能。


1. 脚本功能一览

用户通过数字选择对应的功能:

  1. 启动 Neo4j:通过命令行启动 Neo4j 服务。
  2. 停止 Neo4j:停止运行中的 Neo4j 服务。
  3. 清空 Neo4j:删除数据库中所有数据。
  4. 图谱可视化:展示知识图谱的结构,并生成图片。
  5. 统计分析:统计节点和关系的数量。
  6. 导出图谱:将图谱导出为 JSON 文件,支持选择保存路径。
  7. 数据健康检查:检查图谱中的孤立节点和重复节点。
  8. 退出程序

2. 脚本核心实现

2.1 脚本入口

以下是功能菜单的实现,每个功能都有对应的函数,用户输入数字即可调用:

def main():
    while True:
        print("\n请选择一个功能:")
        print("1. 启动 Neo4j")
        print("2. 停止 Neo4j")
        print("3. 清空 Neo4j")
        print("4. 图谱可视化")
        print("5. 统计分析")
        print("6. 导出图谱")
        print("7. 数据健康检查")
        print("8. 退出")

        choice = input("输入功能编号:")
        if choice == "1":
            start_neo4j()
        elif choice == "2":
            stop_neo4j()
        elif choice == "3":
            clear_database()
        elif choice == "4":
            visualize_graph()
        elif choice == "5":
            statistical_analysis()
        elif choice == "6":
            export_graph()
        elif choice == "7":
            health_check()
        elif choice == "8":
            print("退出程序。")
            break
        else:
            print("无效输入,请重试!")
2.2 功能实现
启动/停止 Neo4j 服务

借助系统命令行操作,我们可以在另一个终端中启动或停止 Neo4j:

def start_neo4j():
    """启动 Neo4j 服务"""
    os.system("neo4j console &")
    print("Neo4j 服务已启动...")

def stop_neo4j():
    """停止 Neo4j 服务"""
    os.system("neo4j stop")
    print("Neo4j 服务已停止...")
清空 Neo4j 数据

利用 Cypher 查询可以快速清空图数据库中的所有节点和关系:

def clear_database():
    """清空当前知识图谱中的所有数据"""
    graph.run("MATCH (n) DETACH DELETE n")
    print("图谱已清空!")
图谱可视化

使用 py2neo 查询数据,结合 networkxmatplotlib,我们可以绘制出知识图谱的可视化图像:

def visualize_graph():
    """图谱可视化:生成图片展示"""
    query = "MATCH (n)-[r]->(m) RETURN n.name AS node1, type(r) AS relationship, m.name AS node2 LIMIT 50"
    results = graph.run(query).data()

    if not results:
        print("图谱中没有可视化的数据。")
        return

    G = nx.DiGraph()  # 使用有向图
    for record in results:
        node1 = record["node1"] or "Unnamed Node"
        node2 = record["node2"] or "Unnamed Node"
        relationship = record["relationship"] or "RELATED_TO"
        G.add_edge(node1, node2, relationship=relationship)

    plt.figure(figsize=(12, 8))
    pos = nx.spring_layout(G)  # 布局
    nx.draw(G, pos, with_labels=True, node_color="skyblue", node_size=2000, font_size=12, font_weight="bold", arrowsize=15)
    edge_labels = nx.get_edge_attributes(G, "relationship")
    nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_size=10)

    plt.title("Neo4j Graph Visualization")
    plt.show()
数据统计分析

通过 Cypher 查询统计图谱中的节点和关系数量:

def statistical_analysis():
    """统计分析:节点和关系数量"""
    node_count = graph.run("MATCH (n) RETURN COUNT(n) AS count").data()[0]["count"]
    relationship_count = graph.run("MATCH ()-[r]->() RETURN COUNT(r) AS count").data()[0]["count"]
    print(f"节点数量:{node_count}")
    print(f"关系数量:{relationship_count}")
导出图谱为 JSON 文件

允许用户选择保存路径,将查询结果保存为 JSON 格式:

def export_graph():
    """导出图谱为 JSON 文件"""
    query = "MATCH (n)-[r]->(m) RETURN n, r, m"
    results = graph.run(query).data()
    data = [{"node1": dict(record["n"]), "relationship": dict(record["r"]), "node2": dict(record["m"])} for record in results]

    root = Tk()
    root.withdraw()  # 隐藏主窗口
    save_path = filedialog.asksaveasfilename(defaultextension=".json", filetypes=[("JSON files", "*.json")])

    if save_path:
        with open(save_path, "w", encoding="utf-8") as f:
            json.dump(data, f, indent=4)
        print(f"图谱已导出至:{save_path}")
数据健康检查

检查图谱中的孤立节点(没有关系)和重复节点:

def health_check():
    """数据健康检查"""
    orphan_nodes = graph.run("MATCH (n) WHERE NOT (n)--() RETURN COUNT(n) AS count").data()[0]["count"]
    duplicate_nodes = graph.run("MATCH (n) WITH n.name AS name, COUNT(*) AS count WHERE count > 1 RETURN COUNT(name) AS count").data()[0]["count"]
    print(f"孤立节点数量:{orphan_nodes}")
    print(f"重复节点数量:{duplicate_nodes}")

3. 图谱可视化示例

执行“图谱可视化”功能后,脚本会绘制图谱的结构图


4. 使用前的准备

  1. 环境依赖安装
    确保已安装以下库:

    pip install py2neo networkx matplotlib
    
  2. Neo4j 连接配置
    修改脚本中连接数据库的代码:

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "password"))
    
  3. 运行脚本
    运行脚本文件:

    python neo4j_manager.py
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/917517.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【STM32】基于SPI协议读写SD,详解!

文章目录 0 前言1 SD卡的种类和简介1.1 SD卡的种类1.2 SD卡的整体结构1.3 SD卡运行机制——指令和响应2 SD卡的通信总线2.1 SDIO2.2 SPI3 硬件连接4 代码实践【重点】4.1 HAL库移植4.2 标准库移植4.3 遇到的问题和解决方案5 扩展阅读0 前言 因为项目需要,使用stm32读写sd卡,这…

ZooKeeper单机、集群模式搭建教程

单点配置 ZooKeeper在启动的时候,默认会读取/conf/zoo.cfg配置文件,该文件缺失会报错。因此,我们需要在将容器/conf/挂载出来,在制定的目录下,添加zoo.cfg文件。 zoo.cfg logback.xml 配置文件的信息可以从二进制包…

如何在Mysql中生成0-23完整的小时数据

目录 1. 创建表2. 插入0-23小时的数据3. 查询并合并数据 在数据分析中,我们经常需要对特定时间段内的数据进行统计和分析。 例如,在名片进线的场景中,我们可能需要了解一天内每小时的名片进线数量。 然而,由于某些时间点可能没有数…

厦门凯酷全科技有限公司正规吗?

在这个短视频风起云涌的时代,抖音作为电商领域的黑马,正以惊人的速度改变着消费者的购物习惯与品牌的市场策略。在这场变革中,厦门凯酷全科技有限公司凭借其专业的抖音电商服务,在众多服务商中脱颖而出,成为众多品牌信…

SpringBoot配置类

在Spring Boot中,配置类是一种特殊的类,用于定义和配置Spring应用程序的各种组件、服务和属性。这些配置类通常使用Java注解来声明,并且可以通过Spring的依赖注入机制来管理和使用。 Spring 容器初始化时会加载被Component、Service、Reposi…

ADS项目笔记 1. 低噪声放大器LNA天线一体化设计

在传统射频结构的设计中,天线模块和有源电路部分相互分离,两者之间通过 50 Ω 传输线级联,这种设计需要在有源电路和天线之间建立无源网络,包括天线模块的输入匹配网络以及有源电路的匹配网络。这些无源网络不仅增加了系统的插入损…

Vue2+ElementUI:用计算属性实现搜索框功能

前言: 本文代码使用vue2element UI。 输入框搜索的功能,可以在前端通过计算属性过滤实现,也可以调用后端写好的接口。本文介绍的是通过计算属性对表格数据实时过滤,后附完整代码,代码中提供的是死数据,可…

【目标检测】用YOLOv8-Segment训练语义分割数据集(保姆级教学)

前言 这篇教程会手把手带你用 YOLOv8-Segment 搭建一个属于自己的分割任务项目。从环境配置到数据集准备,再到模型训练和测试,所有步骤都有详细说明,适合初学者使用。你将学会如何安装必要的软件,标注自己的数据,并使…

Elasticsearch:管理和排除 Elasticsearch 内存故障

作者:来自 Elastic Stef Nestor 随着 Elastic Cloud 提供可观察性、安全性和搜索等解决方案,我们将使用 Elastic Cloud 的用户范围从完整的运营团队扩大到包括数据工程师、安全团队和顾问。作为 Elastic 支持代表,我很乐意与各种各样的用户和…

前深度学习时代-经典的推荐算法

参考自《深度学习推荐系统》—— 王喆,用于学习记录。 1.协同过滤 “协同过滤”就是协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出目标用户可能感兴趣的信息的推荐过程。 基于用户相似度进行推荐的协同过滤算法 UserCF 用户相似度…

两行命令搭建深度学习环境(Docker/torch2.5.1+cu118/命令行美化+插件),含完整的 Docker 安装步骤

深度学习环境的配置过于繁琐,所以我制作了两个基础的镜像,希望可以帮助大家节省时间,你可以选择其中一种进行安装,版本说明: base 版本基于 pytorch/pytorch:2.5.1-cuda11.8-cudnn9-devel,默认 python 版本…

WebRTC视频 04 - 视频采集类 VideoCaptureDS 中篇

WebRTC视频 01 - 视频采集整体架构 WebRTC视频 02 - 视频采集类 VideoCaptureModule WebRTC视频 03 - 视频采集类 VideoCaptureDS 上篇 WebRTC视频 04 - 视频采集类 VideoCaptureDS 中篇(本文) WebRTC视频 05 - 视频采集类 VideoCaptureDS 下篇 一、前言…

AI在电商平台中的创新应用:提升销售效率与用户体验的数字化转型

1. 引言 AI技术在电商平台的应用已不仅仅停留在基础的数据分析和自动化推荐上。随着人工智能的迅速发展,越来越多的电商平台开始将AI技术深度融合到用户体验、定价策略、供应链优化、客户服务等核心业务中,从而显著提升运营效率和用户满意度。在这篇文章…

Blossom:开源私有部署的markdown笔记软件

在信息化、数字化时代,我们每个人的生活和工作都离不开笔记和知识管理。从简单的待办事项,到复杂的项目计划,再到存储大量个人知识的工具,如何选择一个高效、便捷且符合个人需求的笔记软件,成了许多人的难题。最近在逛…

Linux debian系统安装ClamTk开源图形用户界面(GUI)杀毒软件

一、ClamTk简介 ClamTk 是一个基于 ClamAV 的开源图形用户界面(GUI)杀毒软件。它使用 GTK2-Perl 脚本构建而成,支持32位与64位操作系统。ClamTk 提供了一个直观的用户界面,使得用户无需深入了解命令行即可完成大部分操作。它具备…

Linux 进程信号的产生

目录 0.前言 1. 通过终端按键产生信号 1.1 CtrlC:发送 SIGINT 信号 1.2 Ctrl\:发送 SIGQUIT 信号 1.3 CtrlZ:发送 SIGTSTP 信号 2.调用系统命令向进程发信号 3.使用函数产生信号 3.1 kill 函数 3.2 raise 函数 3.3 abort 函数 4.由软件条件产…

【大数据学习 | HBASE高级】hive操作hbase

一般在查询hbase的数据的时候我们可以直接使用hbase的命令行或者是api进行查询就行了,但是在日常的计算过程中我们一般都不是为了查询,都是在查询的基础上进行二次计算,所以使用hbase的命令是没有办法进行数据计算的,并且对于hbas…

微信小程序 https://thirdwx.qlogo.cn 不在以下 downloadFile 合法域名列表中

授权登录后,拿到用户头像进行加载,但报错提示: https://thirdwx.qlogo.cn 不在以下 downloadFile 合法域名列表中 解决方法一(未完全解决,临时处理):在微信开发者工具将不校验...勾上就可以访问…

rk3399开发环境使用Android 10初体验蓝牙功能

版本 日期 作者 变更表述 1.0 2024/11/10 于忠军 文档创建 零. 前言 由于Bluedroid的介绍文档有限,以及对Android的一些基本的知识需要了(Android 四大组件/AIDL/Framework/Binder机制/JNI/HIDL等),加上需要掌握的语言包括Java/C/C等&#xff0…

1. Django中的URL调度器 (项目创建与简单测试)

1. 创建 Django 项目 运行以下命令创建一个名为 blog_project 的 Django 项目: django-admin startproject blog_project2. 创建博客应用 Django 中,项目可以包含多个应用。创建一个名为 blog 的应用: cd blog_project python manage.py …