数据挖掘智能Agent

🤗 CodeGenie - 智能编程助手

数据处理和分析对于数据分析工作人员来说,往往既复杂又令人头疼,需要耗费大量精力进行重复性工作。为了解决这一问题,我们开发了一款集成了自然语言处理和代码生成功能的智能编程助手——CodeGenie。通过对话形式,CodeGenie能够智能地分析数据和管理文件。无论您是经验丰富的开发人员还是编程新手,CodeGenie都能成为您的得力助手。

项目简介

CodeGenie 是一款旨在通过对话形式简化编程工作的工具。它不仅可以帮助用户生成并执行Python代码,还能进行文件管理、数据分析,并提供实时反馈。这款助手特别适合需要频繁处理数据的场景,如数据分析、金融建模和机器学习等。需要强调的是,CodeGenie 基于 SmolAgents 代理框架,其核心功能是通过编写代码来执行数据分析任务,而不是简单地使用代理来编写代码。这意味着 CodeGenie 能够自主编写和执行代码以完成复杂的分析工作,而不是仅仅作为一个辅助工具。

功能特性

核心能力

  • 自然语言编程:通过对话形式完成代码生成与执行
  • 文件管理系统
    • csv/xlsx/txt文件上传至代默认目录(默认操作目录为tmp
    • 实时文件列表展示与下载
  • 变量管理
    • 实时显示编程助手环境生成的变量
    • 交互式变量追踪面板
  • 智能工具集成
    • 内置Tavily搜索引擎(知识增强)
    • 您可以将 Gradio Spaces 作为工具共享和加载到 Hub 或从 Hub 加载,更多功能即将推出!

技术亮点

  • 基于大语言模型
  • 模块化工具架构设计
  • 交互式错误处理机制

使用指南📖

1.上传文件

  • 通过侧边栏上传数据文件到tmp目录
  • 支持格式:csv/txt/xlsx

2.提出问题

1. 请计算1+9=?
2. 请对SouthGermanCredit.csv文件的数据内容进行特征统计分析。

3.查看结果

  • 实时代码执行反馈
  • 生成文件自动保存至tmp
  • 变量状态实时更新

演示

  • 打开网址:http://localhost:8501/#codegenie
  • 应用界面
    在这里插入图片描述

在这里插入图片描述

  • 魔塔演示地址
  • github源码地址

运行要求

环境变量

# 在.env文件中配置

# Tavily搜索服务(可选)。
TAVILY_KEY=xxx

# 设置模型信息
MODEL_ID=xxx # 模型的名称id
API_KEY =xxx  # 模型的Key
BASE_URL=xxx # 模型的访问地址

致谢

  • 智能体框架 smolagents

  • 交互式应用框架 Streamlit

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/969536.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

人工智能之自然语言处理技术演进

自然语言处理技术演进 自然语言处理(Natural Language Processing,NLP)是人工智能的重要分支,旨在使计算机能够理解、生成和处理人类语言。近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在…

保姆级GitHub大文件(100mb-2gb)上传教程

GLF(Git Large File Storage)安装使用 使用GitHub desktop上传大于100mb的文件时报错 The following files are over 100MB. lf you commit these files, you will no longer beable to push this repository to GitHub.com.term.rarWe recommend you a…

Spring Boot(7)Spring Boot 注解全解析:深入理解与应用

搞个引言 在现代 Java 开发中,Spring Boot 凭借其便捷性和高效性成为了众多开发者的首选框架。而注解作为 Spring Boot 的核心特性之一,极大地简化了开发过程,提高了代码的可读性和可维护性。本文将深入探讨 Spring Boot 中几种重要的注解&a…

【在idea中配置两个不同端口,同时运行两个相同的主程序springboot】

step1: step2: step3:指定端口号,点击apply 经过以上步骤后,idea下面就会出现service选项 启动两个springboot就完成了(我的启动失败是因为redis没有启动,springboot没有连接到redis报错&a…

基于Flask的全国婚姻关系数据可视化分析系统的设计与实现

【FLask】基于Flask的全国婚姻关系数据可视化分析系统的设计与实现(完整系统源码开发笔记详细部署教程)✅ 目录 一、项目简介二、项目界面展示三、项目视频展示 一、项目简介 该系统采用Python作为后端开发语言,结合Flask后端框架和Bootstra…

基于Kotlin中Flow扩展重试方法

最近项目中统一采用Kotlin的Flow来重构了网络请求相关代码。 目前的场景是,接口在请求的时候需要一个accessToken值,因为此值会过期或者不存在,需要刷新,因此最终方案是在使用Flow请求的时候先获取accessToken值然后再进行接口请求…

达梦 跟踪日志诊断

目录标题 参考连接**性能诊断:跟踪日志诊断****总结** 参考连接 性能诊断 -> 跟踪日志诊断 性能诊断:跟踪日志诊断 备份现有的日志配置文件 在修改文件之前,建议先备份原始文件,以防万一需要恢复。 cp /opt/dmdbms/dmdata/DA…

RFID智能仓储管理系统:助力仓储数字化升级

​在现代物流与仓储管理中,RFID智能仓储管理系统凭借其高效、精准的特点,已成为企业提升仓库运作效率的重要工具。结合RFID仓库管理、RFID库存管理及智能仓储管理系统等技术,RFID智能仓储解决方案能够实现仓储全流程的自动化与智能化&#xf…

AI 编程私有化部署,在使用 cline 时,可能无法避免私隐的泄漏问题

摘录:Cline Privacy Policy https://github.com/cline/cline/blob/main/docs/PRIVACY.md Key Points Cline operates entirely client-side as a VS Code extensionNo code or data is collected, stored, or transmitted to Clines servers 问题是&#xff1a…

【进阶】MySQL高级篇超详讲解!!!

Mysql服务器内部架构(了解) 连接层 负责客户端的链接,验证账号密码等授权认证 服务层 对sql进行解析,优化,调用函数,如果是查询操作,有没有缓存等操作。 引擎层 是真正负责数据存储和提取…

【学术投稿-第四届智能电网和绿色能源国际学术会议(ICSGGE 2025)】CSS基本选择器详解:掌握基础,轻松布局网页

可线上 官网:www.icsgge.org 时间:2025年2月28-3月2日 目录 前言 一、基本选择器简介 1. 元素选择器(Type Selector) 基本语法 示例 注意事项 2. 类选择器(Class Selector) 基本语法 示例 注意…

编程题-字母异位词分组(中等-重点)

题目: 给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 解法一(for循环遍历-时间复杂度超限): 由于互为字母异位词的…

Spring Boot整合DeepSeek实现AI对话(API调用和本地部署)

本篇文章会分基于DeepSeek开放平台上的API,以及本地私有化部署DeepSeek R1模型两种方式来整合使用。 本地化私有部署可以参考这篇博文 全面认识了解DeepSeek利用ollama在本地部署、使用和体验deepseek-r1大模型 Spring版本选择 根据Spring官网的描述 Spring AI是一…

阿里云IOT消息处理

文章主要讲述了阿里云IOT平台如何处理设备上报的消息、如何将消息路由到不同的处理逻辑、如何进行消息转发与转换等操作。 一、接收IOT消息 1.创建订阅 2.案列代码 官网案例代码:如何将AMQP JMS客户端接入物联网平台接收消息_物联网平台(IoT)-阿里云帮助中心 代码…

YOLO11网络结构以及改进1

YOLO11 1.YOLO11网络结构图在哪里?2.对应的网络结构图3.每一个模块详解3.1 Conv模块3.2关于卷积模块3.3 关于给各个模块指定参数的细节 4.加入CBAM 1.YOLO11网络结构图在哪里? 2.对应的网络结构图 3.每一个模块详解 3.1 Conv模块 位置:ultr…

数据结构——队列、哈希存储(2025.2.11)

目录 一、队列 1.定义 2.应用 3.分类 (1)逻辑结构 (2)物理结构 顺序队列 链式队列 二、哈希存储 1.定义 2.哈希冲突 (1)开放定址法 (2)再哈希法 (3&#xf…

鸿蒙Next开发-添加水印以及点击穿透设置

在鸿蒙Next中,为App全局添加水印可以通过以下方式实现,其中通过窗口添加水印是一种常见且高效的方式。以下是具体方案和实现细节: 一、全局水印的实现方式 1. 窗口叠加水印(首选、推荐) 原理:在应用的主窗口…

C++算法竞赛基础语法-9

快速排序是一种高效的排序算法,由C. A. R. Hoare在1960年提出,基本思想是分治法(Divide and Conquer)策略,通过递归将一个大问题分解为若干个较小的子问题,然后合并这些子问题的解来解决原始问题 快速排序…

DeepSeek v3 技术报告阅读笔记

注 本文参考 DeepSeek-v3 / v2 / v1 Technical Report 及相关参考模型论文本文不包括基础的知识点讲解,为笔记/大纲性质而非教程,建议阅读技术报告原文交流可发送至邮箱 henryhua0721foxmail.com 架构核心 核心: MLA 高效推理DeepSeekMOE 更…

jemalloc 5.3.0的base模块的源码及调用链使用场景的详细分析

一、背景 这篇博客,我们继续之前的 由jemalloc 5.3.0初始化时的内存分配的分析引入jemalloc的三个关键概念及可借鉴的高性能编码技巧-CSDN博客 博客里对初始化分配逻辑进行分析,已经涉及到了jemalloc 5.3.0里的非常重要的base模块的一部分逻辑&#xff…