VB 数据质量诊断软件(分析数据的完整性,合理性,准确性)-139-(代码+程序说明)


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

前言:

为何口出狂言,作任何VB和ASP的系统, 这个就是很好的一个证明 :) 又有些狂了...

 数据库操作谁都会,接触的多了也没什么难的,VB编程难在哪?算法上,这个是一个算法题的毕业设计

哈哈忙活了足足有一○小时,  大多数毕业设计都是 数据库编程... 你这个是个算法很累脑子哈哈,不过也摆平了.

样子有些像外挂, 跟句您的设定检查每个字段的 数据类型,或是EXCEL的每个列 下面有截图 请查看 条件设置写在程序里了,当然若写程序动态的 ,这个就真正成为了一个数据质量分析的工具了,没去研究他, 因为不知道写出来是否 会有人去用他, 这里只是一个毕业设计 下面有源码的截图

本系统不单单是个毕业设计,而且是一个产品,当然您若有兴趣将他继续新增功能, 可以跟我联系,我可以按您的要求去修改,或是专门给您定做,  您获得代码后也可以自己改, 没有什么版权 :) 
既然放上来了, 就当他是毕业设计出售了 :) 

联系方式在网页的最下方  

  

要求

数据质量诊断软件设计要求

目标:该软件主要是为了帮助企业对其拥有的数据库中的数据质量做一个诊断。可以很直观地告诉诊断出数据质量状态。

软件功能设定:

1.  数据读取: 读取不同的数据库中的数据:

数据格式:DELIMITED(包括TABLE,COMMA,SPACE。。。)

         EXCEL/ACCESS,DBF,MS SQL/SYBASE/ORACLE/IBM DB2

操作系统:Windows为主,如果能够兼容别的操作系统更好Unix,LINUX

2.  数据转换:读取的数据会存在数据的字段名称不统一的问题。如zip code,不同的公司有不同命名方法,可以是ZIP,zip_code,yzbm,yb,postal_code。需要把这些字段匹配到软件中的标准字段中

3.  数据字段:软件只关注比较重要的字段的诊断。这些关键的字段包括:

a)    直邮相关联的字段:

Zip:- 邮政编码(6位数字以文本存储)

State::省份(至少2个中文)

City: 城市(至少2个中文)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

b)    电子邮件相关联字段:

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式)

c)    手机相关联的字段:

Mobile: 手机号码或者小灵通

d)    电话相关联的字段:

Area_code: 电话区号 (3位数字以文本形式存在)

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

e)    传真相关联的字段:

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

f)     其他字段:
反映其他重要意义的字段,比如:
性别,年龄,职业,收入,

行业,所有制,开业年限,员工人数,销售额,

4.  完整性诊断:软件主要要实现对以上字段的完整性检验,然后反馈回一个结果。

5.  完整性诊断规则:如何检验数据的完整性,规则如下

1. 如果字段的值为空,那结果是Missing,输出结果有个空和非空的比例

2. 如果字段的值为非空,那么检查完整性,结果可以是非空并且完整和非空不完整2个结果:

Zip:- 邮政编码(6位数字以文本形式存在)

State::省份(至少2个中文 – 可以有31个省的名称列表来判断,它们是:北京 上海 江苏 浙江 安徽 湖北

江西 黑龙江 吉林 辽宁 天津 内蒙古

河北 山东 山西 河南 广东 广西

海南 福建 湖南 新疆 西藏 青海

四川 重庆 云南 贵州 陕西 甘肃

宁夏)

City: 城市(至少2个中文 – 或者把中国的城市和省以及电话区号的对照表,这样可以做相关性检查)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式:

'/\w[-.\w]*\@[-\w]+(\.[-\w]+)*\.(com|edu|gov|int|mil|net|org|biz|info|name|museum|coop|aero|[a-z][a-z])/ '),如果正则表达式算法不容易实现,可以是:

必须有@, @的位置不能在前3个字节,前三个字节是字母或者下划线

Mobile: 手机号码或者小灵通(手机号码是11位,小灵通是7位或8位)

Area_code: 电话区号 (3位或4位数字以文本形式存在,但是有的公司的数据对电话的格式并没要求,并不一定是区号+电话号码+分机,这个在数据倒入需要考虑解决,或者在对这个字段的判定上需要有所改变,比如: 最少7位,最多17位(包括区号,电话和分机))

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

******************************

 报告生成日期:2006-5-28 22:12:34


数据表名称为: Sheet$
数据表总记录数为:6062
统计信息如下************************

******************************
字段名: [ZIPCODE]
邮件检查
合法邮件记录数为:0
占总数:0%

电话小灵通传真号检查
合法记录数为:6057
占总数:99.92%

区号检查
合法记录数为:0
占总数:0%

性别检查
合法记录数为:591
占总数:9.75%

空字符检查
合法记录数为:591
占总数:9.75%

字符长度检查
合法记录数为:0
占总数:0%

******************************

**************************..


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/447594.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++进阶之路---多态(一)

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 一、多态的概念 1.概念 多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为…

IPSec NAT穿越原理

一、IPSec VPN在NAT场景中存在的问题 当某些组网中,有的分支连动态的公网IP地址也没有,只能由网络中的NAT设备进行地址转换,才能访问互联网,然而IPsec是用来保护报文不被修改的,而NAT需要修改报文的IP地址&#xff0c…

9、组合模式(结构性模式)

组合模式又叫部分整体模式,它创建了对象组的树形结构,将对象组合成树状结构,以一致的方式处理叶子对象以及组合对象,不以层次高低定义类,都是结点类 一、传统组合模式 举例,大学、学院、系,它们…

崇法致行法律知识竞赛活动方案

赛程安排分两天,两场进行。 第一天(第一场)(初赛) 共 16 个二级分行,每行三人,共16 个战队参赛。 第一轮——必答轮 在大屏幕上显示10个选择题(5个单选、5个多选)&…

docker安装ollama

拉取镜像 docker pull ollama/ollama 运行容器 (挂载路径 D:\ollama 改成你自己喜欢的路径) CPU only docker run -d -v D:\ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama Nvidia GPU(没试过这个) doc…

Vue脚手架

Vue脚手架 学习目标: 理解Node.js基本使用方法理解包资源管理器NPM的使用理解webpack的作用理解 vue-cli 脚手架 (重点)Element-UI 组件库 1.vue的格式:new Vue({//作用的视图el:"id选择器",//vue中的数据/*data:{key:value,key:value,...}…

判断链表回文

题目&#xff1a; //方法一&#xff0c;空间复杂度O(n) class Solution { public:bool isPalindrome(ListNode* head) {vector<int> nums; //放进数组后用双指针判断ListNode* cur head;while(cur){nums.emplace_back(cur->val);cur cur->next;}for(int i0…

Microsoft SQL Server 编写汉字转拼音函数

目录 应用场景 举例 函数实现 小结 应用场景 在搜索应用中&#xff0c;我们一般会提供一个搜索框&#xff0c;输入关健字&#xff0c;点击查询按钮以获取结果数据。大部分情况我们会提供模糊查询的形式以在一个或多个字段进行搜索以获取结果。这样可以简化用户的操作&…

高分1、2号卫星原始遥感影像数据

高分一号 高分一号卫高分一号卫星是中国高分辨率对地观测系统的首发星&#xff0c;突破了高空间分辨率、多光谱与宽覆盖相结合的光学遥感等关键技术&#xff0c;设计寿命5至8年。 高分辨率对地观测系统工程是《国家中长期科学和技术发展规划纲要(2006&#xff5e;2020年)》确定…

专题二 - 滑动窗口 - leetcode 1004. 最大连续1的个数 III | 中等难度

leetcode 1004. 最大连续1的个数 III leetcode 1004. 最大连续1的个数 III | 中等难度1. 题目详情1. 原题链接2. 基础框架 2. 解题思路1. 题目分析2. 算法原理3. 时间复杂度 3. 代码实现4. 知识与收获 leetcode 1004. 最大连续1的个数 III | 中等难度 1. 题目详情 给定一个二…

Linux之线程控制

目录 一、POSIX线程库 二、线程的创建 三、线程等待 四、线程终止 五、分离线程 六、线程ID&#xff1a;pthread_t 1、获取线程ID 2、pthread_t 七、线程局部存储&#xff1a;__thread 一、POSIX线程库 由于Linux下的线程并没有独立特有的结构&#xff0c;所以Linux并…

蓝牙系列十一:HCI层的数据格式

HCI层作为Host和Controlor链接的接口存在。以下是对HCI层的数据格式的解析。 1、参考&#xff1a;蓝牙协议core_v5.0.pdf 《Vol 2: Core System Package [BR/EDR Controller volume]》的“Part E: Host Controller Interface Functional Specification” 2. 协议栈框图 对于被…

Linux:kubernetes(k8s)pod的基础操作(6)

Linux&#xff1a;kubernetes&#xff08;k8s&#xff09;允许在任意节点使用kubectl命令&#xff08;5&#xff09;-CSDN博客https://blog.csdn.net/w14768855/article/details/136460090?spm1001.2014.3001.5501 我在前两张进行了基础环境的一系列搭建&#xff0c;现在就正…

NIFI从Oracle11G同步数据到Mysql_亲测可用_解决数据重复_数据跟源表不一致的问题---大数据之Nifi工作笔记0065

首先来看一下整体的流程: 可以看到了用到了上面的这些处理器,然后我们主要看看,这里之前 同步的时候,总是出现重复的数据,奇怪. 比如源表中只有166条数据,但是同步过去以后变成了11万条数据了. ${db.table.name:equals(table1):or(${db.table.name:equals(table2)})} 可以看…

职场成功的关键:积极主动,勇于担当

在职场中&#xff0c;每个人都渴望成功。然而&#xff0c;成功并非一蹴而就&#xff0c;而是需要我们在日常工作中不断积累、锻炼和提升。本文将为您揭示职场成功的关键因素&#xff0c;帮助您在职场道路上越走越远。 一、积极主动&#xff0c;主动承担责任 在职场中&#xff0…

吴恩达机器学习笔记十六 如何debug一个学习算法 模型评估 模型选择和训练 交叉验证测试集

如果算法预测出的结果不太好&#xff0c;可以考虑以下几个方面&#xff1a; 获得更多的训练样本 采用更少的特征 尝试获取更多的特征 增加多项式特征 增大或减小 λ 模型评估(evaluate model) 例如房价预测&#xff0c;用五个数据训练出的模型能很好的拟合这几个数据&am…

RocketMQ入门指南:从零开始学习分布式消息队列技术

RocketMQ 1. MQ介绍1.1 为什么要用MQ1.2 MQ的优点和缺点1.3 各种MQ产品的比较 2. RocketMQ快速入门2.1 准备工作2.1.1 下载RocketMQ2.2.2 环境要求 2.2 安装RocketMQ2.2.1 安装步骤2.2.2 目录介绍 2.3 启动RocketMQ2.4 测试RocketMQ2.4.1 发送消息2.4.2 接收消息 2.5 关闭Rocke…

【Python】科研代码学习:七 TrainingArguments,Trainer

【Python】科研代码学习&#xff1a;七 TrainingArguments&#xff0c;Trainer TrainingArguments重要的方法 Trainer重要的方法使用 Trainer 的简单例子 TrainingArguments HF官网API&#xff1a;Training 众所周知&#xff0c;推理是一个大头&#xff0c;训练是另一个大头 之…

【PyTorch实战演练】深入剖析MTCNN(多任务级联卷积神经网络)并使用30行代码实现人脸识别

文章目录 0. 前言1. 级联神经网络介绍2. MTCNN介绍2.1 MTCNN提出背景2.2 MTCNN结构 3. MTCNN PyTorch实战3.1 facenet_pytorch库中的MTCNN3.2 识别图像数据3.3 人脸识别3.4 关键点定位 0. 前言 按照国际惯例&#xff0c;首先声明&#xff1a;本文只是我自己学习的理解&#xff…

【Qt学习笔记】(二)--第一个程序“Hello World”(学习Qt中程序的运行、发布、编译过程)

声明&#xff1a;本人水平有限&#xff0c;博客可能存在部分错误的地方&#xff0c;请广大读者谅解并向本人反馈错误。    因为我个人对Qt也是有一些需求&#xff0c;所以开设本专栏进行学习&#xff0c;希望大家可以一起学习&#xff0c;共同进步。   这篇博客将从一个 He…