大话数据结构-查找-有序表查找

注:本文同步发布于稀土掘金。

3 有序表查找

3.1 折半查找

  折半查找(Binary Search)技术,又称为二分查找,它的前提是线性表中的记录必须是关键码有序(通常从小到大有序),线性表必须采用顺序存储。

  折半查找的基本思想是:在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键字相等,则查找成功;若给定值小于中间记录的关键字,则在中间记录的左半区继续查找;若给定值大于中间记录的关键字,则在中间记录的右半区继续查找。不断重复上述过程,直到查找成功,或所有查找区域无记录,查找失败为止。

  代码有多种实现方式,以下是示例:

/**
 * Binary Search
 *
 * @author Korbin
 * @date 2023-04-19 17:57:03
 **/
public class BinarySearch<T extends Comparable<T>> {

    /**
     * binary search
     * <p>
     * return index in data if searched, else return -1
     *
     * @param data array to search
     * @param key  key to search
     * @return index of key in data
     * @author Korbin
     * @date 2023-04-19 18:30:33
     **/
    public int binarySearch(T[] data, T key) {
        int length = data.length;

        int from = 0;
        int to = length - 1;

        // if key little than data[0] or key greater than data[length - 1], return -1, means search failed
        if (data[from].compareTo(key) > 0 || data[to].compareTo(key) < 0) {
            return -1;
        }

        int mid = ((to - from) + 1) / 2;

        while (from < to) {

            // if data[mid] equals key, then return mid
            if (data[mid].equals(key)) {
                return mid;
            }
            if (data[mid].compareTo(key) < 0) {
                // if key greater than data[mid], then search from [mid + 1, to]
                from = Math.min(mid + 1, length - 1);
            } else if (data[mid].compareTo(key) > 0) {
                // if key little than data[mid], then search from [from, mid - 1]
                to = Math.max(mid - 1, 0);
            }

            if (from == to) {
                // if from equals to, then check if data[from] equals key
                return (data[from].equals(key)) ? from : -1;
            }
            
            mid = from + ((to - from) + 1) / 2;

        }
        return -1;
    }

}

3.2 插值查找

  插值查找(Interpolation Search)是根据要查找的关键字key与查找表中最大最小记录的关键字比较后的查找方法,其核心在于插值公式 k e y − a [ f r o m ] a [ t o ] − a [ f l o w ] \frac {key-a[from]}{a[to]-a[flow]} a[to]a[flow]keya[from]

  从时间复杂度来看,它也是O(logn),但对于表长较大,而关键字又分布比较均匀的查找表来说,插值查找的平均性能要比折半查找算法的性能要好很多。反之,如果数组分布不均匀,用插值查找未必有优势。

  插值查找是在折半查找的基础上进行优化的,在折半查找中,计算mid的算法为:

   m i d = f r o m + 1 2 ( ( t o − f r o m ) + 1 ) mid = from + \frac {1}{2}((to - from) + 1) mid=from+21((tofrom)+1)

  在插值查找算法中,则是:

   m i d = f r o m + k e y − a [ f r o m ] a [ t o ] − a [ f l o w ] ( ( t o − f r o m ) + 1 ) mid = from + \frac {key-a[from]}{a[to]-a[flow]}((to - from) + 1) mid=from+a[to]a[flow]keya[from]((tofrom)+1)

  因此代码只作少量改动:

/**
 * interpolation search
 * <p>
 * return index in data if searched, else return -1
 *
 * @param data array to search
 * @param key  key to search
 * @return index of key in data
 * @author Korbin
 * @date 2023-04-19 18:30:33
 **/
public int interpolationSearch(int[] data, int key) {

    int length = data.length;

    int from = 0;
    int to = length - 1;

    // if key little than data[0] or key greater than data[length - 1], return -1, means search failed
    if (data[from] > key || data[to] < key) {
        return -1;
    }

    int mid = ((key - data[from]) / (data[to] - data[from])) / 2 * ((to - from) + 1);

    while (from < to) {

        // if data[mid] equals key, then return mid
        if (data[mid] == key) {
            return mid;
        }
        if (data[mid] < key) {
            // if key greater than data[mid], then search from [mid + 1, to]
            from = Math.min(mid + 1, length - 1);
        } else if (data[mid] > key) {
            // if key little than data[mid], then search from [from, mid - 1]
            to = Math.max(mid - 1, 0);
        }

        if (from == to) {
            // if from equals to, then check if data[from] equals key
            return (data[from] == key) ? from : -1;
        }

        mid = from + ((key - data[from]) / (data[to] - data[from])) / 2 * ((to - from) + 1);

    }
    return -1;
}

  调整一下mid的计算方式即可。

3.3 斐波那契查找

  以下是一个斐波那契数组:

  斐波那契数组的特性是,后一个元素的值等于前两个元素值的和,即F[K]=F[K-1]+F[K-2]。此外,F[K]/F[K+1]无限接近于0.618。斐波那契查找法依据这一特性,将数据分割成两部分,并把F[K-1]-1作为mid值进行对比处理。

  例如,假设数组长度是8,8在斐波那契数组中的下标是6,那么把数组分为两段,长度分别是F[K-1]=F[5]=5,F[K-2]=F[4]=3,令mid=F[K-1]-1=5-1=4,比较要查找的数值与被查找的数组A中,下标为4的元素的大小。

  在持续查找的过程中,被查找的数组A因为是有序数组,所以如果mid所对应的元素值大于要查找的数值时,进行下一轮查找时,则应到被查找数组的下半段去查找,下半段数组长度是多少呢?上文提到,裴波那契数组的特性F[K]=F[K-1]+F[K-2],而斐波那契查找就是将数组分成两段,前半段长度是F[K-2],后半段长度是F[K-1],因此当我们在后半段查找时,后半段的数组长度是F[K-1],即新的K=K-1,接下来的mid计算方式仍然不变。

  而这种情况下,下标为mid以及其后的元素,在下一轮查找时显然不可以再用于查找,因此它们肯定会大于要查找的这个值,因此我们设置一个变量high,令其初始值为数组的长度,在A[mid]大于要查找的数值时,令high=mid-1,表示最多可以被查找的元素下标是high,对应的元素值是A[high]。

  而如果mid所对应的元素值小于要查找的数值时,需要进行下一轮查找时,因为前半段长度为F[K-2],因此新的K=K-2,而mid的计算方式不再是mid=F[K-1]-1,而是“上一轮的mid”+1+F[K-1]-1,我们设置一个变更low,令其等于“上一轮的mid”+1,那么,mid的计算方式就变成了mid=low+F[K-1]-1,由于第一轮查找时没有“上一轮的mid”,所以如果按照这个公式,第一轮的low则为1,这样可以保证mid的计算公式一直是mid=low+F[K-1]-1。

  根据以上分析,可知:

  (1) 变量mid,表示使用数组中下标为mid的元素与要查找的数值进行比较;

  (2) 变量k,表示被查找的数组长度在斐波那契数组中的位置;

  (3) 变量low,表示从数组的下标为low的元素开始查找,初始值为1,当A[mid]<被查找的元素时,low=mid+1,同时置k=k-2;

  (4) 变量high,表示最多查到数组的下标为high的元素,初始值为数组的最大下标,当A[mid]>被查找的元素时,high=mid-1,同时置k=k-1;

  现在我们来开始尝试,假设有以下数组:

  我们需要从中找到数值59所在的位置。

  首先,初始化,low=1,high=数组的最大下标=10,同时定义一个斐波那契数组:

  然后第一次查找,我们来找k,已知数组长度为11,在斐波那契数组f中并未找到10这个元素,有两个选择:

  如果选择8,即k=6,f[k]=f[6]=8,假设我们要查找的是99,会出现什么情况呢:

  (1) 第一轮,mid=low+f[k-1]-1=1+f[5]-1=1+5-1=5,由于a[mid]<要查找的数值,因此新的k=k-2=3,新的low=mid+1=5+1=6;

  (2) 第二轮,mid=low+f[k-1]-1=6+f[2]-1=6+1-1=6,由于a[mid]<要查找的数值,因此,新的k=k-2=0,新的low=mid+1=6+1=7;

  (3) 第三轮,mid=low+f[k-1]-1=7+f[0-1]-1,无法再继续,而此时仍有a[7]~a[10];

  如果选择13,即k=7,f[k]=f[7]=13,假设我们要查找的是99,会出现什么情况呢:

  (1) 第一轮,mid=low+f[k-1]-1=1+f[6]-1=1+8-1=8,a[8]<99,因此新的k=k-2=4,新的low=mid+1=8+1=9;

  (2) 第二轮,mid=low+f[k-1]-1=9+f[3]-1=9+3-1=11,这时会发现,11已经超过了a的最大下标10,查找直接失败;

  (3) 此时我们进行一些调整,将数组a的长度扩大到f[k]即13位,并补齐后两位的值为f[10],即f[11]=f[12]=f[10]=99,这时再来查询,就可以得到a[11]=99,找到99在数组a的下标为11的位置,而由于原始的a最大下标为10,因此直接返回10即可。

  由此找到规则:当数组长度在斐波那契数组中找不到对应元素时,取与数组长度相邻,但大于数组长度的那个元素的下标作为k,同时将被查找的数组长度扩大到k,并补齐后续元素值使其等于被查找的数组的最后一个元素值。

  因此我们取k=7,此时数组a和f的结构如下所示:

  开始第一轮查找,此时mid=low+f[k-1]-1=1+f[6]-1=1+8-1=8,a[8]=73>59,因此high=mid-1=8-1=7,k=k-1=7-6=6:

  第二轮查找,mid=low+f[k-1]-1=1+f[5]-1=5,a[5]=47<59,因此low=mid+1=5+1=6,k=k-2=6-2=4:

  第三轮查找,mid=low+f[k-1]-1=6+f[2]-1=6+1-1=6,a[6]=59,得到查找结果,返回查找值59所在的下标是6,查找结束。

  依据以上分析,代码实现比较简单:

import java.util.Arrays;

/**
 * 斐波那契查找
 *
 * @author Korbin
 * @date 2023-11-09 09:16:33
 **/
public class FibonacciSearch {

    /**
     * 定义一个斐波那契数组
     *
     * @param length 数组长度
     * @return 斐波那契数组
     * @author Korbin
     * @date 2023-11-09 09:26:32
     **/
    private static int[] fibonacciArray(int length) {
        int[] array = new int[length];
        array[0] = 0;
        if (length == 1) {
            return array;
        } else if (length == 2) {
            array[1] = 1;
            return array;
        } else {
            array[1] = 1;

            for (int i = 2; i < length; i++) {
                array[i] = array[i - 1] + array[i - 2];
            }
            return array;
        }
    }

    /**
     * 查找key在数组array中的下标,找不到时返回-1
     *
     * @param array 被查找的数组
     * @param key   要查找的key
     * @return key在array中的下标
     * @author Korbin
     * @date 2023-11-09 09:28:51
     **/
    private static int fibonacciSearch(int[] array, int key) {

        int length = array.length;
        // 如果被查找的数组只有一位,则直接比较返回
        if (length == 1) {
            if (array[0] == key) {
                return 0;
            } else {
                return -1;
            }
        }

        // 因为是从下标为1的数组开始查找的,因此先比较下标为0的元素
        if (array[0] == key) {
            return 0;
        }

        int[] fibonacciArray = fibonacciArray(length);

        // low初始为1
        int low = 1;
        // high初始为length - 1
        int high = length - 1;

        // 从斐波那契数组中找到k
        int k = 0;
        for (int i = 0; i < length; i++) {
            if (length > fibonacciArray[i]) {
                k++;
            }
        }

        // 如果被查找的数组长度小于k,则扩充数组
        int[] newArray = Arrays.copyOf(array, fibonacciArray[k]);
        if (fibonacciArray[k] > length) {
            for (int i = length; i < fibonacciArray[k]; i++) {
                newArray[i] = array[length - 1];
            }
        }

        // 开始查找
        while (low <= high) {
            // 计算mid
            int mid = low + fibonacciArray[k - 1] - 1;
            if (key < newArray[mid]) {
                high = mid - 1;
                k = k - 1;
            } else if (key > newArray[mid]) {
                low = mid + 1;
                k = k - 2;
            } else {
                if (mid < length) {
                    return mid;
                } else {
                    return length - 1;
                }
            }
        }

        return -1;
    }

    public static void main(String[] args) {
        int[] array = new int[]{0, 1, 16, 24, 35, 47, 59, 62, 73, 87, 99};
        for (int j : array) {
            int index = fibonacciSearch(array, j);
            System.out.println("元素" + j + "的下标是" + index);
        }
    }

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/223141.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

助力信创自主可控,AntDB与浪潮、超聚变完成产品互认

日前&#xff0c;湖南亚信安慧科技有限公司与浪潮商用机器有限公司、超聚变数字技术有限公司展开产品兼容互认工作。 近年来&#xff0c;在数据处理需求快速增长以及信创政策加持的情况下&#xff0c;信创行业活力迸发。操作系统、数据库和服务器作为信创基础软硬件&#xff0…

idea编辑代码卡顿问题

现象&#xff1a; 日常开发代码的时候&#xff0c;偶尔会遇到开发某个项目的时候&#xff0c;一编辑代码就会idea就会卡住 定位&#xff1a; 1、不敲代码时&#xff0c;电脑性能一切正常 2、只要一修改代码&#xff0c;可以发现cpu老是飙到100 3、但是相同的一个项目&#x…

Ubuntu22.04通过Maas和Juju部署openstack charm

目录 官方文档材料准备软件硬件 模板机和虚拟网络安装MAAS官方文档MAAS节点配置安装MAAS浏览器登录MAAS进行配置 激活DHCP 官方文档 https://docs.openstack.org/project-deploy-guide/charm-deployment-guide/2023.1/ 这是一个通过Maas面板即可部署openstack的方式&#xff0…

python HTML文件标题解析问题的挑战

引言 在网络爬虫中&#xff0c;HTML文件标题解析扮演着至关重要的角色。正确地解析HTML文件标题可以帮助爬虫准确地获取所需信息&#xff0c;但是在实际操作中&#xff0c;我们常常会面临一些挑战和问题。本文将探讨在Scrapy中解析HTML文件标题时可能遇到的问题&#xff0c;并…

Spring Boot基础

文章目录 一、Spring Boot1. Spring的缺点2. Spring Boot 改变了什么3. Spring Boot项目搭建4. 热部署5. 依赖管理6. 代码生成器7. 日志8. 日期转换9. 接口文档10. 打包部署11. 自动装配 一、Spring Boot 1. Spring的缺点 在Spring Boot出现以前&#xff0c;使用Spring框架的…

Windows系统的Chkdsk(磁盘修复工具),好用快速的磁盘医生

一款非常具有专业性、权威的工具,可以全面的检测电脑的硬盘坏道,标记出来并且进行及时的修复,它还可以对移动硬盘等进行检测修复。chkdsk还可以支持目前流行的各种系统文件格式,例如:FAT、FAT32、NTFS等。还可以针对坏道磁盘错误进行深度优化,保证电脑磁盘的安全和完整性…

这是聊天阿!this (酸萝卜别吃)doge

1——on——1 chat 服务端 package work; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.util.ArrayList; import java.util.List;public class UDPServer {private static final int PORT 9876;private static List<ClientInf…

新生报到管理系统

【摘要】 随着我国教育水平的提高和新生数量的增加&#xff0c;合理妥善高效的进行新生接待&#xff0c;不但成为各个学校亟待解决的问题&#xff0c;对于广大新生来说&#xff0c;也是最先让他们了解学校形象的一个好机会。但是许多学校没有采用通过高效的系统来操作解决新生…

吉利护航,宣称比友商“更懂车”,魅族造车的底气与底色

继小米、华为后&#xff0c;又一家手机厂商宣布跨界造车。 在近日举办的2023魅族秋季无界生态发布会上&#xff0c;星纪魅族集团&#xff08;下称“魅族”&#xff09;董事长兼CEO沈子瑜宣布&#xff0c;魅族正式进入汽车市场&#xff0c;将在2024年第一季度启动“DreamCar共创…

pyqt5+QWebEngineView+pdfjs+win32print实现pdf文件的预览、打印

一、pdf显示逻辑 import sys from PyQt5 import QtCore, QtWidgets, QtWebEngineWidgetsPDFJS = file:///pdfjs-1.9.426-dist/web/viewer.html # PDFJS = file:///usr/share/pdf.js/web/viewer.html PDF = file:///D:/Code/report.pdfclass Window(QtWebEngineWidgets.QWebEng…

大话数据结构-查找-散列表查找(哈希表)

注&#xff1a;本文同步发布于稀土掘金。 8 散列表查找&#xff08;哈希表&#xff09; 8.1 定义 散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f&#xff0c;使得每个关键字key对应一个存储位置f(key)。查找时&#xff0c;根据这个确定的对应关系找到给…

Python Collections库的高级功能详解

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com Python的collections库提供了一系列有用的数据类型&#xff0c;扩展了内建的数据类型&#xff0c;为开发者提供了更多高级功能。本文将深入探讨collections库的一些高级功能&#xff0c;通过详细的示例代码演示&…

北森2023半年报洞察:中国HCM SaaS市场的未来,只能是北森

作者 | 曾响铃 文 | 响铃说 中国的HCM SaaS市场处在了一个不尴不尬的状态&#xff0c;尽管前景广阔&#xff0c;但是需求却迟迟未能爆发&#xff0c;整体行业卡在了一个明显的瓶颈期。 其中&#xff0c;又以北森的处境最为典型。 根据IDC发布的《IDC中国人力资本管理&#…

EDW国际数据管理最新趋势(二)|信息供应链与数据

最近Data Fabric、Data Mesh、DataOps等话题非常火。其实&#xff0c;信息供应链谈的也是同样的东西&#xff0c;那就是如何将数据治理与数据集成整合在一起的解决方案。 下图虽然简单但涵盖了非常大的信息量。将4A架构进行了拆解&#xff0c;应用架构与技术架构主要是支撑业务…

AOP记录操作日志

创建数据库表 -- 操作日志 create table operate_log (id int unsigned primary key auto_increment commentid,operate_user int unsigned comment 操作人员Id,operate_time datetime comment 操作时间,class_name varchar(100)comment 操作类,method_name varchar(100)comme…

IDEA 修改encoding

IDEA 修改encoding 现象&#xff1a;idea展示乱码 打开Settings>>File Encodings&#xff0c;修改为UTF-8即可

Kubernetes(K8s)_17_Kubernetes扩展

Kubernetes&#xff08;K8s&#xff09;_17_Kubernetes扩展 Kubernetes扩展CustomResuorceDefinition自定义API ServerOperator Kubernetes扩展 Kubernetes扩展: 不同角度实现对Kubernetes功能的增加/增强 内部组件: API Server、CRD、Operator、授权和准入控制kubelet: CRI、…

Linux环境变量与命令行参数

Linux环境变量与命令行参数 一.命令行参数1.语法2.应用1:简易计算器 二.环境变量1.环境变量的概念2.环境变量的作用3.进一步理解环境变量的作用4.常见环境变量5.导出环境变量(添加环境变量)6.环境变量的特性7.另一种获取环境变量的方式8.小功能:用于身份验证的代码9.补充:第三种…

Elasticsearch:什么是机器学习?

机器学习定义 机器学习 (ML) 是人工智能 (AI) 的一个分支&#xff0c;专注于使用数据和算法来模仿人类的学习方式&#xff0c;并随着时间的推移逐渐提高准确性。 计算机科学家和人工智能创新者 Arthur Samuel 在 20 世纪 50 年代首次将其定义为 “赋予计算机无需明确编程即可学…

C 语言实现TCP 通信,以及地址复用

服务端 #include <stdio.h> #include <sys/types.h> #include <sys/socket.h> #include <unistd.h> #include <arpa/inet.h>int main() {//监听套接字文件描述符int listenFd -1;//连接套接字的文件描述符int connFd -1;//服务器的地址结构st…