启发式搜索算法4 -遗传算法实战:吊死鬼游戏

相关文章:
启发式搜索算法1 – 最佳优先搜索算法
启发式搜索算法2 – A*算法
启发式搜索算法2 – 遗传算法

有一个小游戏叫吊死鬼游戏(hangman),在学习英语的时候,大家有可能在课堂上玩过。老师给定一个英文单词,同学们就猜是什么单词,猜错一次老师就画一笔,如果把吊死鬼画出来就没有机会猜了,游戏结束。现在我们不限猜测的次数,让电脑也来玩一下,看它要多久才能猜中。

1 把背景剥离,找出问题核心,简化问题。

对于计算机来说,最简单就是盲目搜索,穷举所有情况,直到猜中为止。这样的穷举算法有兴趣的读者可以尝试用代码实现。这里当然要用刚学习的遗传算法,根据前面的介绍的算法思路,结合实际情况,来设置几个关键要素。

  • 字符从a至z视为基因,由这些字符生成的字符串被认为是染色体(个体),也就是一个解。
  • 适应能力得分就是用个体字符串与目标字符串比较,相同位置有相同字符的个数。
    因此,具有较高适应值的个体(猜中更多字母的解)将获得更多的繁殖权力。
  • 设置种群大小(一代个体的个数),初始种群的数量很重要,如果初始种群数量过多,算法会占用大量系统资源;如果初始种群数量过少,算法很可能忽略掉最优解。这次我们设置种群的数量为100,同一代会有一百个体。
  • 设置下一代组成,适应能力前10%直接进入下一代,这称为精英模式,适应能力前50%的个体拥有繁衍权力,则交配概率为50%,也就是必然产生下一代。一般取较大的交配概率,因为交配操作可以加快解区间收敛,使解达到最有希望的最佳解区域,但交配概率太高也可能导致过早收敛,则称为早熟,只找到局部最优解就停止进化。还有突变概率,这里设置为0.1,也可以说在组合新一代的每一个基因,有45%来自父亲基因,有45%来自母亲基因,有10%发生变异,随机产生一个基因。
  • 终止条件是适应能力值等于单词长度,也就是找到了目标单词,又或者到达最大进化代数(自定义参数配置),也会终止程序。

2.估算数据规模,算法复杂度

如果用穷举算法,可以估算时间复杂度,每一个位置尝试一遍26个字母,所以时间复杂度O(26^n),n为单词的长度。但对于遗传算法来说,由于太多不确定性,遗传算法的精度、可行度、计算复杂性等方面参数还没有有效的定量分析方法,这也算是它的一个缺点。

import random
GENES = 'abcdefghijklmnopqrstuvwxyz'  # 基因
class Individual(object): 
    '''此类代表种群中的个体'''
    def __init__(self, target, chromosome=None):
        self.target = target
        if chromosome: # 个体染色体,也就是所猜的单词解
            self.chromosome = chromosome
        else: # 若没有,创建一个随机的染色体
            self.chromosome = self.create_gnome()
        self.fitness = self.cal_fitness()  # 此个体的适用能力值
    @classmethod # 修饰符对应的函数不需要实例化,不需要 self 参数,但第一个参数需要是表示自身类的 cls 参数
    def mutated_genes(cls):
        # 基因突变,也就是从a-z中随机挑选一个字母
        global GENES 
        gene = random.choice(GENES) 
        return gene
    def create_gnome(self):
        # 初始化个体基因
        gnome_len = len(self.target) # 根据目标单词长度随机构建一个字符串
        return [self.mutated_genes() for _ in range(gnome_len)]
    def mate(self, parent, mutation=0.1):
        # 进行繁衍,产生新一代
        child_chromosome = [] # 后代染色体
        p1_proba = (1 - mutation) / 2 # 取得父母基因概率是一样
        for p1, p2 in zip(self.chromosome, parent.chromosome):
            # 遍历父母每一个基因,通过一定概率随机获取父母其中一方的基因,还有0.1概率发生变异
            prob = random.random() #获取一个0-1的随机数
            if prob < p1_proba: # 一半概率选择选择p1
                child_chromosome.append(p1) 
            elif prob < p1_proba*2: # 一半概率选择选择p2
                child_chromosome.append(p2) 
            else: # 剩下1-probability概率发生基因突变
                child_chromosome.append(self.mutated_genes()) 
        # 创建一个新个体,并返回
        return Individual(self.target, chromosome=child_chromosome) 
    def cal_fitness(self): 
        # 计算适应能力值,记录正确的字符数量
        fitness = 0
        for gs, gt in zip(self.chromosome, self.target): 
            if gs == gt: fitness+= 1
        return fitness
class GeneticAlgorithm(object):
    '''遗传算法'''
    def __init__(self, target, population_size=100,
                 proba_elitism=10, proba_crossover=50,
                 mutation=0.1, max_generation=100):
        self.population_size = population_size  # 种群大小
        self.target = target  # 目标单词
        self.proba_elitism = proba_elitism  # 精英模式的比例
        self.proba_crossover = proba_crossover  # 交配概率
        self.mutation = mutation  # 突变概率
        self.max_generation = max_generation  # 最大进化代数,也就是循环最多次数
        self.found = False  # 初始化时没有找到最优解
        self.generation = 1  # 当前进化的世代,创世纪是1
        self.population = []  # 种群,初始化为空
    def init_population(self):
        # 初始化第一代个体
        for _ in range(self.population_size):
            self.population.append(Individual(self.target))
    def main(self):
        # 主函数
        self.init_population() # 产生第一代个体
        # 若没有找到答案,并且没有达到最大进化代数,继续下一代演化
        while not self.found and self.generation < self.max_generation: 
            # 按照适应能力排序-内置排序法
            self.population = sorted(self.population, key = lambda x:x.fitness, reverse=True)
            # 一旦发现有适应值和目标长度一样,说明我们找到这个单词
            if self.population[0].fitness == len(self.target): 
                self.found = True
                break
            # 记录下一代个体
            new_generation = []
            # 精英模式,选择前10%的个体进入下一代
            s = int((self.proba_elitism*self.population_size)/100) 
            new_generation.extend(self.population[:s]) 
            # 90%的个体是通过上一代的交配得到
            s = int(((100 - self.proba_elitism)*self.population_size)/100)
            # 前50%有繁衍下一代的个体数量
            num_crossover =  int(self.proba_crossover * self.population_size / 100)
            for _ in range(s):
                # 前50%的个体可以有繁衍权力,在这些个体中随机挑选两个
                parent1 = random.choice(self.population[:num_crossover])  
                parent2 = random.choice(self.population[:num_crossover])
                child = parent1.mate(parent2, mutation=self.mutation) # 进行繁衍
                new_generation.append(child) # 得到新的一代个体
            self.population = new_generation # 新一代的个体代替上一代的
            print("第{}代\t单词: {}\t适应值: {}".format(
                self.generation, 
                "".join(self.population[0].chromosome), 
                self.population[0].fitness)) 
            self.generation += 1 # 记录进化的代数
        print("第{}代\t单词: {}\t适应值: {}".format(
            self.generation, 
            "".join(self.population[0].chromosome),
            self.population[0].fitness))

这里有两个类【Individual】是代表个体,【GeneticAlgorithm】是代表遗传算法。【Individual】个体在实例化的时候会先判断是否有染色体,如果没有就通过create_gnome()函数随机生成一个染色体,然后马上通过cal_fitness()函数计算它的适应能力值。mate()函数负责繁衍下一代新个体和mutated_genes()函数负责模拟基因突变。【GeneticAlgorithm】在实例化的时候就要设定遗传算法的各种配置,其中目标单词【target】是必要参数,其他参数是可选参数,都已经设定了默认值。然后通过调用main()函数来启动算法运行,在运算过程中把每一代适应能力值最大的个体打印出来,一起观察种群的进化过程。现在通过一些例子来验证代码是否可行。

ga = GeneticAlgorithm('generation')
ga.main()
# ---------结果-----------
ga = GeneticAlgorithm('generation')
第1代     单词: eikehaviro  适应值: 3
第2代     单词: eikehaviro  适应值: 3
第3代     单词: toneibxinn  适应值: 4
第4代     单词: binagavion  适应值: 5
第5代     单词: binagavion  适应值: 5
第6代     单词: emnenahion  适应值: 6
第7代     单词: emnenahion  适应值: 6
第8代     单词: emnenahion  适应值: 6
第9代     单词: ltneratton  适应值: 7
第10代    单词: eenaration  适应值: 8
第11代    单词: eeneration  适应值: 9
第12代    单词: eeneration  适应值: 9
第13代    单词: generation  适应值: 10

从打印在屏幕的信息中看到刚开始的适应能力值非常低,通过不断进化,适应值也逐步上升,到第十三代就找到答案,粗略估算每次100个个体,那么一共尝试了13*100=13000次就找到结果,效果还是不错的。因为遗传算法是具有不定性,当然不可能每次都是在第十三代就能得到结果,大家可以多尝试就会知道。同时可以尝试调整其他默认参数,观察参与变化对结果有什么影响。比如下面改变种群的个体数量,结果会发生什么变化。

target = 'announcement'
for p in range(100, 1000, 100): # 种群大小,每次增加100
    generate = 0
    for _ in range(10): # 每一种种群经过10次运算
        ga = GeneticAlgorithm(target, population_size=p)
        ga.main()
        generate += ga.generation # 统计总共经过多少次进化
    print('种群数量为%d, 总进化代数为%d, 平均每次通过%.1f进化得到结果' % (p, generate, generate/10))
# ---------结果-----------
种群数量为100, 总进化代数为199, 平均每次通过19.9进化得到结果
种群数量为200, 总进化代数为144, 平均每次通过14.4进化得到结果
种群数量为300, 总进化代数为132, 平均每次通过13.2进化得到结果
种群数量为400, 总进化代数为128, 平均每次通过12.8进化得到结果
种群数量为500, 总进化代数为131, 平均每次通过13.1进化得到结果
种群数量为600, 总进化代数为121, 平均每次通过12.1进化得到结果
种群数量为700, 总进化代数为115, 平均每次通过11.5进化得到结果
种群数量为800, 总进化代数为118, 平均每次通过11.8进化得到结果
种群数量为900, 总进化代数为118, 平均每次通过11.8进化得到结果

从结果我们看到,适当增加种群的个体数量,可以更快地获得结果。对于其他参数,大家也可以通过同样的方法进行测试,以下是其他参数的测试结果汇总到表,每一次只改变一个参数的值,其他参数按默认值。
在这里插入图片描述
从结果中知道,突变概率确实不能太大,越大需要更多次进化,并且在大于0.35就不能求出结果,因为程序设置了最大迭代次数就100。再查看繁衍权力这个参数,当它在40时候,也就是种群前40%的个体能够有机会繁衍下一代,得到进化代数结果是最小的。在解决实际问题的时候大家也可以通过这样的调试方式,找到合适的参数值。此时再用调试过的参数,种群数是400,突变概率是0.15,繁衍权力是40,重新测试一下,观察程序是否真的能提高效率。

ga = GeneticAlgorithm('generation', population_size=400,
    proba_crossover=40, mutation=0.15)
ga.main()
# ---------结果-----------
第1代 单词: uedpwxdkon  适应值: 3
第2代 单词: uedpwxdkon  适应值: 3
第3代 单词: gefzrbvbin  适应值: 4
第4代 单词: gexewgticx  适应值: 5
第5代 单词: oeteravign  适应值: 6
第6代 单词: xeneratijn  适应值: 8
第7代 单词: xeneratijn  适应值: 8
第8代 单词: xeneratijn  适应值: 8
第9代 单词: generation  适应值: 10

看到调优过的参数起作用了,比刚才少了4代,在第九代就找到答案了。也许这只是一个意外,那么再来做一个更严谨的测试,同样运行10次,验证是否真实提高效率。

generate1 = 0
generate2 = 0
for _ in range(10): # 经过10次运算
    ga = GeneticAlgorithm(target)
    ga.main()
    generate1 += ga.generation
    ga = GeneticAlgorithm(target, population_size=400,
        proba_crossover=40, mutation=0.15)
    ga.main()
    generate2 += ga.generation
print('默认参数:总进化代数为%d, 平均每次通过%.1f进化得到结果' % (
    generate1, generate1/10))
print('调优参数:总进化代数为%d, 平均每次通过%.1f进化得到结果' % (
    generate2, generate2 / 10))
# ---------结果-----------
默认参数:总进化代数为148, 平均每次通过14.8进化得到结果
调优参数:总进化代数为101, 平均每次通过10.1进化得到结果

完整代码可以查看:打开

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/587133.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024深圳杯数学建模竞赛A题(东三省数学建模竞赛A题):建立火箭残骸音爆多源定位模型

更新完整代码和成品完整论文 《2024深圳杯&东三省数学建模思路代码成品论文》↓↓↓&#xff08;浏览器打开&#xff09; https://www.yuque.com/u42168770/qv6z0d/zx70edxvbv7rheu7?singleDoc# 2024深圳杯数学建模竞赛A题&#xff08;东三省数学建模竞赛A题&#xff0…

前端性能优化知识梳理

1.重要性 当我们面试的时候&#xff0c;前端性能优化方面算是必考的知识点&#xff0c;但是工作中我们又很少会重点的对项目进行前端优化&#xff0c;它真的不重要吗&#xff1f; 如果我们可以将后端响应时间缩短一半&#xff0c;整体响应时间只能减少5%~10%。而如果关注前端…

手把手实现一个简约酷美美的版权声明模块

1. 导语 版权声明在很多网站都有用到&#xff0c;出场率还是很高的。所以今天就实现一个属于自己分风格的版权声明模块&#xff0c;技术上采用原生的前端三剑客: HTMLCSSJavaScript(可能会用到) 比如CSDN的版权声明是这样的 2. 需求分析 先看看成品吧&#xff0c;这篇文字结…

翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一

合集 ChatGPT 通过图形化的方式来理解 Transformer 架构 翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深…

强网杯 2019]随便注解题方式

先来看题 这里只有一个提交&#xff0c;那我们就先提交看看情况找找思路 这里提交以后发现也没有什么有用的信息 这样我们只能根据我们的经验先试试 输入1发现有报错 有报错信息就可以试试报错注入了&#xff0c;但是这种ctf题通常会有限制字符所以我使用 1 select 1,2# 来…

c#数据库: 4.修改学生成绩

将4年级的学生成绩全部修改为100分,。修改前的学生信息表如图所示: using System; using System.Collections.Generic; using System.Data.SqlClient; using System.Linq; using System.Text; using System.Threading.Tasks;namespace StudentUpdate {internal class Program{s…

Apache SeaTunnel k8s 集群模式 Zeta 引擎部署指南

SeaTunnel提供了一种运行Zeta引擎(cluster-mode)的方法&#xff0c;可以让Kubernetes在本地运行Zeta引擎&#xff0c;实现更高效的应用程序部署和管理。在本文中&#xff0c;我们将探索SeaTunnel k8s运行zeta引擎(cluster-mode模式)的更多信息&#xff0c;了解如何更好地利用Ze…

JavaScript基础(二)

JS语法结构——引入方式 js很明显可以是一个后缀名为js的文件&#xff0c;js的引入方式和css一样&#xff0c;也有三种方式。 1.外部 使用script表现&#xff0c;只不过增加一个src属性&#xff0c;把js文件的路径src属性中。 <script src "js文件路径">&l…

h5+Vant左滑删除

介绍&#xff1a;这是一个上拉加载下拉刷新的列表&#xff0c;外加左滑删除。废话不多说&#xff0c;直接上代码&#xff01;&#xff01;&#xff01;&#xff01; <template><div class"info-list"><div class"top-bar"><van-nav-…

深入解析Floyd Warshall算法:原理、Java实现与优缺点

Floyd Warshall算法的简介 在我们的日常生活中&#xff0c;常常会遇到需要找出两点之间最短路径的问题。比如&#xff0c;从家到公司的最短路线&#xff0c;或者在旅行时&#xff0c;从一个景点到另一个景点的最快路线。 为了解决这类问题&#xff0c;科学家们设计出了许多算法…

利用大型语言模型提升数字产品创新:提示,微调,检索增强生成和代理的应用

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

code-server容器webpack的ws无法连接解决方法

TLDR 通过指定client的wsrul去连接ws devServer.client.webSocketURL ‘wss://<Forwarded uri>/ws’ 拓扑 1、code-server: 用于编写代码、启动webpack dev-server 服务&#xff1b;[https://<domain>:8001] 2、webpack: 用于浏览dev-server服务&#xff1b;[ht…

spring-boot示例

spring-boot版本&#xff1a;2.0.3.RELEASE 数据库: H2数据库 &#xff08;嵌入式内存性数据库&#xff0c;安装简单&#xff0c;方便用于开发、测试&#xff0c;不适合用于生产&#xff09; mybatis-plus框架&#xff0c;非常迅速开发CRUD

如何去掉引用网址的小尾巴

引用文章的链接时会出现很长冗余信息&#xff0c;删&#xff0c;删&#xff0c;删……&#xff0c;直到从平流层删到地平线 使用 Neat URL&#xff08;支持 google 系、Firefox&#xff09;扩展中的【拦截参数】可以去除的这类百无聊赖的小尾巴。 安装后&#xff0c;点击【Pr…

C语言——单链表实现数据增删查改

一.前言 嗨嗨嗨&#xff0c;我们又见面了。前面我们已经学习了关于数据结构中的顺序表&#xff0c;今天我们来学习数据结构中的单链表。废话不多说让我们直接开始吧。 二.正文 1.1链表的概念 链表是一种物理存储结构上非连续、非顺序的存储结构&#xff0c;数据元素的逻辑顺…

【C#】基础知识

0.参考 C#语言入门详解 1.几种打印hello_world的方式 1.1 console控制台 新建一个console&#xff0c;直接打印&#xff1a; Console.WriteLine("Hello_world");启动一闪而过&#xff0c;在vs调试中选择开始执行不调试&#xff08;without debug&#xff09;。 …

算法效率的判断及一些典型例题的讲解

一.算法效率 1.用处&#xff1a;判断算法的好坏&#xff0c;好的算法应该是高效的 2算法效率取决于时间复杂度和空间复杂度 <1>时间复杂度 1.1概念&#xff1a;算法中基本操作的执行次数就是算法的时间复杂度 1.2表示&#xff1a;大O的渐进表示法&#xff0c;例如O(N)…

java技术栈快速复习02_前端基础知识总结

前端基础 经典三件套&#xff1a; html&#xff08;盒子&#xff09;css&#xff08;样式&#xff09;JavaScript&#xff08;js&#xff1a;让盒子动起来&#xff09; html & css HTML全称&#xff1a;Hyper Text Markup Language(超文本标记语言)&#xff0c;不是编程语…

记一次生产事故的排查和解决

一. 事故概述 春节期间, 生产系统多次出现假死不可用现象, 导致绝大部分业务无法进行. 主要表现现象为接口无法访问. 背景为900W客户表和近实时ES, 以及春节期间疫情导致的普通卖菜场景近似秒杀等. 二. 排查过程 优先排查了info, error, catalina日志, 发现以下异常: 主要的…

边循环边删除List中的数据

List边循环&#xff0c;边删除&#xff1b;这种一听感觉就像是会出问题一样&#xff0c;其实只要是删除特定数据&#xff0c;就不会出问题&#xff0c;你如果直接循环删除所有数据&#xff0c;那可能就会出问题了&#xff0c;比如&#xff1a; public static void main(String[…