字节跳动后端一面

📍1. Gzip压缩技术详解
Gzip是一种流行的无损数据压缩格式,它使用DEFLATE算法来减少文件大小,广泛应用于网络传输和文件存储中以提高效率。
🚀 使用场景:
• 网站优化:通过压缩HTML、CSS、JavaScript文件来加速页面加载,提升用户体验。
• 数据备份与归档:压缩大型数据集,减少存储空间和传输带宽。
• API数据传输:压缩API响应,降低网络传输成本,尤其是在移动网络环境下。
• 大数据处理:在Hadoop、Spark等大数据框架中压缩中间结果,提高处理效率。
🔧 Golang使用示例:

import (
    "bytes"
    "compress/gzip"
)

func GzipEncode(data []byte) ([]byte, error) {
    var buf bytes.Buffer
    gw := gzip.NewWriter(&buf)
    defer gw.Close()
    _, err := gw.Write(data)
    if err!= nil {
        return nil, err
    }
    return buf.Bytes(), nil
}

📍2. MySQL慢查询处理四部曲
• 开启慢查询日志:配置my.cnf文件,设置slow_query_log=1long_query_time阈值,记录执行时间超过阈值的SQL语句。
• 使用分析工具:利用mysqldumpslowpt-query-digest等工具分析慢查询日志,识别频繁执行的慢SQL。
• 优化索引:根据慢查询分析结果,为频繁查询的列创建索引,优化复合索引顺序,遵循最左前缀原则。
• SQL优化:重构SQL语句,避免使用SELECT *,减少JOIN操作,使用LIMIT限制结果集大小,优化子查询和关联查询。

📍3. Binlog日志格式对比

格式特点适用场景
STATEMENT记录SQL语句,日志量小,性能高简单DML操作,不涉及复杂事务
ROW记录行级变更,数据一致性高,可精确恢复复杂事务,需要高数据安全性
MIXED自动切换STATEMENT和ROW格式混合业务场景,兼顾性能和安全性

📍4. MySQL索引优化指南
• B+树索引:理解B+树结构,合理设计索引,支持快速查找和范围查询。
• 最左前缀原则:复合索引按查询频率高的列在前,确保索引高效利用。
• 覆盖索引:优化查询列与索引列,避免回表操作,提高查询效率。
• 索引优化案例:分析查询性能瓶颈,为频繁查询的列添加索引,减少IO操作,提升查询速度。

📍5. 强一致性定义
强一致性(也称为线性一致性或原子一致性)要求分布式系统中所有节点在同一时刻看到的数据完全一致,确保数据的实时性和准确性。
典型实现:两阶段提交(2PC)、Paxos、Raft等分布式一致性算法。
应用场景:金融交易、库存管理、订单处理等对数据一致性要求极高的业务场景。

📍6. Kafka业务场景
• 日志收集与分析:实时采集用户行为日志、系统日志,支持大数据量处理和实时分析。
• 事件驱动架构:实现服务间解耦,通过发布/订阅模式实现异步消息传递,提高系统可扩展性和灵活性。
• 数据管道:作为数据流平台,连接数据源和目标系统,实现数据集成和ETL流程。
• 实时数据流处理:结合Flink、Spark Streaming等流处理框架,实现实时数据分析和决策支持。

📍7. RocketMQ事务消息流程

  1. 发送半消息(prepare消息):生产者发送消息到RocketMQ,消息状态为半消息。
  2. 执行本地事务:生产者执行本地事务操作,如数据库更新、文件写入等。
  3. 根据本地事务结果,提交或回滚消息:生产者根据本地事务执行结果,向RocketMQ发送提交或回滚消息。
    🛡️ 确保消息发送与本地事务执行结果一致,常用于分布式事务场景,如订单支付、库存扣减等。

📍8. 消息队列选型指南
• Kafka:适合大数据量、高吞吐量的场景,如日志收集、实时数据处理、数据流平台等。
• RocketMQ:提供事务消息、顺序消息、消息过滤等高级特性,适合金融、电商等对消息可靠性要求极高的场景。
• 选型考虑:根据业务需求、性能要求、可靠性、功能特性、生态系统支持等因素选择合适的消息队列。

📍9. 消息幂等保障方案
• 唯一消息ID:为每条消息生成唯一ID,消费者在处理消息前检查是否已处理过。
• 数据库去重表:使用数据库表记录已处理消息ID,消费前查询去重表判断消息是否已处理。
• 状态机控制:根据业务状态判断消息是否已处理,确保消息处理逻辑幂等。
• 分布式锁:在高并发场景下,使用分布式锁确保同一时刻只有一个消费者处理消息。

📍10. 死信队列实现
• 设置消息消费超时或重试次数:配置消息队列的消费超时时间和重试次数。
• 消费失败的消息被投递到死信队列(DLQ):消息消费失败后,被自动投递到死信队列。
• 监控DLQ,定期处理失败消息:通过监控工具或定时任务检查DLQ,处理失败消息,如人工干预、自动重试或记录日志。

📍11. Redis分布式锁实现

func RedisDistributedLock(conn redis.Conn, lockKey string, lockValue string, expire int) bool {
    script := redis.NewScript(1, `
        if redis.call("setnx", KEYS[1], ARGV[1]) == 1 then
            redis.call("expire", KEYS[1], ARGV[2])
            return 1
        else
            return 0
        end`)
    result, err := script.Run(conn, []string{lockKey}, []string{lockValue, expire}).Result()
    if err!= nil {
        return false
    }
    return result.(int) == 1
}

⚠️ 注意锁的过期时间设置,避免死锁,同时考虑锁的续期问题,防止业务执行时间过长导致锁提前释放。

📍12. RedLock解决的问题
RedLock通过多节点分布式锁机制,解决单点Redis故障导致的锁失效问题,确保分布式环境下锁的高可用性和安全性。
主要解决以下问题:
• 单点故障:避免单点Redis宕机导致锁不可用。
• 锁过期释放:在锁过期时间内,如果业务未执行完,防止其他节点获取到锁。
• 脑裂问题:在Redis集群中,避免因网络分区导致多个节点同时持有锁。

📍13. Redis消息队列方案
• List结构:使用LPUSHRPOP实现简单队列,适用于低并发、轻量级消息场景。
• Streams:Redis 5.0引入的新特性,支持消息持久化、消费者组、消息确认、消息ID生成等高级功能,提供更强大的消息队列能力。
应用场景:适用于轻量级、低延迟的消息场景,如实时通知、任务队列等,但需注意消息持久化和数据一致性,确保消息不丢失。

📍14. ES+MySQL架构实践
• MySQL存储事务性数据:作为主数据库,存储订单、用户、交易等事务性数据,保证数据完整性和一致性。
• ES存储非事务性数据:用于全文搜索、数据分析、实时查询等场景,提供快速查询和数据分析能力。
• 数据同步:使用Canal、Logstash等工具实现MySQL到ES的数据同步,保持数据一致性。
• 业务场景:商品信息存储在MySQL,ES提供商品搜索功能,提升用户体验;同时,利用ES进行数据分析,支持业务决策。
• 架构优化:考虑数据一致性、实时性、性能等因素,优化数据同步策略,如增量同步、异步同步等,确保系统稳定高效运行。

📍15. 分库分表策略
• 垂直分库:按业务模块划分数据库,如订单库、用户库等,降低单库压力,提高业务隔离性。
• 水平分表:按某个字段(如用户ID、时间)将大表拆分为多个小表,分散数据存储,提高查询性能。
• 分片键选择:选择均匀分布的字段作为分片键,避免数据倾斜,如使用哈希函数或范围分区。
• 中间件支持:使用ShardingSphere、MyCat等分库分表中间件,简化分库分表操作,提供透明化访问。

📍16. 算法题:二叉树重建及后序遍历

type TreeNode struct {
    Val   int
    Left  *TreeNode
    Right *TreeNode
}

func buildTree(preorder []int, inorder []int) *TreeNode {
    if len(preorder) == 0 || len(inorder) == 0 {
        return nil
    }
    root := &TreeNode{Val: preorder[0]}
    index := findIndex(inorder, preorder[0])
    root.Left = buildTree(preorder[1:index+1], inorder[:index])
    root.Right = buildTree(preorder[index+1:], inorder[index+1:])
    return root
}

func findIndex(arr []int, target int) int {
    for i, v := range arr {
        if v == target {
            return i
        }
    }
    return -1
}

func postorderTraversal(root *TreeNode) []int {
    if root == nil {
        return []int{}
    }
    left := postorderTraversal(root.Left)
    right := postorderTraversal(root.Right)
    return append(append(left, right...), root.Val)
}

欢迎关注我的小红书一起来讨论。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/967657.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Visual Studio踩过的坑

统计Unity项目代码行数 编辑-查找和替换-在文件中查找 查找内容输入 b*[^:b#/].*$ 勾选“使用正则表达式” 文件类型留空 也有网友做了指定,供参考 !*\bin\*;!*\obj\*;!*\.*\*!*.meta;!*.prefab;!*.unity 打开Unity的项目 注意:只是看&#xff0…

智慧机房解决方案(文末联系,领取整套资料,可做论文)

智慧机房解决方案-软件部分 一、方案概述 本智慧机房解决方案旨在通过硬件设备与软件系统的深度整合,实现机房的智能化管理与服务,提升机房管理人员的工作效率,优化机房运营效率,确保机房设备的安全稳定运行。软件部分包括机房管…

ubuntu中如何在vscode的终端目录后显示(当前的git分支名) 实测有用

效果展示 配置过程: 在 Ubuntu 中,如果你想在 VS Code 的终端提示符后显示当前的 Git 分支名,可以通过修改 Shell 配置文件(如 ~/.bashrc 或 ~/.zshrc)来实现。以下是具体步骤: 1. 确定使用的 Shell 首…

【机器学习案列】车辆二氧化碳排放量预测

这里是引用 🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中…

SpringCloud - Sentinel服务保护

前言 该博客为Sentinel学习笔记,主要目的是为了帮助后期快速复习使用 学习视频:7小快速通关SpringCloud 辅助文档:SpringCloud快速通关 源码地址:cloud-demo 一、简介 官网:https://sentinelguard.io/zh-cn/index.h…

基于 GEE 利用插值方法填补缺失影像

目录 1 完整代码 2 运行结果 利用GEE合成NDVI时,如果研究区较大,一个月的影像覆盖不了整个研究区,就会有缺失的地方,还有就是去云之后,有云量的地区变成空值。 所以今天来用一种插值的方法来填补缺失的影像&#xf…

海云安开发者智能助手(D10)全面接入DeepSeek,赋能开发者安全高效编码新范式

海云安正式宣布完成与DeepSeek(深度求索)的深度技术融合,旗下核心产品D10开发者智能助手全面接入DeepSeek R1模型。此次合作标志着海云安在"AI驱动开发安全"领域实现重要突破。数据显示,通过DeepSeek R1模型的优化与蒸馏…

Docker 1. 基础使用

1. Docker Docker 是一个 基于容器的虚拟化技术,它能够将应用及其依赖打包成 轻量级、可移植 的容器,并在不同的环境中运行。 2. Docker指令 (1)查看已有镜像 docker images (2)删除镜像 docker rmi …

【批量获取图片信息】批量获取图片尺寸、海拔、分辨率、GPS经纬度、面积、位深度、等图片属性里的详细信息,提取出来后导出表格,基于WPF的详细解决方案

摄影工作室通常会有大量的图片素材,在进行图片整理和分类时,需要知道每张图片的尺寸、分辨率、GPS 经纬度(如果拍摄时记录了)等信息,以便更好地管理图片资源,比如根据图片尺寸和分辨率决定哪些图片适合用于…

如何使用C++将处理后的信号保存为PNG和TIFF格式

在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示。C提供了多种库来处理图像数据,本文将介绍如何使用stb_image_write库保存为PNG格式图像以及使用OpenCV库保存为TIFF格式图像。 1. PNG格式保存 使用stb_ima…

【机器学习】超参数的选择,以kNN算法为例

分类准确度 一、摘要二、超参数的概念三、调参的方法四、实验搜索超参数五、扩展搜索范围六、考虑距离权重的kNN算法七、距离的计算方法及代码实现八、明可夫斯基距离的应用九、网格搜索超参数 一、摘要 本博文讲解了机器学习中的超参数问题,以K近邻算法为例&#…

使用PyCharm进行Django项目开发环境搭建

如果在PyCharm中创建Django项目 1. 打开PyCharm,选择新建项目 2.左侧选择Django,并设置项目名称 3.查看项目解释器初始配置 4.新建应用程序 执行以下操作之一: 转到工具| 运行manage.py任务或按CtrlAltR 在打开的manage.pystartapp控制台…

【python】matplotlib(animation)

文章目录 1、matplotlib.animation1.1、FuncAnimation1.2、修改 matplotlib 背景 2、matplotlib imageio2.1、折线图2.2、条形图2.3、散点图 3、参考 1、matplotlib.animation 1.1、FuncAnimation matplotlib.animation.FuncAnimation 是 Matplotlib 库中用于创建动画的一个…

IntelliJ IDEA使用经验(十三):使用Git克隆github的开源项目

文章目录 问题背景办法1、设置git代理;2、再次克隆项目;3、再次按常规方式进行git克隆即可。 问题背景 由于github在国外,很多时候我们在使用idea克隆开源项目的时候,没办法检出,提示 连接重置。 办法 1、设置git代…

人工智能学习(七)之神经网络

目录 一、引言 二、经典神经网络回顾 (一)结构与计算过程 (二)局限性 三、循环神经网络(RNN)原理 (一)基本结构 (二)计算过程 (三&#xf…

IDEA编写SpringBoot项目时使用Lombok报错“找不到符号”的原因和解决

目录 概述|背景 报错解析 解决方法 IDEA配置解决 Pom配置插件解决 概述|背景 报错发生背景:在SpringBoot项目中引入Lombok依赖并使用后出现"找不到符号"的问题。 本文讨论在上述背景下发生的报错原因和解决办法,如果仅为了解决BUG不论原…

使用golang wails写了一个桌面端小工具:WoWEB, 管理本地多前端项目

WoWEB 本地快速启动 http 服务。 辅助管理本地前端项目。 使用界面配置代理转发。 支持平台 windows 10macOS 功能描述 管理本地前端项目启动本地 HTTP 服务,可本地或者局域网访问快速打开项目文件夹配置 HTTP 代理转发规则,方便开发调试 以下情况…

Unity Dots理论学习-5.与ECS相关的概念

DOTS的面向数据编程方式比你在MonoBehaviour项目中常见的面向对象编程方式更适合硬件开发。可以尝试理解一些与数据导向设计(DOD)相关的关键概念,以及这些概念如何影响你的代码,对你在MonoBehaviour项目中的C#编程通常是较少涉及的…

【hive】记一次hiveserver内存溢出排查,线程池未正确关闭导致

一、使用 MemoryAnalyzer软件打开hprof文件 很大有30G,win内存24GB,不用担心可以打开,ma软件能够生成索引文件,逐块分析内存,如下图。 大约需要4小时。 overview中开不到具体信息。 二、使用Leak Suspects功能继续…

(篇三)基于PyDracula搭建一个深度学习的软件之解析yolo算法融合

文章目录 1YoloPredictor类——检测器1.1继承BasePredictor解析1.2继承QObject解析 2MainWindow类——主窗口 在前面两篇中,篇一介绍了启动界面的制作,篇二介绍了如何修改PyDracula的界面,那么这一篇我们学习一下yolo要融合进入软件中&#x…