001-监控你的文件-FSWatch-C++开源库108杰

  1. fswatch 原理与应用简介
  2. fswatch 安装
  3. fswatch 实践应用
  4. 具体应用场景与细节补充

在这里插入图片描述

1. 简介

有些知识,你知道了不算厉害,但你要是不知道,就容易出乱。

很多时候,程序需要及时获取磁盘上某个文件对象(文件夹、文件)的变动信息,这时候 “绝大多数操作系统支持主动推送此类信息” 这个知识点,就很重要。

如果不知道这点,大概就只能让程序定时去检查、并维护前后两套数据,自行对比以发现是否有哪个文件对象发生了哪些变化。

fswatch 本是多数 linux 下的一个工具程序——但现已经支持跨平台。它提供动态库和配套的 C、C++头文件 (合称为 libfswatch),借助它,我们也可以在自己的程序中,直接获得监控指定文件对象变动信息。

更多关于文件变动信息监控以及 libfswatch 库的基本原理、功能以及应用场景示例,请看视频 A。

  • 视频 A : FSWatch 简介

001-监控你的文件-1原理简介-C++开源库108杰

2. 安装 fswatch

Linux 下,可以使用各自发行版自带的包管理器安装 fswatch。以 Ubuntu 为例:

sudo apt install fswatch

Windows下,因为我们使用 msys2 来安装 fswatch。进入对应环境(我们的课程使用的是 ucrt64)的终端,输入以下指令即可:

pacman -S mingw-w64-ucrt-x86_64-fswatch

msys2 本身的安装可看课程 《VSCODE 多语言开发保姆手册》)的第一节课 《MSys2 + GCC 安装与应用》。

如果你手快并且长得帅的话,最快十秒钟具体操作过程以及效果演示,见视频 B 。

002-监控你的文件-2十秒安装-C++开源库108杰

3. 上机实践

我们使用 Windows + Msys2 + VSCode + GCC + CMake 的开发环境,相关准备工作同样可观看 《VSCODE 多语言开发保姆手册》)。

  • 视频 C: 上机实践

003-监控你的文件-3使用示范-C++开源库108杰

3.1 CMakeList.txt

cmake_minimum_required(VERSION 3.15.0)
project(HelloFSWatch VERSION 0.1.0 LANGUAGES C CXX)

add_executable(HelloFSWatch main.cpp)

target_link_libraries(${PROJECT_NAME} PRIVATE fswatch) 
target_link_directories(${PROJECT_NAME} PRIVATE "C:/msys64/ucrt64/bin")

说明:

其中最后两行是我们添加的。

  • 第一行 target_link_libraries 用于告诉编译器,当前项目需要链接到 fswatch 这个库;
  • 第二行 target_link_directories 则告诉编译器,上哪里去找 fswatch 这个库;
  • PRIVATE 用于指示对应的设置,仅在当前目标中生效,对我们这个小项目并无影响;
  • ${PROJECT_NAME} 是 CMake 的内置变量,用于表示当前项目名称,即 HelloFSWatch (见第2行的 project 语句)

GCC 在链接某个库时,会自动为它加上 lib 前缀,以及对应的扩展名,本例为 .dll,因此,我们在 CMake 源文件中写的 fswatch,最终会组成全名 “libfswatch.dll”

3.2 main.cpp

#include <ctime>

#include <iostream>
#include <iomanip>

#include <libfswatch/c++/monitor_factory.hpp>

// 返回值:必须是 void,入参必须是 std::vector<fsw::event> const & 和 void *
void on_file_changed(std::vector<fsw::event> const & events, void *)
{
    std::cout << "Files Changed:\n";

    for (auto const& event : events)
    {
        // 输出变动的文件路径:
        std::cout << event.get_path() << "\n";
        
        // 输出变动的时间:
        std::time_t t = event.get_time();
        std::tm lt; // local time 本地时间结构
        localtime_s(&lt, &t); // C11 开始支持的线程安全的时间转换函数

        std::cout << std::put_time(&lt, "%Y-%m-%d %H:%M:%S") << "\n";

        // 输出变动的标志:
        std::cout << "Flags:\n";
        for (auto const& flag : event.get_flags())
        {
            std::cout << "\t" << fsw_get_event_flag_name(flag) << "\n";
        }
    }
}

int main(int, char**) 
{
    std::vector<std::string> paths = {"d:\\tmp"};

    auto *monitor = fsw::monitor_factory::create_monitor(
        system_default_monitor_type,
        paths,
        on_file_changed
    );

    // 启动监控
    monitor->start();  // 进入死循环
}

如代码所示,使用 fswatch 实现被动式响应(那操作系统主动回调我们的函数)的文件变动监控过程,关键三步:

Step1 : 通过工厂类的静态方法 create_monitor 创建一个监控器。需指定类型(通常就是采用代码中的默认类型)、待监控的文件对象路径(默认类型下,Windows 操作系统仅支持以文件夹为单位进行测控,因此该参数只能填写文件夹),回调函数;实际还有第四个默认参数,用于向回调函数传递额外的参数,通常并不需要,因此它有默认值 nullptr;

Step2 : 准备好你的回调函数(即代码中的 on_file_changed ),注意,该函数原型须严格符合:void (std::vectorfsw::event const& , void *) ;

Step3 : 启动监控。

3.3 on_file_changed 详解

回调函数名字无所谓。第一个入参类型需为 std::vectorfsw::event const& ,这是一个常量引用,第二个入参为 void *,即前面创建监控器,所传入的第四个参数(我们使用的了函数参数默认值)。

第一个入参 events 是复数(一个容器),表明该函数被操作系统回调用时,操作系统可能想告诉我们的情况有可能是:

  • 一个文件对象的一个变动事件;
  • 一个文件对象的多个变动事件;
  • 多个文件对象的多个变动事件。

每一个 event 主要包含:变动文件路径的对象(如果变动对象是一个文件,此时Windows系统上报的也是文件名),变动时间(注意,不一定非常精确),变动标志等。

库为变动标志取了一些英文名字,常见的有:

  • NoOp : 无变动
  • PlatformSpecifc :特定平台指定
  • Created
  • Updated
  • Removed
  • OwnerModified : 对象的拥有者变化,常见于 *uix 系统;
  • AttributeModified: 对象属性发生变化
  • MovedFrom
  • MovedTo
  • ……

每个变动事件可能包含有多个变动标志。

on_file_changed 第一层循环用来遍历所有事件,输出每个对象变动路径、时间。其中用到 纯C(不要加 std::)的,C11 才支持安全的时间转换函数 localtime_s 和 C++ 输出的扩展的格式操控符:put_time() 注意操控符并不返回字符串。

有关 C++ 流与操控符(比如,如何自定义一个输入或输出流操控符),可学习 《C++“流”编程视频辅导》。

第二层循环输出当前事件的所有标志,其中用到 fsw_get_event_flag_name()以获取指定标志值对应的英文名称。

4. 补充

4.1 场景补充

许多问题,确实可以通过这个“消息队列”轻松实现,除视频中提到的给用户发送通知邮件之外,还有如下场景可考虑使用:

  • 用户上传文件内容审核:某网站系统,允许用户发表带图的文章,需要对图片或文章的文字内容做安全审核;
  • 线上系统自动源代码编译:程序员使用 git 等工具,将相关模块的源代码上传到服务器上并触发自动编译;
  • 数据采集与比对系统:为了稳定性,很多监控系统会划分成数据采集与数据比对两个独立的子进程。

4.2 细节补充

“封包” 文件:很多时候,接收方发现出现一个新增的文件,并不能直接开始读取它,因为此时发送方可能还在往该文件中写入数据。此时有两种经典解决方法。

  • 方法一:要求发送方以独占模式打开文件,对应的,接收方尝试也以独占模式打开,这样后者将失败,从而避免双方同时处理(哪怕一写一读);
  • 方法二:双方约定特定文件名称(通常是扩展名)为 “封包”文件。比如,约定 .seal为封包文件的扩展名。则当发送方先生成 a.dat 文件,再生成名为 a.dat.seal 的封包文件(通常是一个零字节文件);接收方仅在发现后者之后,才开始处理 a.dat(并在处理结束后,删除封包文件)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/970864.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

华为云kubernetes基于keda自动伸缩deployment副本(监听redis队列长度)

1 概述 KEDA&#xff08;Kubernetes-based Event-Driven Autoscaler&#xff0c;网址是https://keda.sh&#xff09;是在 Kubernetes 中事件驱动的弹性伸缩器&#xff0c;功能非常强大。不仅支持根据基础的CPU和内存指标进行伸缩&#xff0c;还支持根据各种消息队列中的长度、…

解锁机器学习核心算法 | 决策树:机器学习中高效分类的利器

引言 前面几篇文章我们学习了机器学习的核心算法线性回归和逻辑回归。这篇文章我们继续学习机器学习的经典算法——决策树&#xff08;Decision Tree&#xff09; 一、决策树算法简介 决策树算法是一种典型的分类方法&#xff0c;也是一种逼近离散函数值的方法。它的核心思想…

CRISPR spacers数据库;CRT和PILER-CR用于MAGs的spacers搜索

iPHoP&#xff1a;病毒宿主预测-CSDN博客 之前介绍了这个方法来预测病毒宿主&#xff0c;今天来介绍另一种比较用的多的方法CRISPR比对 CRISPR spacers数据库 Dash 在这可以下载作者搜集的spacers用于后期比对 CRT和PILER-CR 使用 CRT 和 PILERCR 识别 CRISPR 间隔区&#x…

TestHubo基础教程-创建项目

TestHubo是一款国产开源一站式测试工具&#xff0c;涵盖功能测试、接口测试、性能测试&#xff0c;以及 Web 和 App 测试&#xff0c;可以满足不同类型项目的测试需求。本文将介绍如何快速创建第一个项目&#xff0c;以快速入门上手。 1、创建项目 在 TestHubo 中&#xff0c;…

多模态基础模型第二篇-deepseek-r1部署

分别使用本地windows和云端linux进行部署&#xff0c;测试不同硬件资源的模型推理性能&#xff1a; windos部署&#xff1a;直接打开Download Ollama on Linux 下载&#xff0c;然后本地启动服务&#xff0c; linux部署&#xff1a;curl -fsSL https://ollama.ai/install.sh …

本地 Ollama 部署 Deepseek R1 并使用 Spring AI Alibaba 构建 Chat 应用示例

本地部署 Deepseek R1 并使用 Spring AI Alibaba 构建 Chat 应用示例 Ollama 部署 Deepseek R1 官网&#xff1a;https://www.deepseek.com/ Github&#xff1a;https://github.com/deepseek-ai Ollama&#xff1a;https://ollama.com/ Docker Compose 部署一个 Ollama 和…

【TI C2000】F28002x的系统延时、GPIO配置及SCI(UART)串口发送、接收

【TI C2000】F28002x的系统延时、GPIO配置及SCI&#xff08;UART&#xff09;串口发送、接收 文章目录 系统延时GPIO配置GPIO输出SCI配置SCI发送、接收测试附录&#xff1a;F28002x开发板上手、环境配置、烧录及TMS320F280025C模板工程建立F28002x叙述烧录SDK库文件说明工程建…

LabVIEW中的icon.llb 库

icon.llb 库位于 C:\Program Files (x86)\National Instruments\LabVIEW 2019\vi.lib\Platform 目录下&#xff0c;是 LabVIEW 系统中的一个重要库。它的主要功能是与图标相关的操作&#xff0c;提供了一些实用的 VI 用于处理 LabVIEW 图标的显示、修改和设置。通过该库&#x…

C语言-章节 1:变量与数据类型 ——「未初始化的诅咒」

在那神秘且广袤无垠的「比特大陆」上&#xff0c;阳光奋力地穿过「内存森林」中错综复杂的代码枝叶缝隙&#xff0c;洒下一片片斑驳陆离、如梦似幻的光影。林间的空气里&#xff0c;弥漫着一股浓郁的十六进制锈蚀味&#xff0c;仿佛在诉说着这片森林中隐藏的古老秘密。 一位零基…

Dest1ny漏洞库:用友 U8-CRM 系统 ajaxgetborrowdata.php 存在 SQL 注入漏洞

大家好&#xff0c;今天是Dest1ny漏洞库的专题&#xff01;&#xff01; 会时不时发送新的漏洞资讯&#xff01;&#xff01; 大家多多关注&#xff0c;多多点赞&#xff01;&#xff01;&#xff01; 用友U8-CRM系统ajaxgetborrowdata.php存在SQL注入漏洞&#xff0c;文件多…

全平台搭载旭日5!科沃斯GOAT智能割草机器人全新系列正式开售

要闻 近日&#xff0c;科沃斯全新发布的GOAT A Series 和 GOAT O Series割草机器人&#xff0c;将在多国市场正式上市发售。作为业界最强的割草机器人产品之一&#xff0c;GOAT致力为割草机带来基于机器人视觉的专业定位解决方案。科沃斯GOAT全新系列产品全平台搭载地瓜机器人…

HCIA综合项目之多技术的综合应用实验

十五 HCIA综合实验 15.1 IP规划 #内网分配网段192.168.1.0 24#内网包括骨干链路和两个用户网段&#xff0c;素以需要划分三个&#xff0c;借两位就够用了192.168.1.0 26--骨干192.168.1.64 26---R1下网络192.168.1.128 26---R2下网络192.168.1.192 26--备用​192.168.1.64 26--…

PbootCMS增加可允许上传文件类型,例如webp、mov等文件格式扩展

在PbootCMS日常使用过程中&#xff0c;会涉及一些非常见的文件格式上传。 这时候就需要在PbootCMS配置文件中追加一些允许上传文件扩展名。 操作步骤 1、打开/config/config.php文件&#xff0c;大约在30行&#xff0c;修改upload配置信息&#xff1a; // 上传配置upload &…

DeepSeek应用——与PyCharm的配套使用

目录 一、配置方法 二、使用方法 三、注意事项 1、插件市场无continue插件 2、无结果返回&#xff0c;且在本地模型报错 记录自己学习应用DeepSeek的过程&#xff0c;使用的是自己电脑本地部署的私有化蒸馏模型...... &#xff08;举一反三&#xff0c;这个不单单是可以用…

本地快速部署DeepSeek-R1模型以及可视化工具

这里写目录标题 安装 Ollama下载和部署DeepSeek模型可视化工具 安装 Ollama Ollama 是一个轻量级的可扩展框架&#xff0c;用于在本地计算机上构建和运行语言模型。它提供了一个用于创建、运行和管理模型的简单 API&#xff0c;以及一个可在各种应用程序中轻松使用的预构建模型…

hive高频写入小数据,导致hdfs小文件过多,出现查询效率很低的情况

问题描述 hive高频写入小数据&#xff0c;导致hdfs小文件过多&#xff0c;出现查询效率很低的情况分析过程 先复现现象 select count() from ads.ads_sdd_flow_managemlt_to_ids_mm;–15分钟&#xff0c;小文件10983 select max(mm) from ads.ads_sdd_flow_managemlt_to_ids…

Docker 部署 MySQL 8 详细图文教程

&#x1f680; 作者主页&#xff1a; 有来技术 &#x1f525; 开源项目&#xff1a; youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template &#x1f33a; 仓库主页&#xff1a; GitCode︱ Gitee ︱ Github &#x1f496; 欢迎点赞 &#x1f44d; 收藏 ⭐评论 …

Pythong 解决Pycharm 运行太慢

Pythong 解决Pycharm 运行太慢 官方给Pycharm自身占用的最大内存设低估了限制,我的Pycharm刚开始默认是256mb。 首先找到自己的Pycharm安装目录 根据合适自己的改 保存&#xff0c;重启Pycharm

图像生成GAN和风格迁移

文章目录 摘要abstract1.生成对抗网络 GAN1.1 算法步骤 2.风格迁移2.1 损失函数2.2 论文阅读2.2.1 简介2.2.2 方法2.2.3 实验2.2.4 结论 3.总结 摘要 本周学习了生成对抗网络&#xff08;GAN&#xff09;与风格迁移技术在图像生成中的应用。首先介绍了GAN模型中生成器与判别器…

three.js+WebGL踩坑经验合集(8.1):用于解决z-fighting叠面问题的polygonOffset远没我们想象中那么简单

初八开工后&#xff0c;笔者又停了下来&#xff0c;今天总算又抽出来了一丢丢的时间继续。今天打算给大家聊聊困扰很多3D开发者的z-fighting叠面闪烁问题。 该问题从严格意义上说&#xff0c;是属于业务问题&#xff0c;因为现实中是不会有完全重叠的两个平面物体存在&#xf…