碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

855e5b2fa7d17fd623ced0899f0bc2ef.jpeg

作者:HelloGitHub-小鱼干

这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ 的 star,而上周开源不到 48 小时获得 35k+ star 的推特推荐算法,本周也成功突破 50k+ 关卡。

依旧是 AI 热度不减的一周,本周的 AI 专场收录了一个离线生图工具,以及一个自托管 AI 编程助手。此外,还有 Meta 开源出来的重构版构建系统 buck2 也是大受欢迎,还有随着各类 AI 工具火起来的向量数据库,weaviate 也小小地展露了下头角。

还有比较少见的工具类应用,一款极简的输入法 rime-ice 也值得一看。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知 🌝

3e3e7109e9b995753acc4233c2c5f44b.png

1. 本周特推

1.1 AI 专场

在这波 AI 热度消退之前,热点趋势的特推部分会增加一个模块来分享新的 AI 应用。

macOS 跑 SD:MochiDiffusion

主语言:Swift

New MochiDiffusion 内置 Apple 的 Core ML Stable Diffusion 框架,以实现在搭载 Apple 芯片上用极低的内存占用发挥出模型最优性能。部分特性:

  • 可离线生图

  • 高性能,极低的内存占用

  • 图转图,Image2Image

  • 自定义 Stable Diffusion Core ML 模型

  • 无需担心损坏模型

GitHub 地址→https://github.com/godly-devotion/MochiDiffusion

5945233bd313c1acac277072458e86f4.png

自托管 AI 编程助手:tabby

主语言:Python、TypeScript

New 自托管的 AI 编程助手,可作为 Copilot 的替代品。特性:

  • 无需数据库和云服务;

  • 具有可视化、配置模型和 MLOps 的 Web 界面;

  • 接入 OpenAPI;

  • 消费级别的 GPU 支持(用不同方法优化的 FP-16 权重加载)

GitHub 地址→https://github.com/TabbyML/tabby

77f7cf84edda518dc7a8148c2cb1d123.gif

1.2 Meta 开源构建系统:buck2

主语言:Rust

Meta 开源的大规模构建系统 buck2 继承于 buck1,但是不同于 buck1 采用 Java 编写,buck2 由 Rust 编写而成。重构 buck1 的想法源自想要提供更快速、更高效的构建服务,buck2 有以下特性:

  • 解耦特定语言规则,buck2 的核心构建系统没有任何特定的语言规则,这意味着它有更好的可扩展性。buck2 核心部分用 Rust 编写,语言规则部分(例如:如何构建 C++)由 Starklark 编写;

  • 构建系统由单一增量依赖图提供支持,由此消减多类 bug 并增加并发性;

  • 规则 API 的设计主要为提供先进的性能特性,以及动态依赖特征;

  • 集成远程执行,能在远程机器执行操作,它采用了同 Bazel 一样的 API,并已经用 Buildbarn 和 EngFlow 进行远程执行测试;

  • 集成虚拟文件系统,不用整仓检测,按需获取文件即可;

GitHub 地址→https://github.com/facebook/buck2

c49912aecbaa462497c39dc6e51f7b42.jpeg

2. GitHub Trending 周榜

2.1 嵌入式数据库:chroma

本周 star 增长数:1,200+主语言:Python、TypeScript

Chroma 是一个用于 Python / JavaScript LLM 应用程序的嵌入式数据库,它具有内存快速访问的优势。它只有 4 个核心函数:

import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()

# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents") 

# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
    documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
    ids=["doc1", "doc2"], # unique for each doc 
)

# Query/search 2 most similar results. You can also .get by id
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

GitHub 地址→https://github.com/chroma-core/chroma

bb067a666e7949b6fb0be008b30d5212.png

2.2 万物皆可分:segment-anything

本周 star 增长数:18,000+主语言:Jupyter Notebook

New 这个代码库提供了使用 SegmentAnything 模型(SAM)进行推理的代码,SAM 是一种输入诸如点、框等 prompt 生成高质量目标 mask 的模型,它有非常出彩的标记效果。btw,项目开源不到一周已经有 18k+ star。

GitHub 地址→https://github.com/facebookresearch/segment-anything

2746dffe070d2a8aac0e67129d0210bb.png

2.3 流处理:arroyo

本周 star 增长数:700+主语言:Rust、TypeScript

New arroyo 是一个 Rust 编写的分布式流处理引擎,旨在高效地对流数据进行状态计算。与传统的批处理不同,流处理引擎可以处理有界和无界数据源,一旦结果可用就立即输出。

GitHub 地址→https://github.com/ArroyoSystems/arroyo

587a46999ceba197bd796ef3a1c2e636.png

2.4 极简输入法:rime-ice

本周 star 增长数 1,850+主语言:Go、Lua

雾凇拼音一个极简风的输入法,支持简体、全拼、双拼。值得一提的事,作者自己维护了一个词库:

  • 8105 字表

  • base 基础词库

  • sogou 搜狗流行词

  • ext 扩展词库,小词库

  • tencent 扩展词库,大词库

  • Emoji

GitHub 地址→https://github.com/iDvel/rime-ice

23f21d77d37c4c114bb1e6200d1ca24b.jpeg

2.5 向量数据库:weaviate

本周 star 增长数:500+主语言:Go

Weaviate 是一个开源的向量数据库,可以存储对象和向量,允许将向量搜索与结构化过滤相结合,并具有云原生数据库的容错性和可扩展性,可通过 GraphQL、REST 和各种语言客户端进行访问。

GitHub 地址→https://github.com/weaviate/weaviate

9b316770a91260bf4fb7c68474813296.gif

3. HelloGitHub 热评

在这个章节,我们将会分享下本周 HelloGitHub 网站上的热评项目,HG 开源项目评价体系刚上线不久,期待你的评价 :D

3.1 GIF 录屏工具:ScreenToGif

主语言:C#

一款 Windows 上的免费 GIF 录屏工具,易安装、好上手,支持录制指定区域画面,且可以将视频导出为 gif 等文件格式。

bf33efb925681d80d068337d16342757.jpeg

3.2 Nginx 可视化管理平台:nginx-proxy-manager

主语言:JavaScript

它开箱即用,支持 Docker 一键部署,可以让用户通过 Web 界面在线配置、管理 Nginx 服务,支持转发、重定向、SSL 证书、高级配置等功能。

93b46f53ba0441aefd38bd44e9b9d079.jpeg

4. 往期回顾

往期回顾:

  • Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」

  • 开源不到 48 小时获 35k star 的推荐算法「GitHub 热点速览」

以上为 2023 年第 14 个工作周的 GitHub Trending 🎉如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和大家一起分享下哟 🌝

HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~

- END -

👆 关注「HelloGitHub」收到第一时间的更新👆

点击阅读原文访问社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/7982.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VSCode+PyQt之Python界面编写

环境配置 1、python3.9 2、安装库 pip install PyQt5 pip install PyQt5-tools3、选择python解释器 4、在VSCode里下载并安装PYQT Integration 5、配置pyqt integration 5.1 将下面改为:D:\ProgramFiles\Python39\Scripts\pyuic5.exe 5.2 将下面的改为&#xff…

Kafka 入门篇(三)

文章目录 提交和偏移量的概念特殊偏移自动提交提交当前偏移量异步提交同步和异步组合提交提交特定的偏移量提交和偏移量的概念 特殊偏移 我们上面提到,消费者在每次调用poll() 方法进行定时轮询的时候,会返回由生产者写入 Kafka 但是还没有被消费者消费的记录,因此我们可以…

ccc-pytorch-宝可梦自定义数据集实战-加载数据部分(9)

文章目录第一步:构建路径与种类的映射关系第二步:载入所有的宝可梦图像第三步:打散顺序并通过路径名提取映射关系构建映射文件第四步:完善选取、获取图片信息功能并可视化第五步:对数据进行预处理第六步:批…

【李宏毅】深度学习——HW4-Speaker Identification

Speaker Identification 1.Goal 根据给定的语音内容,识别出说话者是谁 2.Data formats 2.1data directory 目录下有三个json文件和很多pt文件,三个json文件作用标注在下图中,pt文件就是语音内容。 mapping文件 metadata文件 n_mels:Th…

飞桨EasyDL落地三大工业场景,工业AI赋能产业升级

数智化时代,如何利用人工智能实现传统生产方式的转型升级,成为摆在每个工业制造企业的一道必答题。工业生产、质检、管理等环节,持续产生海量数据。以机器视觉为代表的AI技术,广泛应用在3C电子、快消品制造、汽车零部件制造等多个…

指令系统和寻址方式

文章目录指令系统指令的基本格式扩展码指令格式指令的操作类型指令的寻址方式指令寻址数据寻址隐含寻址立即寻址直接寻址间接寻址寄存器寻址寄存器间接寻址相对寻址基址寻址变址寻址堆栈寻址使用场景PSW小结程序的机器级代码表示CISC和RISC刷题小结指令系统 指令:计…

Revit插件 | 建模助手2023年度版本大更新,就是这么懂你

​大家好,本期是懂你的建模助手。 从去年开始,建模助手几乎每个月都会有大大小小的活动,目的是让大家用最低的成本尝试极棒的建模体验!强行挽尊ing 但作为一支很pro的团队,单一地搞活动肯定不行滴,还得在…

Python SMTP发送邮件和线程

文章目录一、Python SMTP发送邮件二、Python3 多线程总结一、Python SMTP发送邮件 SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。 python的smtplib提供…

使用ChatGPT帮助我们编码的10种场景

文章目录1、技术搜索2、生成常用工具函数3、帮助解读代码4、添加注释5、优化代码6、Vue2 转 Vue37、Vue 转 React8、补充 TypeScript 类型9、生成文档10、工具配置总结ChatGPT 的出现,彻底改变的很多代码开发的方式,特别是通用型的代码,使用它…

基于公私密钥的单点登录

目前已知的单点登陆方式有: 多个系统集群 建立一个SSO认证中心,用户只需要登录一次就可以访问所有相互信任的应用系统。 1、可以通过session广播机制实现:在一个集群中的一个模块登录后,然后把这个session复制n份,发…

JUC-01 线程的创建和状态转换

本次我们主要讲三个问题 线程是什么?线程有哪些状态?各状态间的转换了解吗?创建线程的3种方法你都了解吗? 1. 线程是什么?(了解即可) 进程: 进程是一个具有一定独立功能的程序在一…

计算机网络考试复习——第一章 1.7

1.7 计算机网络体系结构 两台计算机要互相传送文件需解决很多问题: (1) 必须有一条传送数据的通路。 (2) 发起方必须激活通路。 (3) 要告诉网络如何识别接收方。 (4) 发起方要清楚对方是否已开机,且与网络连接正常。 (5) 发起方要清楚对方是否准备好接收和存储文件…

数据结构——栈与队列相关题目

数据结构——栈与队列相关题目232. 用栈实现队列思路225. 用队列实现栈1.两个队列实现栈2.一个队列实现栈20. 有效的括号思路1047. 删除字符串中的所有相邻重复项思路155. 最小栈150. 逆波兰表达式求值思路239. 滑动窗口最大值单调队列347. 前 K 个高频元素思路232. 用栈实现队…

2023版Postman接口测试使用全指南(原来使用 Postman测试API接口如此简单)

下面是一篇详细介绍postman接口测试的文章,如果文章内容不太明白的话, 我建议看看视频版本,更加清洗,更加直观! 最详细的postman接口测试实战教程_哔哩哔哩_bilibili最详细的postman接口测试实战教程共计129条视频&am…

ToBeWritten之ARM汇编基础铺垫

也许每个人出生的时候都以为这世界都是为他一个人而存在的,当他发现自己错的时候,他便开始长大 少走了弯路,也就错过了风景,无论如何,感谢经历 转移发布平台通知:将不再在CSDN博客发布新文章,敬…

FPGA解码4line MIPI视频 IMX291/IMX290摄像头采集 提供工程源码和技术支持

目录1、前言2、Xilinx官方主推的MIPI解码方案3、我已有的MIPI解码方案4、纯Vhdl代码解码MIPI5、vivado工程介绍6、上板调试验证7、福利:工程代码的获取1、前言 FPGA图像采集领域目前协议最复杂、技术难度最高的应该就是MIPI协议了,MIPI解码难度之高&…

关键词采集软件在SEO优化中的应用与效果

搜索引擎的优化被广泛认为是提高网站排名和在线可见性的重要方法之一。SEO人员需要进行大量的工作以确保网站的内容和标签可以被搜索引擎正确地解析和索引。在这项任务中,使用搜索引擎关键词采集软件可以帮助SEO人员完成许多繁琐的任务并简化他们的工作流程。在本文…

Linux 基础IO(Input与output)学习

进程间通信:讲的是操作系统为用户提供的几种进程间的通信方式概念:进程间通信其实就是多个进程之间进行数据交互问题:进程间通信为什么不能直接进行数据交互,需要使用系统提供的方式?原因:进程之间是具有独…

电动力学问题中的Matlab可视化

电磁场的经典描述 小说一则 电磁场的经典描述就是没有啥玩意量子力学的经典电动力学下对电磁场的描述,以后有空写个科幻小说,写啥呢,就写有天张三遇见了一个外星人,外星人来自这样一个星球,星球上的物质密度特别低,导致外星人的测量会明显的影响物质的运动,外星人不能同时得到…