20240629 每日AI必读资讯

🚀 Google 深夜突袭,Gemma 2 狂卷 Llama 3

- Gemma2性能超越Llama3,提供9B和27B版本,性能接近70B模型但大小仅为其40%

- Gemma2支持高效推理,单个GPU即可实现全精度推理,广泛的硬件支持

- Gemma2兼容多种AI框架,提供实际应用示例和指南,谷歌计划支持通过Google Cloud Vertex AI轻松部署

🔗 https://aistudio.google.com/app/prompts/new_freeform

🔗 Google 深夜突袭,Gemma 2 狂卷 Llama 3-CSDN博客 

🤖硅基智能开源其AI数字人交互平台 

- 可以轻松创建逼真数字人

- 提供了很完善的工具和支持,部署过程变得非常简单和低成本。

- 功能支持:

语音识别:高效的语音输入,支持多种语言和口音。

语音合成:生成自然流畅的语音输出

实时交互:支持与用户的即时互动,提供快速响应。

多终端支持:可在Android和iOS设备上轻松部署,扩大使用场景。

模型下载:提供多个数字人模型的下载和使用,无需训练,即可使用。

🔗GitHub:https://github.com/GuijiAI/duix.ai
🔗在线体验:https://apps.apple.com/us/app/duix-your-ai-companion/id6451088879 

📢和 GPT 4o 匹敌 世界上最快的语音机器

- 能实现500毫秒的语音到语音响应 接近人类对话的自然速度

- 为达到这种低延迟,开发团队优化了网络架构、AI模型性能和语音处理逻辑。

- 使用WebRTC网络发送音频,部署了Deepgram的快速转录和语音生成模型,并将所有AI模型在Cerebrium的容器中自托管,以减少延迟。

🔗在线体验:https://fastvoiceagent.cerebrium.ai

🌐ToucanTTS:支持超过 7000 多种语言的TTS模型

- 斯图加特大学自然语言处理研究所(IMS)开发了一个超全文本转语音模型ToucanTTS。

- 支持几乎所有的 ISO-639-3 标准语言,这意味着它理论上可以支持超过 7000 种语言。是目前支持语言种类最多的 TTS 模型。

- 支持多说话人语音合成功能,可以模拟不同说话人的节奏、重音和语调。这对于需要风格多样性和语音自定义的应用非常有用。

- 还允许用户控制语音的多个参数,包括音调、语速、情感等。

🔗GitHub:https://github.com/DigitalPhonetics/IMS-Toucan
🔗在线演示:https://huggingface.co/spaces/Flux9665/MassivelyMultilingualTTS
🔗数据集:https://huggingface.co/datasets/Flux9665/BibleMMS

🔧Resemble AI发布AI音频检测模型Detect-2B 准确率达到 94%

- Detect-2B是下一代深度伪造检测模型,准确率达94%。

- 使用预训练的子模型和微调来检查音频片段,判断是否由AI生成。

- 模型架构基于随机概率模型,在不同语言的深度伪造音频检测上表现出色。

- DETECT-2B 适用于需要检测深度伪 造音频的场景,可以帮助用户识别并防范 AI 生成的欺诈音频。

🔗 https://top.aibase.com/tool/detect-2b

🚩不靠谱?热门AI搜索工具Perplexity被指引用错误信息

- Perplexity被曝引用错误的AI生成垃圾信息,来自可疑的博客和LinkedIn文章。

- GPTZero发现Perplexity链接的来源中有越来越多是AI生成的,Perplexity有时会使用这些来源中的过时和不正确信息。

- Perplexity声称答案来自“可靠来源”,AI算法是否真的能从好的信息中获取好的信息值得怀疑。

🎨Viggle推出Move功能:可保留照片的原始背景 无需额外编辑

- 保留原始背景: "Move"功能与之前限制在绿色和白色背景的功能不同,保留照片原始背景,无需额外编辑。

- 易于访问:用户只需访问https://viggle.ai 即可使用新功能。

- 无需复杂编辑:直接上传照片,轻松为其添加动画效果,无需繁琐后期处理。

🔗 https://viggle.ai

🔗 https://blink.csdn.net/details/1744090

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/753460.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ImageMasking-对图片做随机遮掩/块遮掩

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言从ipynb文件入手带注释的python文件modulesmask.pyutils.py 前言 1.可以去github直接下载这个项目,这样下载得到的是比较干净的版本,我把有注释的按…

pgsql的套接字文件不存在

问题:psql: error: connection to server on socket "/tmp/.s.PGSQL.5432" failed: No such file or directory 解决方式: 检查 postgresql.conf 文件中的 unix_socket_directories 设置,确保它包含 /tmp 或者你期望的目录。 重…

Hadoop3:MapReduce中的Reduce Join和Map Join

一、概念说明 学过MySQL的都知道,join和left join 这里的join含义和MySQL的join含义一样 就是对两张表的数据,进行关联查询 Hadoop的MapReduce阶段,分为2个阶段 一个Map,一个Reduce 那么,join逻辑,就可以…

卸载 ubuntu-wsl2-systemd-script,使用 WSLg 图形用户界面

目录 全新安装 - 以前没有安装 WSL现有 WSL 安装卸载 ubuntu-wsl2-systemd-script使用 Linux GUI参考链接在 Windows 上使用 Linux 开发环境,最好的做法是使用 WSL2。在 WSL 和早期的 WSL2 版本中,并不支持图形用户界面。因此如果想要使用 GUI 程序,需要自行解决。具体方法可…

游戏AI的创造思路-技术基础-深度学习(3)

继续填坑,本篇介绍深度学习中的长短期记忆网络~~~~ 目录 3.3. 长短期记忆网络(LSTM) 3.3.1. 什么是长短期记忆网络 3.3.2. 形成过程与运行原理 3.3.2.1. 细胞状态与门结构 3.3.2.2. 遗忘门 3.3.2.3. 输入门 3.3.2.4. 细胞状态更新 3.…

一个分析电路图的好助手

GPT。 最进分析电路图的时候发现GPT支持读取图片功能: 还别说,分析的很有道理。 此外,它还可以分析芯片的引脚功能,辅助电路分析: AB胶:粘的非常牢固,需要A和B两种胶混合使用。

有兄弟对这类区域比较感兴趣,也引起我的好奇,我提取出来给大家看看

要说这类地区,亚洲泰国排第二估计没人敢说第一吧,所以我就提取泰国的数据给大家看看! 如图:这些特殊服务地区主要集中在曼谷和芭提雅地区,芭提雅最多!看来管理还是不错的,限制在一定范围&#x…

php composer 报错

引用文章: Composer设置国内镜像_composer 国内源-CSDN博客 php composer.phar require --prefer-dist yiidoc/yii2-redactor "*" A connection timeout was encountered. If you intend to run Composer without connecting to the internet, run the …

汉江师范学院2024年成人高等继续教育招生简章

汉江师范学院,这所承载着深厚文化底蕴和学术积淀的高等学府,即将在2024年迎来新一季的成人高等继续教育招生。这不仅是一次知识的盛宴,更是对每一位怀揣梦想、追求进步的成年人的诚挚邀请。 汉江师范学院,以其严谨的教学态度、卓…

老师如何发布学校分班情况?

随着新学期的临近,许多老师可能都会回想起过去那些忙碌的日子,他们不得不面对一堆学生名单,手动进行班级分配,然后逐一通知家长和学生,这种工作不仅繁琐而且容易出错,让人倍感压力。 然而,今天我…

真正的IDEA在线版有多好用

前言 在上一篇文章使用过TitanIDE的VS Code在线版以后,尝到了不少甜头,紧接着又去使用了他的在线版IntelliJ IDEA,同样非常惊艳,不需要任何时间去适应这款云原生开发工具,事不宜迟,马上开整 这才是真正的VS Code在线版…

9种慢慢被淘汰的编程语言...【送源码】

技术不断进步,我们使用的编程语言也不例外。 随着人工智能的兴起以及对编程语言使用的影响,我们更加关注哪些语言将在未来继续流行,哪些会被淘汰。 Python、Java 和 JavaScript 等多功能编程语言正在主导市场,而其他一些语言则逐…

第 1 章SwiftUI 简介

在 2019 年的 WWDC 上,Apple 宣布推出一款名为 SwiftUI 的全新框架,令开发者们大吃一惊。该框架不仅改变了开发 iOS 应用的方式,还代表了自 Swift 首次亮相以来 Apple 开发者生态系统最重大的转变。SwiftUI 适用于所有 Apple 平台,包括 iPadOS、macOS、tvOS 和 watchOS,这…

REST API 中的 HTTP 请求参数

当我们在谈论现代 Web 开发时,REST API (Representational State Transfer Application Programming Interface) 扮演着至关重要的角色。它允许不同的系统以一种简洁且高效的方式进行通信。HTTP 请求参数是控制此通信流程中数据如何被发送和接收的重要组成部分。 H…

加密教程:pdf怎么加密?7个pdf加密技巧任你选(图文详解)

pdf作为一种便携式文档,是展示内容的首选格式,目前也已广泛应用于交换和分享重要等温,例如内部报告、人力资源文件,以及商业提案等包含敏感信息的文档。然而,在如今的数字化时代,随着越来越多的企业将其文档…

mfc140.dll怎么安装?mfc140.dll丢失安装详细解决方法

当电脑出现找不到mfc140.dll丢失问题,我们需要怎么办?怎么解决mfc140.dll丢失问题?mfc140.dll到底是什么?下面我给大家详细介绍与分析,最重要的是mfc140.dll的解决方法! 一、文件丢失原因分析 在分析mfc14…

golang 获取系统的主机 CPU 内存 磁盘等信息

golang 获取系统的主机 CPU 内存 磁盘等信息 要求 需要go1.18或更高版本 官方地址:https://github.com/shirou/gopsutil 使用 #下载包 go get github.com/shirou/gopsutil/v3/cpu go get github.com/shirou/gopsutil/v3/disk go get github.com/shirou/gopsuti…

PIP安装Python扩展包超时解决办法-国内镜像

问题描述 使用pip安装Python扩展包经常超时,无法安装 解决方法 使用清华大学镜像: https://pypi.tuna.tsinghua.edu.cn/simple/ 使用方法:以openpyxl为例 原来:pip install openpyxl 现在:pip install -i https…

Git与GitLab的企业实战--尚硅谷git课程

Git与GitLab的企业实战 第1章 Git概述 Git是一个免费的、开源的分布式版本控制系统,可以快速高效地处理从小型到大型的各种项目。 Git易于学习,占地面积小,性能极快。 它具有廉价的本地库,方便的暂存区域和多个工作流分支等特性…

IEEE JSTSP综述:从信号处理领域分析视触觉传感器的研究

触觉传感器是机器人系统的重要组成部分,虽然与视觉相比触觉具有较小的感知面积,但却可以提供机器人与物体交互过程中更加真实的物理信息。 视觉触觉传感是一种分辨率高、成本低的触觉感知技术,被广泛应用于分类、抓取、操作等领域中。近期&a…