Kimi Chat四大更新详细解读!模型能力提升,支持语音输入输出!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

Kimi Chat,slogan是“帮你看更的世界”,严格来说,应该是“帮你看更的世界”,毕竟Kimi是一款以上下文长度而闻名的AI工具,从最初的20万汉字到目前正在内测的200万汉字上下文。

Kimi Chat本身是国内AI领域的一股清流,因为它免费,能联网搜素,多端支持(网页、App、小程序),更有20万汉字的逆天上下文处理长度,但这里面却不包括模型“聪明”。所以,尽管月之暗面(Moonshot AI,开发Kimi Chat的公司)在全网猛砸广告做推广,在短期内让Kimi“爆火”,但时间一长,用户和从业者们还是会回归冷静,因为最基础的模型能力才是一款AI应用的立身之本。

Kimi官方显然也明白这一点。就在上周,Kimi Chat官宣四大更新,其中就包括“更强的模型能力”。

1. 更强的模型能力

Kimi Chat集成的是月之暗面(Moonshot AI)的自研LLM模型moonshot-v1。这次更新后,基础模型更新为moonshot-v1-20240416版本,据Kimi官方描述,该基础模型具有“Better, Faster, Stronger”的特点。

  1. 联网模式下的速度提升

    • Kimi在联网模式下的回答速度得到了显著提升。这意味着用户在提出问题后,将体验到更短的等待时间,从而获得更快速的响应。

  2. 逻辑推理能力增强

    • Kimi官方表示,更新后的Kimi在数学和编程领域的逻辑推理能力得到了加强。这项能力是在本质上对模型“智商”提升最大的,因为推理能力是解决复杂问题的核心要素。

  3. 翻译能力提升

    • Kimi的中英翻译能力得到了进一步的优化,提高了语言的准确性。对于翻译能力而言,词汇和短语的直接翻译固然重要,但模型对语言习惯、文化差异和上下文的理解同样很重要,后者能确保翻译后的文本自然流畅,更符合目标语言的表达习惯。

  4. 其他体验优化

    • 解决了之前版本中存在的一些问题,如单行数学公式的输出格式不稳定及部分场景下回答不够精炼的问题。

模型能力实测

还是以一道“简单”的逻辑推理问题来测试。大概一个月前,Kimi并未通过测试,今天我们再来试一试。

中文题目:如果一个房间里有1000本书,我读了2本,房间里还有多少本书?请简洁回答。

3月4日测试中Kimi Chat的回答

测试详情在这篇文章里:Claude 3有点东西!这个看似简单的问题只有GPT-4和Claude 3回答正确!通义千问和讯飞星火表现同样亮眼!。

今天(4月22日)测试中Kimi Chat的回答

房间里还有1000本书。

这个问题的表述可能有点误导性,因为通常当我们说“读了一本书”,这并不会影响房间里书的总数。“读了”这个动作并不会从物理上移除或消耗掉书籍,它只是意味着你已经阅读了书籍的内容。所以,即使你读了2本书,这2本书仍然存在于房间里,因此房间里的书的总数并没有因为阅读这个动作而减少。

因此,房间里的书的总数仍然是1000本,因为阅读书籍并不会改变房间内书籍的物理数量。

点评

我测试了多次,Kimi均正确地回答出了该问题。

2. 常用语功能

常用语”是我个人认为很实用的一个功能,它使得用户可以添加和定制自己的提示词,从而提高对话的效率和便捷性。Kimi推出这个功能旨在通过减少重复输入和快速引导期望输出来提升用户体验。此外,Kimi Chat官方提供了一个较为丰富的预设提示词库,覆盖了包括PPT制作、文案撰写、职业规划等多个场景,帮助用户在需要时快速获得灵感和指导。

关于这个功能的详细解读,我曾在这篇文章里写过: 跟着Kimi Chat学习提示工程Prompt Engineering!让AI更高效地给你打工!

放一个官方提供的提示词示例,小伙伴们可以感受一下。

【🎤 面试模拟】你的私人面试mock伙伴,根据简历信息和求职岗位进行模拟面试

你是一个性格温和冷静,思路清晰的面试官Elian。我将是候选人,您将对我进行正式地面试,为我提出面试问题。

  • 我要求你仅作为面试官回复。我要求你仅与我进行面试。向我提问并等待我的回答。不要写解释。

  • 像面试官那样一个接一个地向我提问,每次只提问一个问题,并等待我的回答结束之后才向我提出下一个问题

  • 你需要了解用户应聘岗位对应试者的要求,包括业务理解、行业知识、具体技能、专业背景、项目经历等,你的面试目标是考察应试者有没有具备这些能力

  • 你需要读取用户的简历,如果用户向你提供的话,然后通过询问和用户经历相关的问题来考察该候选人是否会具备该岗位需要的能力和技能

##注意事项:

  • 只有在用户提问的时候你才开始回答,用户不提问时,请不要回答

##初始语句:

""您好,我是您应聘岗位的模拟面试官,请向我描述您想要应聘的岗位,并给您的简历(如果方便的话),我将和您进行模拟面试,为您未来的求职做好准备!"

3. 语音输入和输出

在LLM模型相关的语境中,"多模态"(Multimodal)是经常被提起的一个词。具体说来,多模态就是指模型能够处理并理解多种不同类型的输入数据或信息,包括但不限于:

  1. 文本:自然语言文本。

  2. 图像:视觉内容,例如图片或视频帧中的物体、场景和活动。

  3. 音频:声音信号,识别语音或非语音音频。

  4. 视频:结合视觉和音频信息,模型能够理解和分析视频内容。

  5. 结构化数据:如表格、数据库条目等,模型能够解析和推理结构化信息。

Kimi本次的更新中就包括了这么一条“语音”输入和输出的支持。也就是,现在可以和Kimi Chat语音对话,它也能够把生成的内容以语音播报的形式读出来。

和ChatGPT一样,目前通过官方途径使用语音输入,只支持移动端,即App和小程序端,而网页端是不支持的。当然,ChatGPT网页端可以通过第三方插件使用语音输入的功能。

语音功能实测

小程序端

App端

操作简单,在文本输入框左边有一个语音按钮,点击后即可进入语音输入的模式。经过测试,Kimi Chat支持中文和英文语音输入,也支持语音输出,有点类似于ChatGPT的Text To Speech (TTS,文本转语音)功能。不足之处就是目前仅支持2种音色的切换,男生和女生。另外,朗读出的声音听起来机器味儿很浓,没有什么感情。

4. 增强搜索引用展示

这次更新中,Kimi Chat在网页版中新增了数字脚注功能,通过鼠标悬停展示原文段落和点击标题直接跳转原文链接的方式,目的是提升搜索结果的可追溯性和用户的交互体验。

在联网搜索的结果中,会直接将引用的来源以数字脚注的形式展示在回答里。

把鼠标悬停在数字脚注上时,会自动展示相关的引用信息。

总结

月之暗面官方终于开始重视起模型的基础能力了,毕竟这才是AI工具长期的核心竞争力


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/566417.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

clickhouse数据去重函数介绍(count distinct)

非精确去重函数:uniq、uniqHLL12、uniqCombined 精确去重函数:uniqExact、groupBitmap 测试数据量:2000w 结论: 1.整形值精确去重场景,groupBitmap 比 uniqExact至少快 2x 2.groupBitmap仅支持无符号整形值去重&#x…

【LAMMPS学习】八、基础知识(3.6)计算热导率

8. 基础知识 此部分描述了如何使用 LAMMPS 为用户和开发人员执行各种任务。术语表页面还列出了 MD 术语,以及相应 LAMMPS 手册页的链接。 LAMMPS 源代码分发的 examples 目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各…

我的一些 35+ 前同事的现状

大家好,我是坤哥,好久不见,今天简单和大家聊一下我目前观察到的前同事的现状 今年和一些前同事简单聊过,他们的现状如下: A: 去新西兰做 iOS 开发快 10 年了,马上就要拿到永久居留证了,他说在新…

hcip实验 — 路由策略实验

目录 实验拓扑 实验要求 实验思路 实验步骤 1.配置接口及环回ip 2.配置ospf协议及rip协议 3.在R2上进行路由引入 4.在R2上进行路由过滤 5.在R4上进行路由过滤(地址前缀列表) 6.在R2 RIP进程上配置静默接口使RIP报文无法进入OSPF区域 实验拓扑 …

Hadoop实战——MapReduce-字符统计(超详细教学,算法分析)

目录 一、前提准备工作 启动hadoop集群 二、实验过程 1.虚拟机安装先设置端口转发 2.上传对应文件 3.编写Java应用程序 4. 编译打包程序 5. 运行程序 三、算法设计和分析 算法设计 算法分析 四、实验总结 实验目的:给定一份英文文本,统计每个…

ResNet详解

一、认识ResNet ResNet(Residual Network)是一种深度神经网络结构,被广泛应用于图像分类、目标检测和语义分割等计算机视觉任务中。它是由微软亚洲研究院的何凯明等人于2015年提出的,通过引入残差连接(residual conne…

携程 Java 暑期实习一面:HashMap 的 key 可以设置为 null 吗?那 ConcurrentHashMap 呢?

更多大厂面试内容可见 -> http://11come.cn 携程 Java 暑期实习一面:HashMap 的 key 可以设置为 null 吗?那 ConcurrentHashMap 呢? Java 基础 1、Java 中有哪些常见的数据结构? 图片来源于:JavaGuide Java 中常…

【数学归纳法 反证法】菲蜀定理

裴蜀定理(或贝祖定理,Bzout’s identity)得名于法国数学家艾蒂安裴蜀,说明了对任何整数a、b和它们的最大公约 数d,关于未知数x和y的线性不定方程(称为裴蜀等式):若a,b是整数,且&…

C++异常和断言

C异常 异常的理念看似有前途&#xff0c;但实际的使用效果并不好。编程社区达成的一致意见是&#xff0c;最好不要使用这项功能。C98引入异常规范&#xff0c;C11已弃用。 例如&#xff1a;我们输入1时抛出异常。 #include <iostream> #include <vector> #includ…

macbook内存怎么清理?2024年有哪些好用的软件

当你的MacBook运行缓慢时&#xff0c;这很可能是因为内存&#xff08;RAM&#xff09;满了。内存是计算机的临时存储区&#xff0c;用于存放当前正在使用的程序和数据。当内存满时&#xff0c;MacBook就会使用硬盘作为临时内存&#xff0c;这大大降低了运行速度。那么&#xff…

Hadoop3:HDFS、YARN、MapReduce三部分的架构概述及三者间关系(Hadoop入门必须记住的内容)

一、HDFS架构概述 Hadoop Distributed File System&#xff0c;简称HDFS&#xff0c;是一个分布式文件系统。 1&#xff09;NameNode(nn)&#xff1a;存储文件的元数据&#xff0c;如文件名&#xff0c;文件目录结构&#xff0c;文件属性&#xff08;生成时间、副本数、文件…

基于Tensorflow完成mnist数据集的数字手写体识别

基于Tensorflow完成mnist数据集的数字手写体识别 关于知识背景CNNFCNN 关于数据集新的改变 关于知识背景 CNN 卷积神经网络&#xff08;Convolutional Neural Networks&#xff0c;简称CNN&#xff09;是一种具有局部连接、权值共享等特点的深层前馈神经网络&#xff08;Feed…

【CAD打开提示未处理异常C0000027(c0000027h)的两种解决方法。】

cad打开提示错误c0000027h的第一种解决方法 去掉区域里的beta语言勾选。 https://autodesk8.com/cad/86.html 如果第一种方法没解决&#xff0c;尝试第二种方法大概率能解决 点击autoremove的扩展功能&#xff0c;输入c0000027点击搜索&#xff0c;然后双击出现的这个按钮既可…

【AI开发:音频】一、GPT-SoVITS整合工具包的部署问题解决(GPU版)

前言 目前GPT-SoVITS的合成效果比较不错&#xff0c;相比较其他厂商的产品要规整的多。众多厂家中也是国内使用最多的一款了&#xff0c;并且这个整合包里携带了&#xff0c;除背景音、切割、训练、微调、合成、低成本合成等一些列完整的工具&#xff0c;也可以作为API进行使用…

近年数一,数二难度如何,听说24是像张宇那样的题?

直接上分数&#xff01; “估分一百零几&#xff0c;平时李林130-140&#xff0c;张八110-125的样子&#xff0c;超越做的分数也是100出头。” 24学长说&#xff1a; “远离李林张八&#xff01;张四没做不评价。” “李林张八暑假前做完当作打基础即可。超越才是真题难度”…

利用regress绘制拟合图,利用Slope的趋势分析(5)

code如下&#xff1a; % SCD,积雪日数 % SCS,积雪初日 % SCM,积雪终日% SCS SCD SCM clc; clear; % 读取 Excel 表 excel_file E:\work\2024年\April20\积雪作图\tif文件\excel表\SCS.xlsx; % Excel 文件路径 data readtable(excel_file);datavalue data{:,2:end}; year (…

【工具-pip】

工具-pip ■ pip-工具■ pip-安装■ pip-卸载■ pip-帮助■ pip- 批量安装库■ 批量卸载库■ 提高pip下载速度 ■ pip-工具 pip 是 Python 标准库中的一个包&#xff0c;这个包是用来管理 Python 第三方库。 通用的 Python 包管理工具。提供了对 Python 包的查找、下载、安装、…

【分治算法】Hanoi塔问题Python实现

文章目录 [toc]问题描述Python实现 个人主页&#xff1a;丷从心 系列专栏&#xff1a;Python基础 学习指南&#xff1a;Python学习指南 问题描述 设 a a a、 b b b、 c c c是三个塔座&#xff0c;开始时&#xff0c;在塔座 a a a上有一叠共 n n n个圆盘&#xff0c;这些圆盘…

设备运行远程监控系统

在信息化、智能化的浪潮下&#xff0c;设备运行远程监控系统已经成为企业提升运营效率、降低运营成本、保障生产安全的重要工具。HiWoo Cloud作为设备运行远程监控系统&#xff0c;以其卓越的性能和稳定的运行&#xff0c;赢得了众多企业的青睐。 一、设备运行远程监控系统的概…

动手学大模型应用开发--Chapter 03搭建并使用向量数据库

文章目录 前言一、学习目标二、学习知识点概要2.1 什么是词向量2.2 词向量的意义2.3 文本转为词向量的方法 三、总结四、引申阅读 前言 本学习笔记为datawhale动手学大模型应用开发的第三章&#xff0c;学习链接为&#xff1a; https://datawhalechina.github.io/llm-universe…