1、GPT4o 最大的特性是对话响应速度很快
端到端能力300ms;之前是语音转成文字,再来理解分析;现在是直接端到端。
1)丰富的语音风格
2)理解语音内外的内容
3)发出非语音的声音
4)自然而及时的互动
5)慢、无法理解情绪、不自然
2、情绪价值,根据情绪价值调整;
3、强大的上下文理解能力;
4、深度抽象negligence,包括逻辑能力、知识、抽象能力
5、千问2.0,MOE架构,给大模型减分;通过专家选择,减少参数;中文最强;侧重RAG
6、GLM4.0,开始向多模态发展,文字+图,
7、GLM4.0 采用半精度FP8训练
今年开始专向小模型发挥极致,尤其显卡不好买的情况下;
1) RAG最需要的就是大模型的长文本能力,
2)强调了智能体,发力智能体,很不错的;
3)调用工具的能力,发布了多模态模型,如阅读理解;图文问答的能力;不但理解公式、还知道公式是干吗用的;
4)网页解析的能力,换一个网页转成html文件;]
======================PPT素材==================