大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
2024年3月25日,据多家媒体爆料,苹果公司将与百度展开合作,为苹果即将发布的iPhone16、Mac系统以及iOS18提供人工智能(AI)功能。
百度并不是唯一一家苹果接触的AI公司,据爆料苹果曾与阿里及另外一家国产大模型公司进行深入的探讨后,苹果最终选择百度作为其AI服务的提供商。这一决策的背后,是苹果为了满足中国市场的合规要求而做出的调整。由于苹果自身在短期内难以解决在中国的合规问题,因此决定在中国大陆销售的iPhone等设备中采用国产的AI模型,而国际版本的设备则继续使用苹果自家的AI技术。
此次合作的消息一经传出,立即在资本市场引起了积极反响。百度的港股股价应声上涨,最高涨幅达到了6.42%,成交额突破了8亿港元大关。
苹果公司此次采取的是通过API接口的方式进行计费,这不仅有助于提高用户体验,也使得AI服务的集成和更新更为灵活和高效。通过与百度的合作,苹果不仅能够更好地适应中国市场的法规环境,还能够借助百度在本土AI领域的实力,为苹果产品带来更加丰富和智能化的功能。这一合作对于百度而言,不仅是对其AI技术实力的肯定,也为公司带来了进一步扩大市场份额和提升品牌影响力的机遇。而对于苹果来说,这不仅是其在中国市场策略的一部分,也是其全球AI战略布局的重要一环。
文心大模型2023第三季度收入6.6亿元
百度创始人李彦宏在最近的财报会议上宣布,2023年第四季度,公司的AI大模型为云业务贡献了约6.6亿元人民币的收入。这一成绩标志着百度在AI领域十余年的长期投入开始收获回报。
尽管如此,百度的AI业务仍面临着一系列挑战。
-
用户投诉: 用户对文心一言4.0会员服务的投诉主要集中在服务质量和性价比上。付费用户期望通过升级获得更高质量的交互体验和更丰富的功能,但实际使用中发现与免费版本相比提升有限。此外,用户在遇到问题时,客服的响应速度和解决问题的能力未能满足他们的期待,这进一步加剧了用户的不满情绪。
-
市场份额挑战: 文心一言在市场份额上的竞争压力主要来自于其他国产大模型的产品,如阿里的通义千问、月之暗面的Kimi、字节跳动的豆包等。这些同样很优秀的国产大模型通过不断提升自身的产品和服务,提供更加多样化和即时的内容,以及更优质的用户体验,成功吸引了更多的活跃用户。文心一言需要不断创新和优化产品功能,以保持和提升其市场地位。
-
产品竞争力: 尽管文心一言在自然语言处理能力、智能化程度、自我学习能力等方面具有一定的优势,但在功能全面性、交互体验和内容更新速度方面,与市场上的其他免费工具相比,并没有形成明显的差异化优势。用户对产品的期望不断提高,对于功能单一、更新缓慢的产品可能会逐渐失去兴趣。
-
市场定位: 百度在B端大模型生意上的专注可能导致了对C端付费用户需求的忽视。在AI技术快速发展的今天,用户对产品的期望不仅仅是基础的问答功能,而是更加个性化、智能化的交互体验。百度需要重新审视文心一言的市场定位,更加关注C端用户的需求和体验,通过提供更具吸引力的功能和服务,来提升用户满意度和产品的市场竞争力。
苹果自研的AI技术
之前我写过一篇文章,叫:苹果AI新动向:隐秘收购与人才招募揭示其下一代AI技术布局。用一个词/短语来形容苹果自家的AI技术,可以说是“不谈AI,处处AI”。
早在2023年7月,苹果公司就被传出正在积极涉足生成式AI领域,并开发名为“Ajax”的大型语言模型。据知情人士透露,苹果的大语言模型Ajax GPT的训练参数数量超过2000亿,这可能使其在功能上超越了OpenAI的GPT-3.5。苹果公司计划将其大语言模型融入Siri产品,并设想过在手机端运行其大语言模型。此外,苹果计划将开发AI大模型的预算提高到每天数百万美元。苹果公司的AI大模型开发团队由多位技术大佬领导,包括参与创造Java的Arthur Van Hoff、苹果公司机器学习和AI战略高级副总裁John Giannandre、以及神经网络领域专家Ruoming Pang等。
2023年10月,在与哥伦比亚大学的研究人员合作中,苹果公司推出了名为Ferret的开源多模态大语言模型。Ferret模型的发布不仅包括了模型的代码,还提供了权重文件,但需要注意的是,这些资源仅限于研究和非商业用途。Ferret模型的特点在于其多模态能力,能够理解和处理图像以及与之相关的自然语言。它拥有两项核心能力:一是能够理解图片中任意形状的区域指定,二是能够准确定位图片中开集描述对应的物体。为了实现这些能力,Ferret采用了一种新的方法,联合离散坐标和连续特征来表示图片中的区域,并提出了空间感知的视觉采样器,可以处理不同形状的区域。此外,Ferret模型还构造了一个基于区域指定和定位的指令微调数据集GRIT,包含1.1M个拥有空间知识的样本。这使得模型不仅在经典的区域指定和定位任务中表现优异,而且在基于区域和定位需求的多模态聊天任务中也展现出了突出的性能。
今年3月14日,苹果公司的AI研究团队在ArXiv上发表了一篇名为《MM1:Methods, Analysis & Insights from Multimodal LLM Pre-training》的论文,介绍了名为“MM1”的多模态大模型。在模型架构上,MM1模型采用了MoE(Mixture of Experts)架构,这是一种混合专家模型架构,它将模型划分为多个专家子模型,每个子模型专注于处理特定类型的任务。MM1模型提供了30亿、70亿、300亿三种参数规模的版本,具备图像识别和自然语言推理能力。MM1模型的研究成果显示,图像分辨率和图像标记数量对模型性能有较大影响,而视觉语言连接器的影响较小。MM1模型在多个多模态基准测试中表现出色,尤其是在VQAv2、TextVQA、ScienceQA、MMBench、MMMU和MathVista等任务上。MM1模型的整体表现未能超越谷歌的Gemini和OpenAI的GPT-4V,但其在预训练指标中实现了相对优秀的性能表现,并在一系列基准上保持了竞争力。
精选推荐
-
完全免费白嫖GPT4的三个方法,都给你整理好了!
-
AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!
-
Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!
-
我用AI工具5分钟制作一个动画微电影!这个AI现在免费!
-
当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!
-
文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?
-
ChatGPT和文心一言哪个更好用?一道题告诉你答案!
-
字节推出了“扣子”,国内版的Coze,但是我不推荐你用!
-
白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt
-
2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。