当地时间5月13日,OpenAI发布一款名为GPT-4o的新旗舰生成式AI模型,并计划在接下来的几周内“迭代”推出到公司产品中。
据介绍,GPT-4o的文本、推理、编码才能到达GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但本钱仅为GPT-4 Turbo的一半,视频、音频功用得到改善。
现场演示中,它的体现仿佛一个人正坐在旁边,和人类的对话节奏天然、和谐,彻底听不出是个AI,在短短232毫秒内,GPT-4o就能对音频输入做出反响,并且它能够将文本、音频、图像任何组合作为输入和输出。这意味着OpenAI朝着更天然的人机交互迈出了重要一步。
OpenAI创始人Altman表示,GPT-4o是OpenAI有史以来最好的模型,它很聪明,速度很快,是天然的多模态。
国盛证券研报认为,GPT-4o是迈向更天然的人机交互的重大前进,新功用带来了崭新的多模态交互才能,通过新的端到端模型完成了体会上的新突破,有望在各类终端完成用户体会的最大化,利好智能终端Agent、机器人等方向。
尽管多模态AI尚处于初期阶段,但已有多个模型开端出现。谷歌的 Gemini Ultra模型在多学科多模态理解和推理基准测验中超越了GPT-4,显示出多模态模型的潜力。 为了坚持竞争力,更多的大型言语模型开发者将跟进开发多模态功用。多模态AI预计将解锁新的商业机会,如Artera在医疗保健范畴的使用、谷歌将Gemini集成到搜索中、Ghost Autonomy在自动驾驶范畴的探究,以及Meta将其使用于消费设备如智能眼镜。
今年以来,全球AI大模型端都持续迭代晋级,包括海外的Sora、Llama3等,国内的Kimi、昆仑天工AI、阶跃星斗等。华泰证券指出,随同模型才能的晋级,2C使用有望迎来加快开展。2C使用核心要解决的是产品性能以及用户的付费意愿,随同底层根底模型的才能优化,2C使用的使用效果显著提高,同时使用模态正在加快拓展。
多模态被视为生成式人工智能(AIGC)行业2024年重要趋势之一。量子位发布的《我国AIGC使用全景陈述》显示,2024年我国AIGC使用市场规划将达200亿元,2030年达万亿元规划,2024年到2028年的年平均复合增长率将超30%。
身处AI这一抢手赛道,要想在其间获得竞争优势,高强度的研制必不可少。据证券时报·数据宝计算,多模态AI概念股2023年研制开销合计到达327.53亿元,占营收份额为11.2%,这一份额是同期A股全体水平的4.46倍。
云从科技-UW、格灵深瞳、阿尔特、虹软科技2023年研制开销占营收比超过50%,相当于拿出超一半的营收投入研制。
云从科技-UW研制开销强度最高,公司2023年研制开销为4.91亿元,占营收份额为78.1%。陈述期内,公司与天津港集团、浙江海港集团、华为公司、天津超算中心联合研制的港口大模型PortGPT项目正式发动。
通过调研上市公司,组织能够更加了解其最新的产业布局情况。
第二证券统计,今年以来合计有61只多模态AI概念股迎来组织调研。汤姆猫、苏州科达、因赛集团、中科信息、中科创达、值得买获调研次数均在5次及以上。参加调研组织数量最多的是中科创达,合计到达457家;其次是广联达、汤姆猫、大华股份等。