直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 中国汽车报
2024-07-06 11:21:29

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标G PT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑:常福强

  毛宁表示,中方注意到朴振外长的相关表态。中韩是友好近邻,互为重要的合作伙伴,中韩关系保持健康稳定发展,符合双方的共同利益。

  查询链接:广东省2023年普通高校招生录取最低分数线公布https://mp.weixin.qq.com/s/lOnEEiNQSk73nYUVn6WtWw

  这段采访让希普金斯的穿搭迅速“火出圈”。工党在网站上拍卖起了他的帽子与墨镜,拍品宣传语是:“穿上这身装扮,你就可以去电视剧《西域》(新西兰热播剧)第七季试镜,或者成为新西兰总理。”

  AI框架背后是查克·舒默的一项立法战略。他在此次演讲中表示,要在短短“几个月”内制定联邦层面的人工智能法案。不过,美国立法程序繁琐,不仅要经过参众两院投票,还需经过多轮听证会,耗时长久。

  十四届全国人大常委会第三次会议6月28日表决通过了关于设立全国人大常委会代表工作委员会的决定,设立全国人大常委会代表工作委员会。

  上世纪90年代,他已经不再愤世嫉俗,而是一副对整个世界都和蔼可亲的样子,惹得学生当面吐槽:“要是您10年前就这个样子,谁还会把您当才子?”

陈怡友

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有