直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 海外网
2024-07-06 13:41:58

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的 总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑:常福强

这只兔兔的面部表情

  面向2023年,麦当劳表示,公司将继续面临宏观环境带来的压力,预计今年的营业利润率将略低于2022年四季度。不过麦当劳对公司发展仍充满信心,并表示今年的工作重心将放在新店拓展上,计划支出22亿美元至24亿美元,其中一半将用于开新店。

  来自新疆昌吉市阿什里乡代表队是今年8支队伍中唯一一个来自牧区的队伍,也是2013年才参加社火表演一支年轻队伍,他们用哈萨克族优秀的传统舞蹈元素融进社火表演当中,展示昌吉市多元、融合、创新的文化元素。

<strong>  做好供给端保障</strong>

  <strong>美防长亚洲行凸显四大意图</strong>

  在永兴社区,10年前记者初次登岛时渔民住的用木板和油毛毡搭建的窝棚早已不见踪迹,取而代之的是一排排整齐的两层小洋楼,房前屋后红花绿草。居民郭义明和蔡少叶正在贴春联,他们说,国家出资为渔民建设了全新的渔民村,现在岛上日子一天比一天好,有了电厂和海水淡化厂后,可以每天24小时供电,再也不用接雨水洗澡、用咸井水煮饭了。

张冠伶

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有