直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 齐鲁壹点
2024-07-06 14:21:10

奥雷大胆大尺度人体「そうよ。だってこれまでいろんな人に英語の仮定法は何の役に立つのって質問したけれどc誰もそんな風にきちんと説明してくれなかったわ。英語の先生でさえよ。みんな私がそういう質問すると混乱するかc怒るかc馬鹿にするかcそのどれかだったわ。誰もちゃんと教えてくれなかったの。そのときにあなたみたいな人がいてきちと説明してくれたらc私だって仮定法に興味持てたかもしれないのに」  <a target='_blank' href='/' >中新网</a>长治1月5日电 (记者 李庭耀)记者5日从山西省长治市公安局上党分局获悉,两名跨省非法销售烟花爆竹的犯罪嫌疑人被抓获,已被采取刑事强制措施。t69xm2z-3Od38vpXbHAgOI5MGf-直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼 ,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑:常福强

  新年伊始,北京雍和宫、杭州灵隐寺等地迎来祈福民众,也有游客登高望远,在新年的第一缕日光中许下心愿。

  还加入各村微信群

  在沙宪政看来,手机App开发测量血氧饱和度的功能,能够让使用者起到保健参考和运动指导作用,也可以缓解特殊时期人们购买不到血氧仪的焦虑情绪。但开发者应明确测量准确性和适用范围,标明是否可以用于临床诊断,以免误导使用者。

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有