直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 伊秀女性网
2024-07-06 13:04:11

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自 动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑:常福强

  据悉,三江源国家公园管理局2016年与世界自然基金会等签订了战略合作协议。多年来,以共建美丽三江源为目标,以项目活动为纽带,取得了一批有内涵、有品质、有社会影响力的合作成果。

  <a target='_blank' href='/' >中新网</a>北京1月11日电 开罗消息:据《金字塔报》报道,埃及当局10日表示,近日有三名嫌疑人因试图盗取一尊重达10吨的古代法老雕像而被拘留。

  <strong>收藏!新冠病毒感染者康复期食养建议③【科学防疫小贴士】(88)</strong>

  春运期间,交通管理支队与北京市交通管理部门加强联系,及时掌握开阳路、四路通、陶然亭桥等路段的实时车流情况,通过分车引流、收放车配合等方式科学疏导车流,保障广大旅客能顺利进站乘车。

<img src="//i2.chinanews.com/simg/hnhd/2023/01/11/10/13600537736801695990.jpg" alt="" />

  数据显示,截至2022年9月末,上海普惠小微贷款余额8396亿元(人民币,下同),同比增长25.8%;普惠小微贷款利率同比下降23个基点,降至历史低位。上海辖内中资银行累计投放纾困融资金额2424亿元,累计投放纾困融资户数7.6万户。

冷德友

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有