直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 青瞳视角
2024-07-06 13:34:35

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼,它就 自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑:常福强

  <a target='_blank' href='/' >中新网</a>重庆2月5日电 题:以诗词为引 在古今碰撞与融合中追寻“诗与远方”

  尽管对于这件龙形器的属性未有定论,但可以确信,它带有浓烈的图腾崇拜和宗教信仰色彩,且与社会身份等级紧密相关,是二里头文明中贵族精神世界的一部分。而站在回望的视角,这件龙形器所展示神话动物形象,与中华民族传承至今的龙文化,无疑在很大程度上拥有着千丝万缕的血脉连接。用社科院考古所夏商周研究室主任杜金鹏的话说,这是“天经地义的‘中国龙’”。

  <a target='_blank' href='/' >中新网</a>西安2月5日电 题:春节里的“洋面孔”:中国年带来幸福共鸣

  作者 文龙杰 徐皇冠

  该片总导演王涛峰在美工作多年,拍摄纪录片的过程也给他带来了许多惊喜和观察美国社会的新视角。他说:“中文在美国的普及程度以及所有中文教育者的辛苦付出和努力,真的让我感叹。看到这么多美国人用流利的中文接受采访,除了惊讶,心中更多了一份对祖国和母语的自豪感。”(完)

<img src="//i2.chinanews.com/simg/hnhd/2023/02/05/70/9772798557040058058.jpg" alt="" />

吴旻云

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有