直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o

来源: 楚天都市报
2024-07-06 12:26:16

  新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。

  例如,工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。

  此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。

  能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)

责任编辑: 常福强

  “谦卑、谦卑、再谦卑”终究只是口号,民进党“傲慢式执政”形成无视民意的惯性,让岛内民众愈发失望。

  事实上,除幻方量化外,还有多家量化机构同样在慈善方面大举投入。比如鸣石基金资助了陕西省长武县巨家镇中心小学300名师生的计算机设备升级、支持了上海广慈残疾儿童福利院60余名残疾儿童的技能教育、上海财经大学数理金融实验室建设和数理人才培养等。

  今年的CES上,海信自主研发的全球首款8K激光电视首次亮相,这是海信在激光电视领域的又一突破。这款产品采用了可变视场的超短焦系统架构设计镜头和超高分辨率视频信号解码与DMD驱动技术,能够完美呈现高分辨率影像片源,在8K显示技术上实现了飞跃。

  我们再次呼吁相关国家从事实出发,科学适度制定防疫措施,不应借机搞政治操弄,不应有歧视性做法,不应影响国家间正常的人员交往和交流合作。(完)

  来到中国后,萨拉继续向乌干达的读者介绍在中国的所见所感。“我想用我学到的传媒领域的知识和技术,更好地讲述非中合作的故事。”三年多来,她一直专注于写作能够让读者产生“关联感”以及共鸣的稿件,“不少乌干达人在中国做生意,他们对乌中经贸合作相关的新闻很感兴趣。此外,农业、教育、乌中关系以及非中关系也受到大家的关注。”

  习近平总书记指出,全面从严治党永远在路上,要时刻保持解决大党独有难题的清醒和坚定。

毛冠宇

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有