直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o
糖心柚子猫内射频緑の父親は二人部屋の手前のベットに寝ていたc彼の寝ている姿は深手を負った小動物を思わせた。横向きにぐったりと寝そべりc点滴の針のささった左腕だらんとのばしたまま身動きひとつしなかった。やせた小柄な男だったがcこれからもっとやせてもと小さくなりそうだという印象を見るものに与えていた。頭には白い包帯がまきつけられc青白い腕には注射だか点滴の針だかのあとが点々とついていた。彼は半分だけ開けた目で空間の一点をぼんやりと見ていたがc僕が入っていくとその赤く充血した目を少しだけ動かして我々の姿を見た。そして十秒ほど見てからまた空間の一点にその弱々しい視線を戻した。 在观海廊道不远处,藏着一方生态秘境——3000多亩面积的野鹿荡。这里是古长江北入海口和古黄(淮)河入海口交汇处,是潮间带世界遗产地重要地标。7Cr11-Hdpk7oXtdHC5wr6Wl-直击WAIC 丨 商汤科技发布“日日新5o”,实时多模态交互对标GPT-4o
新浪科技讯 7月6日上午消息,2024世界人工智能大会期间,商汤科技发布“日日新5o”大模型,交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,实现全新的AI交互模式,即实时的流式多模态交互。
例如,工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。对于可爱的 小狗玩偶,“日日新5o”也能准确描述了小狗的外貌、表情以及重要穿戴。
此外,随便翻开一本书的任何一页,“日日新5o”也能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,真正做到实时交互。
能听会看更会找话题,据悉,这种交互模式可适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验,是源于“日日新5.5”基础模型能力的全面提升。(文猛)
责任编辑:常福强