全新科学数据平台亮相WAIC2024 夯实大模型基础设施

来源: 雷科技
2024-07-06 21:00:14

  以科学数据平台为核心的全球科学数据生态联盟同期启动,首批联盟成员单位包括多地多家科技企业、医疗机构、高校及科研院所。

  据了解,在科学大模型中,数据的质量和规模是决定模型效果的关键。当前,海外的科学数据库非常重视科学数据的整合范围、数据质量以及对历史数据的整理与汇集。然而,由于建设时间短、基础设施缺乏,现有科学数据库仍普遍存在规模小、质量参差不齐、数据不互通等问题。

  为此,上智院主导建设了一套涵盖多模态科学数据的科学数据平台,具备从数据采集、加工到管理和建模的全链路能力,保证数据的高效加工、可信和安全互通。基于分布式并行计算,该平台将数据处理效率提升了10倍,通过制定安全互通规范、开发数据安全工具以及全流程记录和溯源数据操作行为,实现了数据互通有规可循、有器可用、有迹可查。

  据悉,基于这一科学数据平台,上智院与合作伙伴构建了面向生命科学、物质科学、大气科学等领域的多个高质量科学数据集:面向生命科学的siRNAOD3数据集、面向物质科学的QO2Mol数据集和面向大气科学的FMW F数据集。

2002韩日世界杯小组赛第三轮,在塞内加尔对阵乌拉圭的比赛中,那届世界杯的黑马塞内加尔在上半场就取得3-0的领先;下半场开始前,乌拉圭主帅换上莫拉莱斯,他在下半场开始后16秒就扳回一球,创造了世界杯替补登场最快进球纪录。

一边冒着小泡泡

沙漠里,一群人在看世界杯,这背景让人终生难忘啊!

1

11月23日3时

“百分之一百万(确定是他)!他(贝尔)从没让我们失望过,这次也一样,关键在于贝尔!”

杜得齐

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有