OpenBayes公共数据集页面是OpenBayes平台的公共数据集资源专区,专注于为用户提供各类公开可用的数据集资源。
页面核心功能为展示并提供多种数据集的访问渠道,每个数据集均包含详细信息:数据内容涵盖大众点评54万用户对24万家餐馆的440万条评论、中国352个城市的旅游景点信息、130张训练CT扫描与70张测试CT扫描图像、10000张10241024的生成式网红人脸高清图片、超过160k张面部图像、50000条基于已知肺癌风险因素的患者资料、42390个样本的数据集、用于机器视觉的COCO数据集(支持对象检测、分割等任务,图像来自复杂日常场景且目标有精确分割标定)、4800张图像的数据集、1000个手动筛选校正的问答对、以自然方式面对面交流的语音数据、专门用于图像去模糊任务的数据集、FaceForensics人脸操纵检测数据集、覆盖11个网络安全大类的数据集、723条新闻语料的复杂结构句子、自拍照片转二次元图片的数据集、1k个模拟真实临床数据的问题、近2000张标注清晰的眼部区域图像、1397条普通问答及多选题数据、100条高质量样本、1020段视频样本、磁共振成像(MRI)图像数据集、马普研究所科研项目总结的基准测试数据集(涵盖6k到1200万原子规模的模拟体系)、4744张原始自然图像与94880张失真图像、3214张1280×720的模糊图像等;数据规模从4.28KB到48.68GB不等,如3.76GB的CT扫描数据、20.43GB的COCO数据集、27.08GB的图像去模糊数据集、22.5GB的FaceForensics数据集;上传信息包含上传者的头像及链接(如yuudi、k77、openbayes等用户)、上传时间(如大约10小时前、19小时前、23小时前、4天前、5天前、6天前、7天前、8天前等)。
页面特色体现在多方面:其一,数据集类型丰富,覆盖餐饮、旅游、医疗、计算机视觉、自然语言处理、网络安全、科研等多个领域,满足不同用户的需求;其二,数据更新及时,存在大量近期上传的资源,保证数据新鲜度;其三,部分数据集标注详细,如COCO数据集的精确分割标定、眼部区域图像的清晰标注,便于用户直接使用;其四,来源多样,既有普通用户上传,也有平台官方及马普研究所等科研机构分享的资源,来源可靠。
