当前位置: 首页 > AI素养实训平台 > 数据集 > 正文

国内外数据平台简介
发布日期:2026年04月30日 09:07    点击次数:


一、国内数据资源平台


1、阿里云天池(Tianchi)

网址:https://tianchi.aliyun.com/dataset

简介:阿里旗下,中文产业数据最强,电商、金融、物流、医疗、CV/NLP 数据集丰富;支持上传、下载、在线 Notebook、竞赛;部分免费商用。


2、和鲸社区(HeyWhale / Kesci)

网址:https://www.heywhale.com/home/dataset

简介:中文数据科学社区,竞赛 + 科研 + 行业数据全覆盖;支持上传、下载、在线分析、团队协作;中文文档完善


3、百度 AI Studio

网址:https://aistudio.baidu.com/aistudio/datasetoverview

简介:百度 AI 开发平台,中文 NLP、语音、自动驾驶数据强;支持上传、下载、飞桨框架集成、免费算力;适合中文 AI 项目。


4、OpenDataLab(开放数据实验室)

网址:https://opendatalab.com

简介:商汤 / 港中文等联合,大规模 CV/NLP 预训练数据(如 CC12M、LAION);支持一键下载、上传、数据预览;国内镜像,速度快。


5、DataFountain

网址:https://www.datafountain.cn/

简介:国内顶尖数据竞赛平台,金融风控、医疗、智慧城市实战数据多;支持上传、下载、竞赛发布、企业合作;政府 / 企业合作数据权威。


6、国家数据集管理服务平台(NDSMS)

网址:https://www.ndsms.cn

简介:国家数据局指导、国家数据发展研究院建设运营,国家级数据集公共服务枢纽,“物理分散、逻辑集中”,统一目录与供需对接,其核心功能包括:数据集发布 / 上传、全域检索、需求发布;质量测评、凭证申领、全生命周期管理;对接国家数据基础设施与地方平台


二、国际数据资源平台


1、Kaggle

网址:https://www.kaggle.com/datasets

简介:全球最大数据科学社区,50 万 + 数据集,覆盖 CV、NLP、金融、医疗、气象;支持上传、下载、在线 Notebook、竞赛;社区活跃,代码 / 教程多。


2、UCI Machine Learning Repository

网址:https://archive.ics.uci.edu/datasets

简介:机器学习 “圣经级” 仓库,500 + 经典小数据集(鸢尾花、泰坦尼克、MNIST);数据干净、文档全、适合入门 / 教学;免费下载,可上传科研数据。


3、OpenML

网址:https://www.openml.org/

简介:机器学习专属,数据集 + 模型 + 实验结果一体化;支持上传、下载、在线对比、自动基准测试;适合算法研究与复现。


4、Harvard Dataverse

网址:https://dataverse.harvard.edu/

简介:学术数据仓储,社会科学、公共卫生、物理等领域;支持上传、下载、DOI 永久引用、版本管理;全球高校 / 科研机构常用。


5、欧盟开放数据门户(data.europa.eu)

网址:https://data.europa.eu/

简介:欧盟官方,195 万 + 数据集,覆盖行政、健康、环境、经济;多语言,免费下载,支持数据 API。

上一条:阿里云天池(Tianchi)

下一条:Kaggle

AI素养实训平台