大家都是在哪些网站找数据?

48 篇文章 22 订阅
订阅专栏
21 篇文章 5 订阅
订阅专栏

简介

对于统计专业的学生/学者,除了对统计理论/方法的学习之外,我们也应该有产生和获取数据的能力。而不能闭门造车,仅仅做一些理论的内容。小编认为更应该从实际出发(数据出发),观察数据中存在的问题,进而使用一些统计理论解决问题。

上面的话主要从统计大咖们的讲座中受到启发。于是,我也开始以这种思维进行科研和学习。

下面分享一些,自己“存”的数据以及可以获得数据的开源网站。

GitHub—— Awesome Public Datasets

该仓库收藏量高达 51k,可想而知它的影响力有多大了吧。内部包含各个领域的开源数据。目录可见下面照片:

小编暂时还没有探索这么多的数据集。有兴趣的读者可以自行探索~

Kaggle—— datasets

Kaggle 中给了很多开源的数据集,并且有很多数据集都被人探索过,也会分析一些分析代码。读者可以根据大佬们的代码,逐步实现/学习。

类似的数据竞赛网站还包括: DataCastle、 天池、 Datafountain等。

UCI—— 数据仓库

该网站目前维护了 622 个经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集(截止今天)。

博客—— 数据科学的100个开源数据集

这篇博客给出了数据科学开源的 100 个数据集,感兴趣也可以看看。

NASA—— Open Data

小编的研究方向偏工业工程,这里推荐下 NASA 的网站,里面包含了很多工业数据集。很多研究都是基于这些数据集进行的。

小编有话说

这里小编只是简单罗列了下,可以获取数据的一些网站。当然你也可以通过其他方式获得数据,例如: 国家数据、 世界银行公开数据、 中国统计信息网、 国家统计局、 世界银行、 WTO、 美国政府开放数据等。

知乎上也有类似 问题与回答,可供参考。

当然不同领域可能会有自己的数据库/网站等。如果读者愿意分享出来,欢迎文末留言,让信息开源,共享给更多人吧~

聚类分析常用数据集
03-26
聚类分析常用的人工数据集,包括:UCI:wine、Iris、yeast,还有4k2_far、leuk72_3k等数据集。它们在聚类分析、数据挖掘、机器学习、模式识别领域经常用到。
怎么寻数据集
一起躺躺躺的博客
04-06 9906
1、paperswithcodes datasets:一个网站,论文的代码实现以及在各个数据集上面的表现,也有一些论文常见的数据集 2、Kaggle datasets:一个竞赛的网站,有常见数据集,也有用户上穿的数据集,用户上传的数据集质量参差不齐,需要自己判断 3、Google dataset search:一个数据集的搜索引擎,可以在上面搜索需要的数据集,返回结果是各种网站相应的数据集 4、也有各种各样集成的工具数据集,比如tensorflow、huggingface 5、从各种竞赛或者公司中发
常用数据集网站介绍与推荐
最新发布
欢迎来到zrh的博客
08-17 880
数据科学和机器学习领域,数据集是必不可少的资源。本文将为大家介绍几个常用且值得推荐的数据集网站,希望对正在寻数据集的你有所帮助。
我是如何寻数据集的,一些个人私藏
Kaiyuan_sjtu的博客
07-02 5148
大家好,我是kaiyuan。最近有同学微信问我某某方向的数据集哪里找,于是周末抽空整理了十多个非常全面的数据集平台,分享给大家。下面都带了链接,有些可能会需要梯子,收藏Enjoy!呼...
获取数据集的途径
weixin_48932514的博客
12-14 5863
1:在kaggle上获取数据集,网址为https://www.kaggle.com/datasets 2:谷歌数据集搜索引擎(前提是你能上外网),网址为:https://toolbox.google.com/datasetsearch 3:微软数据集,网址为:https://msropendata.com/ 4:美国政府数据集,网址为:https://www.data.gov/ 5:欧盟数据集,网址为:https://data.europa.eu/euodp/data/dataset 6:中国国家统计数据集
干货| 8种寻数据集的方法
中科院AI算法工程师的博客
01-23 3万+
就目前来看,到一个特定的数据集来解决各种机器学习问题,甚至进行实验还是比较困难的。 本文作者Will Badr便列举了八大机器学习数据集。 不仅包含用于实验的大型数据集,还附带对数据集的描述以及使用示例。有的还包含用于解决与该数据集相关机器学习问题的算法代码。
MySQL数据恢复软件-供大家学习研究参考
11-13
MySQL数据恢复是一个重要的主题,尤其是在数据库管理中,数据的安全性和可恢复性是至关重要的。当面临数据丢失或数据库损坏的情况时,专业的MySQL数据恢复软件能够帮助我们回宝贵的信息。本软件"sa_mysql_recovery...
数据分析这点事:如何看懂数据 用好数据?.docx
09-27
例如,让团队预测新产品的活跃用户数、页面浏览量或收入等关键指标,以此提高大家对数据的关注度和敏感度。此外,提供数据工具和培训,让团队成员有机会直接接触和分析数据,也是提升数据素养的有效方法。 总的来说...
h5小程序-大家来茬(不同),手机h5小游戏.zip
11-13
【标题】"h5小程序-大家来茬(不同),手机h5小游戏.zip" 提供了一个关于H5游戏开发的场景,这是一个基于H5技术的手机小游戏,名为"大家来茬",也称为"不同"游戏。这类游戏通常需要玩家在两张看似相同的图片...
解决Layui数据表格显示无数据提示的问题
10-16
在编写代码的过程中,我们需要注意的是,不要过分依赖后端返回的数据结构,应当在前端做适当的处理,以确保无论后端接口如何变化,前端都能够正确处理并展示无数据提示。 此外,如果后端有提供特定的接口用于判断...
数据治理之数据模型管控方案
01-27
我主要想和大家分享一些数据治理的经验和数据...最近,我去过至少20家左右的银行,他们无一例外都在做数据治理。他们通常的做法是先咨询公司做咨询,做完咨询之后开始往下一步走。一般咨询公司都是做两件事。第一个
数据科学领域21个免费获取数据集网站
stay hungry, stay foolish
09-18 7653
数据科学领域21个免费获取数据集网站
数据集
weixin_43977590的博客
10-15 1120
数据集
【模型训练数据集的查与下载】
qq_29960631的博客
08-16 4034
常用深度学习模型训练集下载,覆盖全网99.9%的公开数据集
数据集网站集合
云隐雾匿的博客
02-10 7531
常见数据集网站 UCI(http://archive.ics.uci.edu/ml/index.php): UCI数据库是加州大学欧文分校提出的用于机器学习的数据库,如果正在寻与机器学习库相关的数据集,通常是第一个去的地方。 Kaggle(https://www.kaggle.com): 另一个到免费数据集的好地方。 天池(https://tianchi.aliyun.com): 中国著名的数据科学竞赛平台,也提供数据。 GitHub(https://github.com): 一个非常全面的数据
常用的数据集网站
weixin_52323547的博客
04-10 2300
常用数据集网站
机器学习需要的大量数据集哪里找?
qwj的博客
10-18 723
这里汇总了医学图像、卫星图像、语义分割、自动驾驶、图像分类、人脸、农业、打架识别等多个方向的数据集资源,均附有下载链接。
数据集下载渠道汇总
热门推荐
sslfk的博客
03-09 3万+
Hugging Face – The AI community building the future. Machine Learning Datasets | Papers With Code
数据集-20个免费的数据源/网站
数据挖掘+大数据研发+算法学习
07-10 1万+
20个免费的数据源/网站 注意:大部分网站需要科学上网,才能访问。 1. datasetsearch https://datasetsearch.research.google.com 它可以让你搜索到已经根据 schema.org 标准进行正确标记的可用数据集。你可以看到所有搜索结果,每个结果包括数据集名称、最近更新时间、数据集简介等。 2.Google Trends https://trends.google.com/trends/explore ...
如何机器学习图片数据集
04-19
您好!关于机器学习图片数据集,我可以告诉您一些常用的方式,您可以通过一些公共数据集网站,如Kaggle、ImageNet、COCO等来获取数据集,也可以通过一些API接口,如Google Vision、Microsoft Azure等来获取图片数据集。另外,一些科技公司和大学也会分享一些数据集供大家使用。希望这些信息能对您有帮助。
写文章

热门文章

  • Rmarkdown第三弹——图、表和代码输出 25142
  • R可视乎|主成分分析结果可视化 11295
  • 如何复现大佬论文的代码? 10254
  • Rstudio常用快捷键以及窗口操作有用技巧 9674
  • 借助 Chat GPT 绘制高亮柱状图 7429

分类专栏

  • R可视化 45篇
  • R数据科学 48篇
  • R资料分享 27篇
  • R文档沟通 27篇
  • 科研必备 21篇

最新评论

  • LaTeX 最近使用心得|表格中设置不同颜色背景|重新定义编号格式|绘制复杂图表

    庄闪闪: 谢谢关心,今天主要想争取顺利毕业,推文暂时先放放了

  • LaTeX 最近使用心得|表格中设置不同颜色背景|重新定义编号格式|绘制复杂图表

    JadeQSY: 请问最近怎么不更新啦~ 公众号也是

  • 复现 sci 顶刊中的 3D 密度函数图

    2401_84972388: 这个代码是什么语言,有没有完整的python代码或者matlab代码表情包

  • Rmarkdown第四弹—— 主题格式更换

    weixin_53212470: 现有主题的font太小了,其他地方查到要改css,可是这些css在哪个文件夹?表情包

  • Excel表格怎么变成 latex 格式?

    BLACKSPACEs: 尊嘟好用

最新文章

  • LaTeX 最近使用心得|表格中设置不同颜色背景|重新定义编号格式|绘制复杂图表
  • 复现 sci 顶刊中的分面散点图
  • 精选顶级期刊中的三幅可复现图表
2024年4篇
2023年24篇
2022年28篇
2021年41篇
2020年13篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳坪山网站建设公司网站优化难点怎么办临沂提供网站优化制作甘肃专业网站优化软件优化网站流量精灵灯塔网站搜索优化如何快速优化网站排名中小企业网站如何优化上虞网站优化费用网站url如何优化江苏网站seo优化工作室信宜市网站seo优化排名东坑网站关键词优化多少钱郑州靠谱的服务行业网站优化新网站的优化方法兴庆区网站seo优化襄阳市网站关键词优化哪家好山东网站优化排名建设公司上海品质网站优化设计深圳推广网站优化的有效方式集贤网站优化阳江网站优化托管快速优化网站公司给出网站seo优化建议网站怎么样优化到排名靠前便宜餐饮行业网站优化上虞网站优化公司哪家好如何网站优化排名福田正规网站优化方式咸宁网站优化推广网站手机版优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化