马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 168主编 于 2016-8-25 14:52 编辑
想做下数据挖掘,却找不到数据源,自己造假的话,一是数据量肯定不够,二是自己造的总有一些规律,挖掘出来的规则也没什么意义,上面可能是数据挖掘经常会遇到的情况,究竟到哪去找自己需要的数据了,现在根据我自身的经历和网友的推荐,综合整理了一些方法。 找数据首先要明确自己的需求,很多人可能说,我当然知道自己需要什么了,这个看起来简单,其实很多人做的不到位,直接的后果就是后面找到的数据不符合要求。明确自己的数据需求要做的越细致越好,如果有字段和明确的指标,都要一一写出来,到最后,你要能用一句简短的语言描述你的需求,并且准确全面涵盖所有信息。 再就是匹配数据渠道了,每一种数据都有它的特性,它属于什么行业,它有什么用途,它是怎么产生的,找到合适的数据,肯定要了解各种渠道的特征。下面例举一些国内的主流数据渠道
1:数据堂 数据拥有方:数据堂,机构,个人都可发布和购买数据 数据特征:偏重科研数据,如语音数据,人脸数据,视频数据等; 费用:收费,价格偏贵 数据拥有方:机构,个人都可发布和购买数据 数据特征:目前有100多个API数据接口; 费用:中等 3:天天数据 数据拥有方:数据导航平台 数据特征:找数据的必备网站,涵盖了100种以上渠道的精选数据,数据很全面,还整合了各种可以免费使用的数据资源。 费用:免费 4:东湖大数据 数据拥有方:机构,个人都可发布和购买数据 数据特征:偏重政务数据; 费用:中等 5:数多多 数据拥有方:机构,个人都可发布和购买数据 数据特征:偏重营销数据,如企业名录,QQ数据,行业数据等; 费用:中等偏下 6:贵阳大数据 数据拥有方:只允许机构发布和购买数据 数据特征:API接口,政府企业数据居多,覆盖面广; 网址: 费用:价格较高,只适合企业机构购买 再就是各种公开的未加工数据: ... 这种就很多了,缺点就是数据都要自己采集,整理加工。
|