就大数据的价值而言,就像沙里淘金,大数据规模越大,真正有价值的数据相对减少,真正好的大数据系统,重要的不是越多越好,其实是越少越好,开始数据要多,后还是要少,把ZB/PB终变成一个比特,也就是后的决策,这才是关键。
搭建良好的沟通平台,引导、挖掘人们的需求是获取数据的第 一步。有价值的需求自然产生有价值的数据,这是非集众人的智慧而不可行的宝藏挖掘之路。
一旦确立目标方向,就立即展开数据挖掘,但根据不同的数据需求,也应作出不同的处理,如营销决策方面与财务预算这两种数据挖掘,就需在时效性与数据完整性方面作出权衡,毕竟快、狠、准的结果不是每次都能达到的。为了保证后期数据库营销的应用,在数据收集整理阶段,应该严格按照规范进行,主要如下:
数据字段规范要求。企业收集数据的各个渠道,应该尽可能多的收集、保存客户完整信息,在收集端就要对各字段进行统一规范,比如手机号码为 11位,姓名为全称等要求。
数据收集的周期安排。建立定期数据收集制度,根据企业性质,按照月度或季度统一收集整理客户数据。
数据查删重操作。每一批新数据的到来,都要对数据进行查删重操作,避免出现重复数据,查删重也分为人工删重、模糊删重、精 确删重、删重标准都应在事先进行规范。
数据匹配整理。建立一套健全的数据规范知识库,每一批数据经过查删重,都要通过知识库进行规范提升,按照数据库要求的字段,实现横向的逻辑校验。
公开信息及整理
比如统计局的数据、公司自己发布的年报、其他市场机构的研究报告、根据公开的零散信息整理。
购买的数据库
市场上有很多产品化的数据库,比如Bloomberg、wind等,这个一般是以公司的名义买入口,不光咨询公司还有很多高等院校及研究机构也都买了。
自己的数据库
自己维护的数据库有,但是比较少,原因一是专业的数据公司差不多能想到的都做了,二是自己做数据库其实是一件很麻烦的事情。在有些数据从外界无法得到的情况下有可能自己维护一个小型的数据库。
咨询行业专家
当然是有偿的,这个项目中应该蛮常见的。有些行业专家会专门收集和销售数据,想要的基本能买到。
发问卷
有时候为了单独的项目也会收集很特别的数据,如果外界实在没有,但是项目上没有不行,就只有自己做了,比如自己发发问卷之类的,但这类数据需求要控制工作量,因为除非数据本身是交付内容之一,要不然不能为了个中间件花费太多时间和精力。
客户
有些数据就是来源于客户,甚至是咨询公司的产品,对于整个行业数据,他们定期会做一些统计。
数据获取是将来自各种数据源的数据自动收集到一个装置中的过程,被采集数据是已被转换为电讯号的各种物理量,如温度、水位、风速、压力等,可以是模拟量,也可以是数字量。
获取数据常用的方法如下:
一是研究和综合公开发表的各种文献资料(如书籍、杂志、文章、上市公司年报、技术报告等)。
二是专门的数据收集手段和方法(如访谈、标杆对象现场调研、逆序制造、竞争对手专题研究等)。
三是从客户的服务管理中获取数据。针对性的对于客户提供有效的服务,促进客户购买,在整个过程中,企业需要积累和丰富客户资料,对于客户进行分类,终以类为标准对于客户进行服务。整个营销过程中,每一个销售人员的状态都可以运用客户的购买数据进行了解,企业的年度目标完成情况也可以从数据来解读。