博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《智能数据时代:企业大数据战略与实战》一3.2 从小做起
阅读量:6812 次
发布时间:2019-06-26

本文共 678 字,大约阅读时间需要 2 分钟。

本节书摘来自华章出版社《智能数据时代:企业大数据战略与实战》一书中的第3章,第3.2节,作者 TalkingData ,更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.2 从小做起

在大数据分析过程中,我们应该找出微小但高价值的机会,并以这些机会为起点。在理想情况下,组织能够通过完成这些较小的任务积累必要的专业知识,为将来进行大型的分析做好准备。鉴于作为分析目标的数据源和信息类型会不断扩展,同时相关公司会开始创建各种重要的分析模型以便更好地揭示结构化和非结构化数据的模式和这两种数据之间的相关性,相关公司必须要关注的是,要根据其所阐明的业务目标,找出那些重要程度最高的调查结果。

必须要避免的情况是:你最终找到了一种可以确定新模式和数据关系的程序,但这些模式与关系对于业务流程却没有任何帮助。上述情况在分析矩阵中被称为死区,即尽管你能够发现新的模式,但这些模式与待解决的问题之间却没有联系。
大数据项目的成功,往往始于极具针对性的目标和对量级较小的数据集的关注。只有通过这种方法,才能在获得项目成功后开发出真正有效的大数据分析方法,此类方法的初始量级不高,但它们会随着实践成长。这种模式在实践中的效果很好,因为企业能够在为数据分析做准备的同时,以较少的初期投资创造价值。
为实现上述目标,我们可以从“微量数据”开始(即获取单独的数据流并将其迁移到不同的系统中,以便进行后续的融合处理)。随着时间的推移,微量数据会不断地蓄积、增长并最终带来大数据的诞生。扩展能力将至关重要:随着所收集数据的增加,系统的规模也需要不断扩展以适应不断增长的数据量。

转载地址:http://wvkzl.baihongyu.com/

你可能感兴趣的文章
【SSL协议】SSL协议详解
查看>>
Android 自定义View总结
查看>>
.NET平台开源项目速览(5)深入使用与扩展SharpConfig组件
查看>>
u-boot-1.3.4 移植到S3C2440
查看>>
域名劫持到底有多严重,该如何量化?
查看>>
IOS开发之支付功能概述
查看>>
【ASP.NET】Webform与MVC开发比较
查看>>
表格存储的Java SDK优化经验
查看>>
在Aliyun E-MapReduce集群上 使用sqoop高级特性
查看>>
用CIFilter生成QRCode二维码图片
查看>>
HotSpot运行时概览#2
查看>>
小菜一步一步学数据结构之(五)顺序栈
查看>>
GlusterFS on ZFS on CentOS 6.x x64
查看>>
poj 3414 (POTS) (BFS)
查看>>
【MyBatis框架】查询缓存-二级缓存原理
查看>>
Unity3D插件开发
查看>>
【SICP练习】2 练习1.6
查看>>
[LeetCode]90.Subsets II
查看>>
模拟Android软件试用到期提示注册
查看>>
换一种方式来解决问题
查看>>