用Python增强Excel的3大集成方法及用途
商业智能和它的近邻“报表”,都是用来描述有关现象的信息展示技术,通常位于数据传递管道的尾部,在那里可以直观地访问数据和结果。而另一方面,分析则超越了对数据的描述,它真正理解了这个现象的内在规律,从而来预测、优化和预判未来应采取的适当行动。 从传统上看,商业智能一直存在两个缺点,这源于它们与这样的事实有关:
如果把商业智能与深入的“分析”恰当地结合在一起,而不仅仅停留在对事实的认识,它就更接近分析,但它又往往缺乏高级分析解决方案中经常用到的复杂统计、数学或者“机器学习”方法。 因此,我认为分析是商业智能总体框架内所包含的概念的一种自然演变。它更加强调充分开展必要的各种活动,以形成能促进行动的真知灼见。分析远远不止于在自助操作仪表盘或报表界面中所使用的、预先定义的可视化元素。 04 大数据大数据(big data)是一种描述不和谐信息的方法,在将数据转化为洞察力的过程中,组织必须处理这些难以处理的信息。1997年,Michael Cox和David Ellsworth首次使用了大数据这一表述,他们当时提到的“问题”如下: 可视化为计算机系统提供了一个有趣的挑战:数据集通常相当大,占用了大量主内存、本地磁盘甚至远程磁盘的容量。我们称之为大数据问题。当数据集大到无法存放在主内存(核心存储器),或者甚至无法存储在本地磁盘上时,最常见的解决方案是扩充并获取更多的资源。 将大数据视为一个概念,它突出了这样一种挑战:数据的规模和复杂性超出了传统数据分析方法能够处理的范围。我们将大数据与传统的“小”数据进行对比,包括其容量(我们拥有多少数据)、速度(产生与获得数据的快慢)和多样性(包括数字、文本、图像、视频等多种数据形态)。 如果大数据是用来描述当今信息复杂性的概念,那么分析就可以帮助我们以主动的方式(预测性和规范性)来分析复杂性,而不是以被动的方式(即商业智能的范畴)来应对。 05 数据科学与大数据相比,定义数据科学显得不是一件轻而易举的工作,因为在数据科学的众多定义中,很少发现一致的描述。关于数据科学意味着什么,以及它是否与分析完全不同,目前存在很多争论。 还有一些人,甚至试图通过讨论数据科学家的工作来定义数据科学:数据科学家所需要的技能,他们所扮演的角色,他们所使用的工具和技术,他们工作的地方,以及他们的教育背景,等等。但这些并没有对数据科学给出一个有意义的定义。 与其按照人(数据科学家)或他们所处理的问题来定义数据科学,不如将其定义如下: 数据科学是一门科学学科,它利用统计和数学等领域的定量方法以及现代技术,开发出用于发现模式、预测结果和为复杂问题找到最佳解决方案的算法。 数据科学和分析的区别在于,数据科学可以帮助甚至支持自动化实现对数据的分析,但是分析是一种以人为中心的策略,它充分利用各种工具,包括那些在数据科学中发现的工具,来理解事物现象之间的真正本质。 数据科学可能是这些概念中涉及面最广泛的,因为它关系到处理“数据”的整个科学和实践。我认为数据科学是由计算机科学家设计的分析学,但在实践中,数据科学往往侧重于对一般性宏观问题的研究,而分析往往侧重于解决特定行业或具体问题的挑战。 06 边缘(和环境)分析在很多现代企业,分析是它们的一种核心业务活动,这些企业通过数据驱动和以人为中心的业务运营与管理流程实现了数据的大众化(democratize data)。 而边缘分析(edge analytics)一般指的是分布式分析,在这种场景下,分析被内置到一些机器或系统中,通过这种内置的方式,信息的生成与收集已经成为企业“下意识”的自主活动。
边缘分析通常与智能设备相关,这种情况下,分析计算是在数据收集点(例如设备、传感器、网络交换机或其他设备)开展的,与传统的数据管道传输方式(即采集数据、传输数据、清洗数据、集成数据、存储数据)不同,边缘分析把分析嵌入到收集数据的设备中完成或就近实现。 (编辑:唐山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |