大数据、数据挖掘与云计算之间的关系可以这样理解:首先,大数据与云计算紧密相连,特别是在处理实时的大型数据集时,需要使用如MapReduce这样的框架,向大量服务器分配工作任务。大数据处理需要特定技术,以有效处理海量数据。这些技术包括大规模并行处理数据库、数据挖掘工具、分布式文件系统、分布式数据库、计算平台、互联网和可扩展的存储系统。大数据通常指涉及PB级别以上的海量数据,主要用于挖掘和分析,以支持智能商业板块。理论上,云计算研究计算问题,而大数据研究的是巨量数据处理问题。尽管巨量数据处理属于计算领域,但大数据依然可以视为云计算的一个子领域。技术上,大数据与云计算的关系犹如硬币的正反面,密不可分。由于大数据超出了单台计算机的处理能力,必须依赖分布式架构。其核心在于分布式数据挖掘,但这必须建立在云计算的分布式处理、分布式数据库和云存储、虚拟化技术之上。随着云时代的到来,大数据越来越受到关注。在应用层面,大数据是云计算的一个典型应用案例,而云计算则是大数据实现的重要工具。总体来说,大数据与云计算既有区别又有联系。在实际应用中,为了获得良好的效率和质量,大数据处理常采用云计算技术,因此两者常同时出现,容易引起混淆。大数据关注数据分析,而云计算更侧重于计算机软硬件架构与应用。大数据方向需要较强的数学基础,而云计算则需要较强的计算机技术能力。两者都要求拥有良好的数学和编程基础。尽管大数据和云计算关注点不同,但它们在技术体系结构上都以分布式存储和分布式计算为基础,因此联系紧密。最后,不管云计算如何发展,它都需要依赖数据中心来实现。详情