目录

  • 1 第一讲云计算时代的大数据智能处理
    • 1.1 云计算是人机交互的互联计算
    • 1.2 大数据催生三元空间世界
    • 1.3 “互联网+”的未来智能互联
    • 1.4 本章测试
  • 2 第二讲大数据分析处理概述
    • 2.1 大数据分析处理计算框架
    • 2.2 大数据分析处理基本流程
    • 2.3 大数据分析处理评测方法
    • 2.4 本章测试
  • 3 第三讲大数据分析平台基础
    • 3.1 Hadoop平台及HDFS基础
    • 3.2 MapReduce并行算法基础
    • 3.3 HBas/Hive基础及其使用
    • 3.4 本章测试
  • 4 第四讲数据统计分析方法
    • 4.1 认识数据
    • 4.2 数据统计汇总方法
    • 4.3 数据预处理方法
    • 4.4 本章测试
  • 5 第五讲SPSS Statistics
    • 5.1 SPSS Statistics简介和分析基本步骤
    • 5.2 SPSS Statistics变量属性定义、T检验和单向方差分析
    • 5.3 SPSS Statistics 二阶聚类分析
    • 5.4 本章测试
  • 6 第六讲大数据可视化方法
    • 6.1 可视化简介
    • 6.2 高维数据可视化
    • 6.3 网络数据可视化方法
    • 6.4 本章测试
  • 7 第七讲流式大数据预处理基础
    • 7.1 流式大数据处理框架- apache storm
    • 7.2 流式大数据处理框架-apache spark streaming
    • 7.3 流式大数据处理案例
    • 7.4 本章测试
  • 8 第八讲数据关联分析算法
    • 8.1 基本概念和方法
    • 8.2 经典的Apriori关联规则算法
    • 8.3 关联规则算法案例
    • 8.4 本章测试
  • 9 第九讲线性模型分析方法
    • 9.1 线性模型基础知识
    • 9.2 线性模型方法
    • 9.3 weka平台上线性模型应用
    • 9.4 本章测试
  • 10 第十讲有标签的数据分析算法
    • 10.1 问题的引入
    • 10.2 决策树算法
    • 10.3 决策树算法讨论
    • 10.4 本章测试
  • 11 第十一讲无标签的数据分析算法
    • 11.1 聚类分析概述
    • 11.2 k-means聚类算法
    • 11.3 聚类算法讨论
    • 11.4 本章测试
  • 12 第十二讲人工神经网络学习算法
    • 12.1 人工神经网络基础知识
    • 12.2 误差反向传播神经网络算法
    • 12.3 weka平台上BP神经网络应用
    • 12.4 本章测试
  • 13 第十三讲深度学习简介
    • 13.1 深度学习基础知识
    • 13.2 深度卷积神经网络
    • 13.3 Tensorflow平台应用简介
    • 13.4 本章测试
  • 14 第十四讲SPSS Modeler
    • 14.1 CRISP-DM和挖掘基本步骤
    • 14.2 基于CHAID的决策树模型
    • 14.3 标志目标的自动建模
    • 14.4 本章测试
  • 15 第十五讲典型数据挖掘算法并行化案例
    • 15.1 MR-Kmeans算法
    • 15.2 Spark Mllib聚类算法
    • 15.3 Spark平台下的DBSCAN算法
  • 16 第十六讲大数据分析应用案例
    • 16.1 搜索引擎日志数据分析
    • 16.2 出租车轨迹数据分析
    • 16.3 新闻组数据分析
  • 17 第十七讲大数据分析与处理展望
    • 17.1 大数据分析与处理展望1
    • 17.2 大数据分析与处理展望2
聚类分析概述