数据科学

系统讲述数据科学需要的数学和编程技术知识, 聚焦于实用性和Java开发实践, 理解机器学习算法,并学习 Java 库编程。

时间2~3天。

数据统计和应用

  • 数据收集
  • 图表展示
  • 概括性度量
  • 概率和概率分布
  • 统计量及抽样分布
  • 分布
  • 参数估计
  • 假设检验
  • 方差分析
  • 线性回归
  • 时间序列

机器学习技术

  • 数学基础
  • 推荐系统
  • 聚类
  • 分类
  • 回归模型
  • 应用实践

数据科学内容

  • 数据分析处理综述
  • 文本数据处理
  • 数据可视化
  • 数据统计和机器学习的运用

ML 库使用分析

  • Commons.Math
  • Mahout
  • Weka
  • Spark Mllib