大数据分析理论与实践(硕士生课程)


西北大学信息学院

2023年春季学期

时间 周五上午1-4节(前9周)
地点 3110
教师 罗迒哉
办公室 信息学院J601
答疑(Office Hour) 预约

通知

课件

阅读材料 相关链接
  • 课程介绍

链接, 密码: x1xO

  • 传统大数据技术

链接, 密码: BlZa

  • 大数据存储

汇报1:Google GFS

汇报2:HDFS

汇报3:NoSQL: IBM, Oracle, Memcached

汇报4:BigTable: Bigtable: A Distributed Storage System for Structured Data

汇报5:Survey of Distributed File System Design Choices, Ceph

汇报6:RAID

汇报7:文件IO API

汇报8:ZeroCopy: Efficient data transfer through zero copy;   Design and Implementation of Zero-Copy for Linux

  • 传统大数据技术

汇报9:MapReduce:simplified data processing on large clusters, 实验

汇报10:完美Hash

汇报11:线性时间排序: 主材料, 备用材料

大数据基础

海量跨媒体分析

lyx: http://www.lyx.org

致谢