海韵讲座第78期
题目:新型大数据处理内核初探(New Big Data System Kernel)
主讲人:陈文光 清华大学计算机系教授
时间:2019年12月7日,10:00-11:00
地点:海韵园行政楼C510
报告摘要:Spark是目前主流的大数据系统,但由于使用JVM以及设计局限,面临处理性能差、占用内存多等问题。我们提出了一种新型的大数据处理内核CMR,使用高效的语言实现,采用大粒度任务划分以减少I/O量,采用异步I/O对NVMe设备进行了高效支持,可在单机系统上实现对10TB级数据的高效分析,性能比Spark高出约一个数量级。未来我们将以此为基础扩展为更加完整的大数据系统。
报告人简介:陈文光,清华大学计算机系教授,兼任青海大学计算机系主任。主要研究领域为操作系统、程序设计语言与并行计算。获国家科技进步二等奖一次,部级科技一等奖两次。获得自然科学基金杰出青年基金资助。现为中国计算机学会杰出会员和杰出讲者,副秘书长,青年科技论坛荣誉委员;ACM中国理事会共同主席。
邀请人:刘向荣 计算机科学系