Tachyon: A Reliable Memory Centric Storage for Big Data Analytics

Size: px

Start display at page:

Download "Tachyon: A Reliable Memory Centric Storage for Big Data Analytics"

Willa May
10 years ago
Views:

1 Tachyon: A Reliable Memory Centric Storage for Big Data Analytics a Haoyuan (HY) Li, Ali Ghodsi, Matei Zaharia, Scott Shenker, Ion Stoica June 30 th, 2014 Spark San Francisco UC Berkeley

2 Outline Overview Research Open Source Future

3 Outline Overview Research Open Source Future

4 Memory is King RAM throughput increasing exponen9ally Disk throughput increasing slowly Memory- locality key to interac9ve response 9me

5 Realized by many Frameworks already leverage memory 5

6 Problem solved? 6

7 An Example: - Fast in- memory data processing framework Keep one in- memory copy inside JVM Track lineage of opera9ons used to derive data Upon failure, use lineage to recompute data map Lineage Tracking join reduce filter map

opera9ons used to derive data Upon failure, use lineage

8 Issue 1 Different jobs share data: Slow writes to disk storage engine & execution engine same process (slow writes) block 1 block 3 Spark Task Spark mem block manager block 3 block 1 Spark Task Spark mem block manager block 1 block 3 block 2 block 4 HDFS disk 8

block 3 Spark Task Spark mem block manager block 3 block 1 Spark

9 Issue 1 Different frameworks share data: Slow writes to disk storage engine & execution engine same process (slow writes) block 1 block 3 Spark Task Spark mem block manager Hadoop MR YARN block 1 block 3 block 2 Block 4 HDFS disk 9

writes) block 1 block 3 Spark Task Spark mem block

10 Issue 2 execution engine & storage engine same process block 1 block 3 Spark Task Spark memory block manager block 1 block 3 block 2 block 4 HDFS disk 10

11 Issue 2 execution engine & storage engine same process block 1 block 3 crash Spark memory block manager block 1 block 3 block 2 block 4 HDFS disk 11

12 Issue 2 Process crash: lose all cache execution engine & storage engine same process crash block 1 block 3 block 2 block 4 HDFS disk 12

13 Issue 3 duplicate memory per job & GC execution engine & storage engine same process (duplication & GC) block 1 block 3 Spark Task Spark mem block manager block 3 Block 1 Spark Task Spark mem block manager block 1 block 3 block 2 block 4 HDFS disk 13

Spark Task Spark mem block manager block 3 Block 1 Spark Task

14 Tachyon Reliable data sharing at memory- speed within and across cluster frameworks/jobs 14

15 Solu9on Overview Basic idea Push lineage down to storage layer Use memory aggressively Facts One data copy in memory Rely on recomputa9on for fault- tolerance

16 Stack Computation Frameworks (Spark, MapReduce, Impala, Tez, ) Tachyon Existing Storage Systems (HDFS, S3, GlusterFS, )

17 Architecture 17

18 Lineage 18

19 Issue 1 revisited Different frameworks share at memory- speed execution engine & storage engine same process (fast writes) block 1 Spark Task Spark mem Hadoop MR YARN block 1 block 3 block 1 Block 3 block 2 block 4 block 2 Block 4 Tachyon HDFS in- memory disk HDFS disk 19

1 Spark Task Spark mem Hadoop MR YARN block 1 block 3 block 1 Block

20 Issue 2 revisited execution engine & storage engine same process block 1 Spark Task Spark memory block manager block 1 block 3 block 2 block 4 Tachyon HDFS in- memory disk 20

21 Issue 2 revisited execution engine & storage engine same process crash Spark memory block manager block 1 block 3 block 2 block 4 Tachyon HDFS in- memory disk block 1 block 3 block 2 block 4 HDFS disk 21

22 Issue 2 revisited process crash: keep memory- cache execution engine & storage engine same process crash block 1 block 3 block 2 block 4 Tachyon HDFS in- memory disk block 1 block 3 block 2 block 4 HDFS disk 22

23 Issue 3 revisited Off- heap memory storage one memory copy & no GC execution engine & storage engine same process (no duplication & GC) Spark Task Spark mem Spark Task Spark mem block 1 block 3 block 1 Block 3 block 2 block 4 block 2 Block 4 Tachyon HDFS in- memory disk HDFS disk 23

24 Outline Overview Research Open Source Future

25 Ques9on 1: How long to get missing data back? That server contains the data computed last month! 25

26 Lineage enables Asynchronous Checkpoin9ng 26

27 Edge Algorithm Checkpoint leaves Checkpoint hot files Bounded Recovery Cost 27

28 Ques9on 2: How to allocate recomputa9on resource? Would recomputa9on slow down my high priority jobs? Priority Inversion? 28

29 Recomputa9on Resource Alloca9on Priority Based Scheduler Fair Sharing Based Scheduler 29

30 Comparison with in Memory HDFS

31 Further Improve Spark s Performance Grep

32 Master Faster Recovery

33 Recomputa9on Resource Consump9on 33

34 Outline Overview Research Open Source Future

35 A Open Source Status Apache License, Version (Feb 2014) 15+ Companies Spark and MapReduce applications can run without any code change

36 Release Growth Tachyon 0.5: -? contributors Tachyon 0.4: - 30 contributors Tachyon 0.2: - 3 contributors Tachyon 0.3: - 15 contributors Apr 13 Oct 13 Feb 14 July 14 36

37 Contributors Outside of Berkeley More than 75% 37

38 Tachyon is the Default Off- Heap Storage SoluHon for. Thanks to Redhat!

39 Thanks to Redhat!

40 Commercially Supported By ADgeo Thanks to Redhat!

41 in 41

42 Spark/MapReduce/Shark without Tachyon Spark val file = sc.textfile( hdfs://ip:port/path ) Hadoop MapReduce hadoop jar hadoop- examples jar wordcount hdfs://localhost:19998/input hdfs://localhost: 19998/output Shark CREATE TABLE orders_cached AS SELECT * FROM orders;

43 Spark/MapReduce/Shark with Tachyon Spark val file = sc.textfile( tachyon://ip:port/path ) Hadoop MapReduce hadoop jar hadoop- examples jar wordcount tachyon://localhost:19998/input tachyon:// localhost:19998/output Shark CREATE TABLE orders_tachyon AS SELECT * FROM orders;

44 Spark OFF_HEAP with Tachyon // Input data from Tachyon s Memory val file = sc.textfile( tachyon://ip:port/path ) // Store RDD OFF_HEAP in Tachyon s Memory file.persist(off_heap)

45 Thanks to our Code Contributors! Aaron Davidson Achal Soni Ali Ghodsi Andrew Ash Anurag Khandelwal Aslan Bekirov Bill Zhao Calvin Jia Colin Patrick McCabe Shivaram Venkataraman Cheng Chang Du Li Fei Wang Gerald Zhang Grace Huang Hao Cheng Haoyuan Li Henry Saputra Hobin Yoon Huamin Chen Jey Kottalam Joseph Tang Lukasz Jastrzebski Manu Goyal Mark Hamstra Nick Lanham Orcun Simsek Pengfei Xuan Qifan Pu Qianhao Dong Raymond Liu Reynold Xin Robert Metzger Rong Gu Sean Zhong Srinivas Parayya Tao Wang Timothy St. Clair Vamsi Chitters Xi Liu Xiaomin Zhang 45

46 Outline Overview Research Open Source Future

47 Goal? 47

48 Beper Assist Other Components MapRe duce Spark Tez Shark GraphX Impala Tachyon HDFS S3 Localfs Gluster fs NFS Ceph Welcome CollaboraHon!

49 Short Term Roadmap Ceph Integra9on (Redhat) Hierarchical Local Storage (Intel) Further improver Shark Performance (Yahoo) Beper support for Mul9- tenancy (AMPLab) Many more from AMPLab and Industry Collaborators. 49

50 Your Requirements?

51 Tachyon Summary High-throughput, fault-tolerant memory centric storage, with lineage as a first class citizen Further improve performance for frameworks such as Spark, Hadoop, and Shark etc. Healthy community with 15+ companies contributing

52 Thanks! Ques,ons? More Informa,on: h5p://tachyon- project.org h5ps://github.com/amplab/tachyon

Tachyon: memory-speed data sharing

Tachyon: memory-speed data sharing Ali Ghodsi, Haoyuan (HY) Li, Matei Zaharia, Scott Shenker, Ion Stoica UC Berkeley Memory trumps everything else RAM throughput increasing exponentially Disk throughput