09 April 2010

Compress and Expand Stage

Compress stage ทำหน้าที่บีบอัด data set โดยใช้ UNIX compress หรือ GZIP utility มันจะ convert data set จาก sequence of records ไปเป็น stream of raw binary data ส่งผลให้การ write ข้อมูลลง data set นั้นเร็วขึ้น และเปลืองที่น้อยลง

อย่างไรก็ตาม data set ที่ถูก compress แล้วจะไม่สามารถนำไปใช้งานต่อได้ ยกเว้น Copy Stage เพราะ Copy Stage ไม่ได้ทำอะไรแค่ move ตรงไปตรงมา

ถ้าจะนำ data set ที่ถูก compress ไปใช้งาน เราต้อง expand ให้มันกลับเข้าสู่ format ปกติเสียก่อนโดยใช้ Expand stage

No comments: