close
Daily News

ELT гэж юу вэ? Тиймээ ETL биш ELT

Бид өмнө нь ETL гэж юу болох талаар өгүүлж байсан. Байгууллагууд өгөгдөл боловсруулах, зөв зохистой хадгалж үйл ажиллагаа болон бусад зүйлсд дүн шинжилгээ хийж бизнестээ ашиг тусыг нь хүртэх гол зорилготой байдаг. Мэдээж үүнийг хийхийн тулд өгөгдөл цуглуулалт, цэвэрлэлт гэх мэт ажиллагаан дээр ETL төрлийн tool-үүд хэрэг болдог. Тэгвэл ELT гэдэг шинэ ойлголт бий болоод багагүй хугацааг мөн өнгөрөөгөөд байна. Тиймээ ELT та зөв уншсан ямар нэгэн үсэг сольж бичсэн эсвэл андуурсан зүйл огт байхгүй.

ELT гэж юу вэ? Сүүлийн жилүүдэд байгууллагын серверүүд нь cloud-рүү шилжих шилжилт ихэссэн. Энэ өөрчлөлтийг дагаад өгөгдөлийг боловсруулах байдалд мөн өөрчлөлтүүд орж эхэлж байгаа ба энэ өөрчлөлт нь ETL-с ELT-рүү шилжих эхлэл болж хувирч байгаа юм. ELT гэдэг нь “задлах, ачаалах, хувиргах” гэсэн утга дараалал бөгөөд өгөгдлийг дамжуулах эх үүсвэрийн системээс cloud data warehouse-рүү хуулбарлахад ашигладаг процесс гэж хэлж болно.

  • Extraction: Эхний алхам бол задлах. Энэ нь эх системээс өгөгдлийг хуулах үйлдэлийг хэлнэ. Өөрөөр хэлбэл ямар өгөгдөлийг зөөвөрлөх гэж байгаа тухайн өгөгдөлөө авахад бэлдэж буй процесс.
  • Loading: Ачааллах буюу өгөгдлийг ямар системд байршуулж оруулах. Өгөгдлийг байршуулах эх үүсвэр нь data warehouse эсвэл data lake аль нь байх боломжтой.
  • Transformation: Өгөгдөл нь зорилтот системд байршиж орсоны дараа байгууллагууд шаардлагатай бүх өөрчлөлтийг оруулах боломжтой болдог. Зарим тохиолдолд өгөгдөлийг байршуулахдаа тодорхой хувиргалтуудыг хийж оруулдаг. Ерөнхийдөө байгууллагууд түүхий өгөгдлийг өөр өөр хэрэгсэл, бизнесийн поцесст ашиглахын тулд янз бүрээр өөрчилдөг.

Нэг хэсэг нь ELT нь ETL-н дараагийн хөгжилийн үе шат гэж тодорхойлоод байгаа. ELT бол өгөгдөл ачаалахаас өмнө хувиргалт хийдэггүй ачаалдагаараа ETL-н процессоос ялгаатай байдаг байна.

ETL төрлийн хэрэгсэлүүд нь өгөгдлийг очих газар-руу ачаалахаас өмнө хувиргалтыг ажиллуулах, боловсруулах шаардлагатай байдаг. Магадгүй энэ нь зарим тохиолдолд төдийлөн тохиромжтой шийдэл байхгүй байж болно. ELT нь энэ тохиолдолд өгөгдлийг ачаалаад дууссаны дараа data warehouse-д түшиглэж хувиргалтыг хийдэг. Ингэснээр өгөгдлийг илүү хурдан зөөвөрлөх, ачааллах оновчтой процесс болдог.

Гэхдээ ELT ч тэр ETL ч тэр аль алийг нь тухайн ажлын онцлогт тохируулан хэрэглэх нь зөв шийдэл гэж ихэнх мэргэжилтэнүүд үзэж буй. Жнь: ETL нь ачаалах үе шатнаас өмнө өгөгдлийг хувиргадаг тул очих газар нь тодорхой өгөгдлийн формат шаардагдах үед хамгийн тохиромжтой процесс. Магадгүй очих газар өгөгдлийг хувиргах боломж хязгаарлагдмал эсвэл аюулгүй бйадлын хязгаарлалт, тухайн олон өгөгдлийг хадлагах газар байхгүй гэх мэтчилэн шалтгаанууд тулгарч болно. Тэгвэл очих газар нь гадны cloud гэвэл Amazon Redshift, Google BigQuery, Snowflake, and Microsoft Azure SQL Монголын FIBO cloud байх юм бол ELT нь илүү сайн зохицно.

Нэгэнт бид ELT-н талаар ярьж байгаа учир түүний бизнест үзүүлж буй үр нөлөө, ашигтай байдлуудаас дурьдах нь зөв байх:

  1. Цаг хугацаа хэмнэлт: ELT нь илүү хурдан хугацаанд өгөгдлийг зөөвөрлөх боломжтой бөгөөд энэ нь хурдацтай явагдаж буй өнөө цагийн бизнесийн орчинд нийцэлтэй.
  2. Өргөтгөх чадвар: ELT хэрэгслийг боловсруулалтын ачаалал нэмэгдсэн нөхцөлд автоматаар хэмжих, тохируулах cloud data warehouse-тай хамт ашиглагддаг. Ийм учир ачаалал даах, хэвийн найдвартай ажиллааг бий болгох зэрэгт илүү ухаалаг зохицуулалтууд орж ирж буй юм. Cloud платформ нь секунд, минутын дотор бараг хязгааргүй scale-тэй байх боломжийг олгодог учир хуучин үеийн data warehouse-ууд зохицохгүй бөгөөд тэдгээрийг шинэчлэхийг шаарддаг.
  3. Уян хатан байдал: BI tool-үүдэд хэрэглэгдэх системийг бий болгож, тэдний хэрэгцээг хангахын тулд та ELT ашиглан data warehouse болон data lake-дээ түүхий өгөгдлийг хуулбарлаж, шаардлагатай үед өөрчлөх, боловсруулах боломжтой болно.

ETL vs ELT ялгаатай байдалыг хураангуйлвал:

  1. ETL бол өгөгдлийг задлах, өөрчлөх, ачаалах үйл явц юм. ELT бол өгөгдлийг хандах, ачаалах, хувиргах процесс юм.
  2. ETL-д data source-с data warehouse-рүү өгөгдөл хувирч шилждэг.
  3. ELT нь өгөгдлийн хувиргалтыг хийхийн тулд data warehouse-д тулгуурладаг. Өөр дээрээ өгөгдлийг ачаалах шаардлага байдаггүй.
  4. ETL нь data warehouse-д ачаалахаасөө өмнө нууцлагдсан, аюулгүй өгөгдлийг цэвэрлэх замаар мэдээллийн нууцлал, нийцлийг хангахад туслах болно.
  5. ETL нь өгөгдлийн нарийн хувиргалтыг хийж чаддаг бөгөөд ELT-с илүү хэмнэлттэй байдаг.
Tags : editor take
ZZ

The author ZZ

Leave a Response