مقاله ترجمه شده مدلسازی ETL خط سیر کد محصول : 961212164
Trajectory ETL Modeling
سال انتشار: 2018
چکیده:
ابزارهای استخراج تبدیل بارگذاری داده (ETL) بخش هایی از یک نرم افزار هستند که مسئول استخراج داده ها از منابع ناهمگن، تمیزکاری، سفارشی سازی و قرار دادن آنها در انبار داده ها می باشد. در واقع، ETL مولفه کلیدی فرآیند انبارسازی داده ها است زیرا که داده های ناصحیح یا گمراه کننده منجر به اتخاذ تصمیمات کسب و کار اشتباه خواهند شد. بنابراین، طراحی صحیح فرآیند ETL در مراحل اولیه پروژه انبارسازی داده ها برای بهبود کیفیت داده ها کاملا موردنیاز می باشد.
بنابراین، این ضروری است تا با ظرافت به فاز مدلسازی ETL غلبه کرد تا مدلهای ساده و قابل درک ایجاد کرد. تحقیقات بسیاری با مدلسازی فرآیندهای ETL سروکار داشتند اما امروزه با ظهور داده های خط سیر، نیازمند مدلسازی تعاملی هستیم که بعد قابلیت تحرک را مدیریت می کند. در این مقاله، مدل موجود را به وسیله در نظرگیری یک خط سیر به عنوان اولین مفهوم بسط می دهیم. بنابراین، پیشنهاد می کنیم تا جریانهای کار ETL را به صورت گراف های چرخه ای جهت دار مدلسازی کنیم که متشکل از سه مولفه اصلی هستند: منابع داده، تمام فعالیت ها و مخازن داده ها