پیکربندی و استفاده از یک جریان داده (Data flow)
با جریانهای داده (Dataflow)، میتوانید دادهها را از چندین منبع متحد کنید و آن دادههای متحد را برای مدلسازی آماده کنید. هر زمان که یک Dataflow ایجاد میکنید، از شما خواسته میشود که دادههای جریان داده را بهروزرسانی کنید. بهروزرسانی یک جریان داده قبل از اینکه بتواند در یک مدل معنایی در Power BI Desktop استفاده شود یا به عنوان یک جدول پیوندی یا محاسباتی ارجاع داده شود، ضروری است.
توجه داشته باشید جریانهای داده ممکن است در سرویس Power BI برای همه مشتریان وزارت دفاع دولت ایالات متحده در دسترس نباشند.
پیکربندی یک جریان داده (Dataflow)
برای پیکربندی بهروزرسانی یک جریان داده، گزینههای بیشتر (سه نقطه) را انتخاب کرده و Settings را انتخاب کنید.
گزینههای تنظیمات، گزینههای زیادی را برای Dataflow شما ارائه میدهند، همانطور که در بخشهای بعدی توضیح داده شده است.
- مالکیت را به دست بگیرید (Take ownership): اگر مالک جریان داده نیستید، بسیاری از این تنظیمات غیرفعال هستند. برای به دست گرفتن مالکیت Dataflow، برای به دست گرفتن کنترل، گزینه «Take over» را انتخاب کنید. از شما خواسته میشود اعتبارنامهها را ارائه دهید تا از سطح دسترسی لازم اطمینان حاصل شود.
- اتصال دروازه (Gateway Connection): در این بخش، میتوانید انتخاب کنید که آیا جریان داده از یک Gateway استفاده میکند یا خیر، و کدام دروازه استفاده میشود. اگر دروازه را به عنوان بخشی از ویرایش جریان داده مشخص کردهاید، پس از به دست گرفتن مالکیت، ممکن است لازم باشد اعتبارنامهها را با استفاده از گزینه ویرایش جریان داده بهروزرسانی کنید.
- اعتبارنامههای منبع داده (Data source credentials0: در این بخش، انتخاب میکنید که کدام اعتبارنامهها استفاده میشوند و میتوانید نحوه تأیید اعتبار خود را به منبع داده تغییر دهید.
- برچسب حساسیت (Sensitivity label): در اینجا میتوانید حساسیت دادهها را در Dataflow تعریف کنید. برای کسب اطلاعات بیشتر در مورد برچسبهای حساسیت، به نحوه اعمال برچسبهای حساسیت در Power BI مراجعه کنید.
data flow
- بهروزرسانی زمانبندیشده (Scheduled refresh0: در اینجا میتوانید زمانهای روز را که جریان داده انتخابشده بهروزرسانی میشود، تعریف کنید. یک Dataflow میتواند با همان فرکانس یک مدل معنایی بهروزرسانی شود.
- تنظیمات موتور محاسباتی پیشرفته (Enhanced compute engine settings): در اینجا میتوانید تعریف کنید که آیا جریان داده در موتور محاسباتی ذخیره میشود یا خیر. موتور محاسباتی به جریانهای داده بعدی که به این جریان داده ارجاع میدهند، اجازه میدهد تا ادغامها و اتصالها و سایر تبدیلها را سریعتر از حالت عادی انجام دهند. همچنین به DirectQuery اجازه میدهد تا روی جریان داده انجام شود. انتخاب «On» تضمین میکند که جریان داده همیشه در حالت DirectQuery پشتیبانی میشود و هرگونه ارجاعی از موتور بهرهمند میشود. انتخاب «Optimized» به این معنی است که موتور فقط در صورتی استفاده میشود که ارجاعی به این Dataflow وجود داشته باشد. انتخاب «Off» موتور محاسباتی و قابلیت DirectQuery را برای این جریان داده غیرفعال میکند.
- تأیید (Endorsement): میتوانید تعریف کنید که آیا Dataflow گواهی شده یا ارتقا یافته است.
توجه داشته باشید اگر یک فضای کاری که حاوی جریانهای داده است حذف شود، تمام جریانهای داده در آن فضای کاری نیز حذف میشوند. حتی اگر بازیابی فضای کاری امکانپذیر باشد، نمیتوانید جریانهای داده حذف شده را، چه مستقیماً و چه از طریق پشتیبانی مایکروسافت، بازیابی کنید.
یک جریان داده را Refresh کنید
جریانهای داده به عنوان بلوکهای سازنده روی یکدیگر عمل میکنند. فرض کنید یک جریان داده به نام Raw Data و یک جدول پیوندی به نام Transformed Data دارید که شامل یک جدول پیوندی به جریان داده Raw Data است. هنگامی که بهروزرسانی زمانبندی برای جریان داده Raw Data فعال میشود، هر جریان دادهای را که پس از اتمام به آن ارجاع میدهد، فعال میکند. این قابلیت یک اثر زنجیرهای از بهروزرسانیها ایجاد میکند و به شما این امکان را میدهد که از برنامهریزی دستی جریانهای داده اجتناب کنید. هنگام برخورد با بهروزرسانیهای جداول پیوندی، باید از چند نکته ظریف آگاه باشید:
- یک جدول پیوندی فقط در صورتی با بهروزرسانی فعال میشود که در همان فضای کاری وجود داشته باشد.
- اگر جدول منبع در حال بهروزرسانی باشد یا بهروزرسانی جدول منبع لغو شود، یک جدول پیوندی برای ویرایش قفل میشود. اگر هر یک از جریانهای داده در یک زنجیره مرجع بهروزرسانی نشوند، تمام جریانهای داده به دادههای قدیمی برمیگردند (بهروزرسانیهای Dataflow در یک فضای کاری تراکنشی هستند).
- فقط جداول ارجاعشده زمانی بهروزرسانی میشوند که با تکمیل بهروزرسانی منبع فعال شوند. برای زمانبندی همه جداول، باید یک بهروزرسانی زمانبندیشده نیز برای جدول پیوندی تنظیم کنید. برای جلوگیری از بهروزرسانی مضاعف، از تنظیم یک برنامه بهروزرسانی برای جریانهای داده پیوندی خودداری کنید.
Data Flow Refresh
لغو بهروزرسانی جریانهای داده، برخلاف مدلهای معنایی، از قابلیت لغو بهروزرسانی پشتیبانی میکنند. اگر بهروزرسانی برای مدت طولانی در حال اجرا باشد، میتوانید گزینههای بیشتر (بیضیهای کنار Dataflow) را انتخاب کرده و سپس لغو بهروزرسانی را انتخاب کنید.
بهروزرسانی افزایشی (فقط نسخه پریمیوم) جریانهای داده را میتوان طوری تنظیم کرد که بهصورت تدریجی بهروزرسانی شوند. برای انجام این کار، جریان دادهای را که میخواهید برای بهروزرسانی افزایشی تنظیم کنید، انتخاب کنید و سپس آیکون بهروزرسانی افزایشی (Incremental Refresh) را انتخاب کنید.
تنظیم بهروزرسانی افزایشی، پارامترهایی را به Dataflow اضافه میکند تا محدوده تاریخ را مشخص کند.
شرایطی وجود دارد که تحت آنها نباید بهروزرسانی افزایشی را تنظیم کنید:
- جداول پیوندی اگر به یک جریان داده ارجاع میدهند، نباید از بهروزرسانی افزایشی استفاده کنند. جریانهای داده از تا کردن پرسوجو پشتیبانی نمیکنند (حتی اگر جدول DirectQuery فعال باشد).
- مدلهای معنایی که به جریانهای داده ارجاع میدهند، نباید از بهروزرسانی افزایشی استفاده کنند. بهروزرسانیها به جریانهای داده معمولاً کارآمد هستند، بنابراین بهروزرسانیهای افزایشی نباید ضروری باشند. اگر بهروزرسانیها خیلی طول بکشند، استفاده از موتور محاسباتی یا حالت DirectQuery را در نظر بگیرید.
مصرف یک جریان داده Dataflow
یک جریان داده میتواند به سه روش زیر مصرف شود:
- ایجاد یک جدول پیوندی از Dataflow تا به نویسنده دیگری از جریان داده اجازه استفاده از دادهها را بدهد.
- ایجاد یک مدل معنایی از جریان داده تا به کاربر اجازه دهد از دادهها برای ایجاد گزارشها استفاده کند.
- ایجاد یک اتصال از ابزارهای خارجی که میتوانند از فرمت CDM (مدل داده مشترک) بخوانند.
مصرف از Power BI Desktop برای مصرف یک جریان داده، Power BI Desktop را باز کنید و Dataflows را در منوی کشویی Get Data انتخاب کنید.
توجه داشته باشید اتصالدهندهی Dataflows از مجموعهای متفاوت از اعتبارنامهها نسبت به کاربر فعلی وارد شده استفاده میکند. این طراحی برای پشتیبانی از کاربران multi-tenant انجام شده است.
جریان داده و جداولی را که میخواهید به آنها متصل شوید، انتخاب کنید.
توجه داشته باشید شما میتوانید به هر Dataflow یا جدولی، صرف نظر از اینکه در کدام فضای کاری قرار دارد و اینکه آیا در یک فضای کاری Premium یا non-Premium تعریف شده است یا خیر، متصل شوید.
اگر DirectQuery در دسترس باشد، از شما خواسته میشود که انتخاب کنید آیا میخواهید از طریق DirectQuery یا Import به جداول متصل شوید.
در حالت DirectQuery، میتوانید به سرعت مدلهای معنایی در مقیاس بزرگ را به صورت محلی بررسی کنید. با این حال، نمیتوانید تبدیلهای بیشتری انجام دهید.
استفاده از Import، دادهها را به Power BI میآورد و مستلزم آن است که مدل معنایی مستقل از جریان داده بهروزرسانی شود.
برای خرید لایسنس نرم افزار Power BI ، میتوانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.
میتوانید پاور بی آی دسکتاپ رایگان را دانلود کنید : Power BI desktop download





