فروش لایسنس Power BI

با ما داده های خود را درک کنید تا برای آینده کسب و کارتان بهتر تصمیم گیری کنید.

پیکربندی و استفاده از یک جریان داده (Dataflow)

پیکربندی و استفاده از یک جریان داده (Dataflow)

پیکربندی و استفاده از یک جریان داده (Data flow)

با جریان‌های داده (Dataflow)، می‌توانید داده‌ها را از چندین منبع متحد کنید و آن داده‌های متحد را برای مدل‌سازی آماده کنید. هر زمان که یک Dataflow ایجاد می‌کنید، از شما خواسته می‌شود که داده‌های جریان داده را به‌روزرسانی کنید. به‌روزرسانی یک جریان داده قبل از اینکه بتواند در یک مدل معنایی در Power BI Desktop استفاده شود یا به عنوان یک جدول پیوندی یا محاسباتی ارجاع داده شود، ضروری است.

توجه داشته باشید جریان‌های داده ممکن است در سرویس Power BI برای همه مشتریان وزارت دفاع دولت ایالات متحده در دسترس نباشند.

پیکربندی یک جریان داده (Dataflow)

برای پیکربندی به‌روزرسانی یک جریان داده، گزینه‌های بیشتر (سه نقطه) را انتخاب کرده و Settings را انتخاب کنید.

پیکربندی و استفاده از یک جریان داده (Dataflow)

گزینه‌های تنظیمات، گزینه‌های زیادی را برای Dataflow شما ارائه می‌دهند، همانطور که در بخش‌های بعدی توضیح داده شده است.

پیکربندی و استفاده از یک جریان داده (Dataflow)

  • مالکیت را به دست بگیرید (Take ownership): اگر مالک جریان داده نیستید، بسیاری از این تنظیمات غیرفعال هستند. برای به دست گرفتن مالکیت Dataflow، برای به دست گرفتن کنترل، گزینه «Take over» را انتخاب کنید. از شما خواسته می‌شود اعتبارنامه‌ها را ارائه دهید تا از سطح دسترسی لازم اطمینان حاصل شود.
  • اتصال دروازه (Gateway Connection): در این بخش، می‌توانید انتخاب کنید که آیا جریان داده از یک Gateway استفاده می‌کند یا خیر، و کدام دروازه استفاده می‌شود. اگر دروازه را به عنوان بخشی از ویرایش جریان داده مشخص کرده‌اید، پس از به دست گرفتن مالکیت، ممکن است لازم باشد اعتبارنامه‌ها را با استفاده از گزینه ویرایش جریان داده به‌روزرسانی کنید.
  • اعتبارنامه‌های منبع داده (Data source credentials0: در این بخش، انتخاب می‌کنید که کدام اعتبارنامه‌ها استفاده می‌شوند و می‌توانید نحوه تأیید اعتبار خود را به منبع داده تغییر دهید.
  • برچسب حساسیت (Sensitivity label): در اینجا می‌توانید حساسیت داده‌ها را در Dataflow تعریف کنید. برای کسب اطلاعات بیشتر در مورد برچسب‌های حساسیت، به نحوه اعمال برچسب‌های حساسیت در Power BI مراجعه کنید.

data flow

  • به‌روزرسانی زمان‌بندی‌شده (Scheduled refresh0: در اینجا می‌توانید زمان‌های روز را که جریان داده انتخاب‌شده به‌روزرسانی می‌شود، تعریف کنید. یک Dataflow می‌تواند با همان فرکانس یک مدل معنایی به‌روزرسانی شود.
  • تنظیمات موتور محاسباتی پیشرفته (Enhanced compute engine settings): در اینجا می‌توانید تعریف کنید که آیا جریان داده در موتور محاسباتی ذخیره می‌شود یا خیر. موتور محاسباتی به جریان‌های داده بعدی که به این جریان داده ارجاع می‌دهند، اجازه می‌دهد تا ادغام‌ها و اتصال‌ها و سایر تبدیل‌ها را سریع‌تر از حالت عادی انجام دهند. همچنین به DirectQuery اجازه می‌دهد تا روی جریان داده انجام شود. انتخاب «On» تضمین می‌کند که جریان داده همیشه در حالت DirectQuery پشتیبانی می‌شود و هرگونه ارجاعی از موتور بهره‌مند می‌شود. انتخاب «Optimized» به این معنی است که موتور فقط در صورتی استفاده می‌شود که ارجاعی به این Dataflow وجود داشته باشد. انتخاب «Off» موتور محاسباتی و قابلیت DirectQuery را برای این جریان داده غیرفعال می‌کند.
  • تأیید (Endorsement): می‌توانید تعریف کنید که آیا Dataflow گواهی شده یا ارتقا یافته است.

توجه داشته باشید اگر یک فضای کاری که حاوی جریان‌های داده است حذف شود، تمام جریان‌های داده در آن فضای کاری نیز حذف می‌شوند. حتی اگر بازیابی فضای کاری امکان‌پذیر باشد، نمی‌توانید جریان‌های داده حذف شده را، چه مستقیماً و چه از طریق پشتیبانی مایکروسافت، بازیابی کنید.

یک جریان داده را Refresh کنید

جریان‌های داده به عنوان بلوک‌های سازنده روی یکدیگر عمل می‌کنند. فرض کنید یک جریان داده به نام Raw Data و یک جدول پیوندی به نام Transformed Data دارید که شامل یک جدول پیوندی به جریان داده Raw Data است. هنگامی که به‌روزرسانی زمان‌بندی برای جریان داده Raw Data فعال می‌شود، هر جریان داده‌ای را که پس از اتمام به آن ارجاع می‌دهد، فعال می‌کند. این قابلیت یک اثر زنجیره‌ای از به‌روزرسانی‌ها ایجاد می‌کند و به شما این امکان را می‌دهد که از برنامه‌ریزی دستی جریان‌های داده اجتناب کنید. هنگام برخورد با به‌روزرسانی‌های جداول پیوندی، باید از چند نکته ظریف آگاه باشید:

  • یک جدول پیوندی فقط در صورتی با به‌روزرسانی فعال می‌شود که در همان فضای کاری وجود داشته باشد.
  • اگر جدول منبع در حال به‌روزرسانی باشد یا به‌روزرسانی جدول منبع لغو شود، یک جدول پیوندی برای ویرایش قفل می‌شود. اگر هر یک از جریان‌های داده در یک زنجیره مرجع به‌روزرسانی نشوند، تمام جریان‌های داده به داده‌های قدیمی برمی‌گردند (به‌روزرسانی‌های Dataflow در یک فضای کاری تراکنشی هستند).
  • فقط جداول ارجاع‌شده زمانی به‌روزرسانی می‌شوند که با تکمیل به‌روزرسانی منبع فعال شوند. برای زمان‌بندی همه جداول، باید یک به‌روزرسانی زمان‌بندی‌شده نیز برای جدول پیوندی تنظیم کنید. برای جلوگیری از به‌روزرسانی مضاعف، از تنظیم یک برنامه به‌روزرسانی برای جریان‌های داده پیوندی خودداری کنید.

Data Flow Refresh

لغو به‌روزرسانی جریان‌های داده، برخلاف مدل‌های معنایی، از قابلیت لغو به‌روزرسانی پشتیبانی می‌کنند. اگر به‌روزرسانی برای مدت طولانی در حال اجرا باشد، می‌توانید گزینه‌های بیشتر (بیضی‌های کنار Dataflow) را انتخاب کرده و سپس لغو به‌روزرسانی را انتخاب کنید.

به‌روزرسانی افزایشی (فقط نسخه پریمیوم) جریان‌های داده را می‌توان طوری تنظیم کرد که به‌صورت تدریجی به‌روزرسانی شوند. برای انجام این کار، جریان داده‌ای را که می‌خواهید برای به‌روزرسانی افزایشی تنظیم کنید، انتخاب کنید و سپس آیکون به‌روزرسانی افزایشی (Incremental Refresh) را انتخاب کنید.

پیکربندی و استفاده از یک جریان داده (Dataflow)

تنظیم به‌روزرسانی افزایشی، پارامترهایی را به Dataflow اضافه می‌کند تا محدوده تاریخ را مشخص کند.

شرایطی وجود دارد که تحت آنها نباید به‌روزرسانی افزایشی را تنظیم کنید:
  • جداول پیوندی اگر به یک جریان داده ارجاع می‌دهند، نباید از به‌روزرسانی افزایشی استفاده کنند. جریان‌های داده از تا کردن پرس‌وجو پشتیبانی نمی‌کنند (حتی اگر جدول DirectQuery فعال باشد).
  • مدل‌های معنایی که به جریان‌های داده ارجاع می‌دهند، نباید از به‌روزرسانی افزایشی استفاده کنند. به‌روزرسانی‌ها به جریان‌های داده معمولاً کارآمد هستند، بنابراین به‌روزرسانی‌های افزایشی نباید ضروری باشند. اگر به‌روزرسانی‌ها خیلی طول بکشند، استفاده از موتور محاسباتی یا حالت DirectQuery را در نظر بگیرید.

مصرف یک جریان داده Dataflow

یک جریان داده می‌تواند به سه روش زیر مصرف شود:

  • ایجاد یک جدول پیوندی از Dataflow تا به نویسنده دیگری از جریان داده اجازه استفاده از داده‌ها را بدهد.
  • ایجاد یک مدل معنایی از جریان داده تا به کاربر اجازه دهد از داده‌ها برای ایجاد گزارش‌ها استفاده کند.
  • ایجاد یک اتصال از ابزارهای خارجی که می‌توانند از فرمت CDM (مدل داده مشترک) بخوانند.

مصرف از Power BI Desktop برای مصرف یک جریان داده، Power BI Desktop را باز کنید و Dataflows را در منوی کشویی Get Data انتخاب کنید.

توجه داشته باشید اتصال‌دهنده‌ی Dataflows از مجموعه‌ای متفاوت از اعتبارنامه‌ها نسبت به کاربر فعلی وارد شده استفاده می‌کند. این طراحی برای پشتیبانی از کاربران multi-tenant انجام شده است.

پیکربندی و استفاده از یک جریان داده (Dataflow)

جریان داده و جداولی را که می‌خواهید به آنها متصل شوید، انتخاب کنید.

توجه داشته باشید  شما می‌توانید به هر Dataflow یا جدولی، صرف نظر از اینکه در کدام فضای کاری قرار دارد و اینکه آیا در یک فضای کاری Premium یا non-Premium تعریف شده است یا خیر، متصل شوید.

پیکربندی و استفاده از یک جریان داده (Dataflow)

اگر DirectQuery در دسترس باشد، از شما خواسته می‌شود که انتخاب کنید آیا می‌خواهید از طریق DirectQuery یا Import به جداول متصل شوید.

در حالت DirectQuery، می‌توانید به سرعت مدل‌های معنایی در مقیاس بزرگ را به صورت محلی بررسی کنید. با این حال، نمی‌توانید تبدیل‌های بیشتری انجام دهید.

استفاده از Import، داده‌ها را به Power BI می‌آورد و مستلزم آن است که مدل معنایی مستقل از جریان داده به‌روزرسانی شود.

 

برای خرید لایسنس نرم افزار Power BI ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Power BI

میتوانید پاور بی آی دسکتاپ رایگان را دانلود کنید : Power BI desktop download

 

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا