روش CRISP-DM چیست؟

  • تاریخ انتشار: 3 آذر 1397
  • تعداد بازدید: 75
img

روش CRISP-DM یک رویکرد ساختاری برای برنامه ریزی یک پروژه داده کاوی ارائه می دهد.


عنوان CRISP-DM برگرفته از حروف اول کلمات cross-industry process for data mining به معنای فرایند میان صنعتی برای داده کاوی است. روش CRISP-DM یک رویکرد ساختاری برای برنامه ریزی یک پروژه داده کاوی ارائه می دهد. این روش، قدرتمند است و عملکرد آن به خوبی اثبات شده است. ما هیچ مالکیتی بر آن نداریم و آن را ابداع نکردیم. اما از کارایی خوب، انعطاف پذیری و سودمند بودن این روش در تجزیه و تحلیل و حل مسائل مربوط به کسب و کار استفاده می کنیم. این روش طلایی تقریبا از طریق مشارکت هر مشتری اجرا می شود.
این مدل یک دنباله یا توالی ایده آل از حوادث و رویدادها است. در عمل بسیاری از وظایف را می توان با ترتیب متفاوت انجام داد و اغلب لازم است که به کارهای قبلی برگردید و یک نگاهی بیاندازید و اقدامات خاصی را تکرار کنید. این مدل سعی نمی کند که همه مسیرهای احتمالی را از طریق فرایند داده کاوی به دست آورد.


مراحل داده کاوی کریسپ


1. درک و شناخت کسب و کار
2. درک و شناخت داده ها
3. تهیه داده ها
4. مدل سازی
5. ارزیابی
6. استقرار

 

تحلیل کریسپ
مرحله یک: تعیین اهداف کسب و کار
اولین مرحله از فرایند CRISP-DM درک و شناخت آن چیزی است که شما می خواهید از یک کسب و کار به دست آورید. سازمان شما ممکن است اهداف رقابتی و محدودیت هایی داشته باشد که باید به طور مناسبی مدیریت و متوازن شوند. هدف این مرحله از فرایند، کشف عوامل مهمی است که می توانند بر نتیجه نهایی پروژه تاثیر می گذارند. نادیده گرفتن این مرحله می تواند همانند تلاش کردن زیاد برای ارائه پاسخ درست به یک سوال اشتباه است (معادل با ضرب المثل آب در هاون کوبیدن).

هدف کسب و کار، اهداف ترمینولوژی کسب و کار را توضیح می دهد و هدف داده کاوی، اهداف پروژه را در شرایط فنی بیان می کند. به عنوان مثال، هدف کسب و کار ممکن است "افزایش فروش کاتالوگ به مشتریان موجود" باشد. هدف داده کاوی ممکن است "پیش بینی تعداد خرید محصولات توسط مشتری، با توجه به خرید آنها در سه سال گذشته، اطلاعات جمعیت شناختی (سن، حقوق، شهر سکونت و غیره) و قیمت محصول" باشد.

خروجی های مورد نظر پروژه چیست؟
1. تعیین اهداف: این بدین معنی است که هدف اصلی خود را از یک دیدگاه تجاری توصیف کنید. ممکن است سؤال های مرتبط دیگری نیز وجود داشته باشد که بخواهید به آنها پاسخ دهید. به عنوان مثال، هدف اولیه شما ممکن است حفظ مشتریان فعلی با پیش بینی زمانی که آنها مستعد حرکت به سوی یک رقیب هستند، باشند. برخی از سوالات مرتبط ممکن است بدین گونه8 باشند: "آیا کانال مورد استفاده، بر ماندن یا رفتن مشتریان تاثیر می گذارد؟" یا "آیا کاهش هزینه های ATM موجب کاهش از دست رفتن مشتریان با ارزش می شود؟"
2. تهیه طرح پروژه: در اینجا شما طرحی را برای دستیابی به داده کاوی و اهداف تجاری توصیف می کنید. این طرح باید مراحلی که باید در طول بقیه پروژه انجام شوند را مشخص کند، از جمله انتخاب اولیه ابزارها و تکنیک ها.
3. معیارهای موفقیت کسب و کار: در اینجا شما معیارهایی را برای تعیین اینکه آیا پروژه از دیدگاه تجاری موفق بوده است یا خیر ارائه می دهید. این معیارها باید به طور ایده آل مشخص و قابل سنجش باشند، به عنوان مثال کاهش ریزش مشتریان به یک سطح مشخص. همچنین هر از چند گاهی لازم است که معیارهای ذهنی تری از قبیل "درک درستی روابط" داشته باشیم. اگر این مورد باشد، لازم است ذکر شود که چه کسی این قضاوت ذهنی را انجام می دهد.
ارزیابی وضعیت فعلی
این مرحله شامل کسب اطلاعات دقیق تر در مورد تمام منابع، محدودیت ها، مفروضات و سایر عواملی است که باید هنگام تعیین اهداف تجزیه و تحلیل داده ها و طرح پروژه مورد توجه قرار گیرند.
1. فهرست منابع: فهرست منابع موجود یا در دسترس پروژه شامل موارد زیر است:
• پرسنل (کارشناسان کسب و کار، کارشناسان داده، پشتیبانی فنی، کارشناسان داده کاوی)
• داده ها (استخراج های ثابت داده، دسترسی به داده های زنده، ذخیره شده یا عملیاتی)
• منابع کامپیوتری (پلت فرم های سخت افزاری)
• نرم افزار (ابزار داده کاوی، سایر نرم افزارهای مربوطه)
2. الزامات، مفروضات و محدودیت ها: یعنی لیست تمام الزامات پروژه شامل برنامه زمانبندی اتمام پروژه، قابل فهم بودن داده و کیفیت مورد نیاز و هرگونه نگرانی درباره امنیت داده و همچنین مسائل قانونی. مطمئن شوید که شما مجاز به استفاده از داده ها هستید. فهرست مفروضات پروژه ممکن است فرض هایی در مورد داده هایی باشد که می توانند در طول داده کاوی تایید شوند، اما ممکن است شامل فرضیه های غیر قابل اطمینان در مورد کسب و کار مربوط به پروژه نیز باشند. بنابراین باید فهرستی از آخرین مفروضاتی که بر اعتبار نتایج تاثیر خواهند گذاشت را به دست آورید. همچنین لیستی از محدودیت های پروژه تهیه کنید. این محدودیت ها ممکن است شامل محدودیت در دسترس بودن منابع باشد، اما محدودیت های تکنولوژیکی مانند اندازه مجموعه داده هایی که برای مدل سازی مناسب هستند نیز ممکن است وجود داشته باشد.
3. خطرات و احتمالات: فهرستی از خطرات یا حوادثی که ممکن است پروژه را به تاخیر بیاندازد یا باعث عدم موفقیت آن شوند، تهیه کنید. برنامه های احتمالی مربوطه را فهرست کنید: اگر این خطرات یا حوادث اتفاق بیفتند چه کاری انجام می دهید؟
4. اصطلاح شناسی (ترمینولوژی): جمع آوری واژه ها و اصطلاحات مربوط به پروژه. این کار به طور کلی دو بخش دارد:
• فهرست واژگان مرتبط، بخشی از درک کسب و کار مربوط به پروژه است. تهیه این واژه نامه یک تمرین آموزشی مفید و نوعی ترویج دانش است.
• تهیه فهرست اصطلاحات داده کاوی، با مثال هایی مربوط به مشکل کسب و کار مورد نظر
5. هزینه ها و مزایا: تجزیه و تحلیل هزینه-سود را برای پروژه انجام دهید و هزینه های پروژه را با سود بالقوه ای که کسب و کار در صورت موفق بودن، کسب می کند، مقایسه نمایید. این مقایسه باید ممکن و شدنی باشد. برای مثال، در یک موقعیت تجاری شما باید از ارزیابی های مالی استفاده کنید.

در صورت نیاز به اطلاعات بیشتر در مورد نقشه راه به  این مقاله مراجعه بفرمایید .
تعیین اهداف داده کاوی کریسپ
هدف کسب و کار، اهداف ترمینولوژی کسب و کار را توضیح می دهد و هدف داده کاوی، اهداف پروژه را در شرایط فنی بیان می کند. به عنوان مثال، هدف کسب و کار ممکن است "افزایش فروش کاتالوگ به مشتریان موجود" باشد. هدف داده کاوی ممکن است "پیش بینی تعداد خرید محصولات توسط مشتری، با توجه به خرید آنها در سه سال گذشته، اطلاعات جمعیت شناختی (سن، حقوق، شهر سکونت و غیره) و قیمت محصول" باشد.
1. معیارهای موفقیت کسب و کار: خروجی های مورد نظر پروژه که شامل دستیابی به اهداف کسب و کار است را شرح دهید.
2. معیارهای موفقیت داده کاوی: معیارهای موفقیت برای پروژه در شرایط فنی را تعریف کنید. برای مثال، یک سطح خاص از صحت پیش بینی ها و یا مجموعه ای از حالات میل به خرید با درجه مشخصی از پیشرفت. همانند معیارهای موفقیت کسب و کار، ممکن است لازم باشد که این موارد را در شرایط ذهنی توصیف کنید، در این صورت فرد یا افرادی که قضاوت ذهنی را انجام می دهند باید شناسایی و ذکر شوند.
تهیه طرح پروژه
طرح در نظر گرفته شده برای دستیابی به اهداف داده کاوی و در نتیجه دستیابی به اهداف کسب و کار را شرح دهید. طرح شما باید مراحلی که در طول بقیه پروژه انجام می شوند را توضیح دهد، از جمله انتخاب اولیه ابزارها و تکنیک ها.
1. طرح پروژه: لیستی از مراحل اجرا شده در پروژه همراه با مدت زمان آنها، منابع مورد نیاز، ورودی ها، خروجی ها و وابستگی ها تهیه کنید. در صورت امکان، تکرارهای بزرگ در فرآیند استخراج داده ها، مثلا تکرار در مراحل مدل سازی و ارزیابی را به طور واضح ذکر کنید. همچنین به عنوان بخشی از طرح پروژه، مهم است که وابستگی بین زمان بندی و ریسک ها را تحلیل کنید. نتایج این تجزیه و تحلیل ها و اقدامات و توصیه های لازم در صورت رخدادن ریسک ها را به طور واضح شرح دهید. در این مرحله ذکر کنید که از چه نوع استراتژی ارزیابی در مرحله ارزیابی استفاده خواهد شد. طرح پروژه شما یک سند پویا خواهد بود. در پایان هر مرحله شما پیشرفت و دستاوردها را بررسی نمایید و طرح پروژه را بر اساس آن به روز رسانی کنید. بررسی خاص این به روز رسانی ها باید بخشی از طرح پروژه باشند.

برای اطلاعات بیشتر می توانید به مطلب تحلیل حساسیت مراجعه فرمایید.


2. ارزیابی اولیه ابزارها و تکنیک ها: در پایان مرحله اول شما باید یک ارزیابی اولیه از ابزارها و تکنیک ها انجام دهید. برای مثال، در اینجا، یک ابزار داده کاوی را انتخاب می کنید که از روش های متفاوت برای مراحل مختلف فرایند پشتیبانی می کند. مهم است که در ابتدای فرایند یعنی از زمانی که انتخاب ابزار و تکنیک ها ممکن است بر کل پروژه تأثیر بگذارد، ارزیابی ابزارها و تکنیک ها انجام شود.

در صورت نیاز به اطلاعات بیشتر در مورد مدیریت ریسک به این مقاله مراجعه بفرمایید .

منبع : www.sv-europe.com

ترجمه شده در موسسه مطالعات راهبردی سپینود شرق
کلیه حقوق این وبسایت متعلق به موسسه سپینود شرق می باشد. انتشار مطالب فقط با ذکر منبع بلامانع است.

نظرتان را ثبت کنید

بیخیال