خوشه بندی، شخصی سازی، رفتار خرید، قوانین انجمنی

که اگر عضوی مثل iK به آن اضافه شود باز هم مکرر نخواهد بود:
If Sup (A) minsup then Sup ( A ∪ {iK} ) minsup
از این ویژگی در استخراج مجموعه فقره های مکرر بدین صورت استفاده می شود که در مرحله kام یعنی مرحله به دست آوردن LK ، می توان برخی از اعضای CK را بدون محاسبه درجه پشتیبانی آنها حذف کرد یعنی آن عضوهای CK که حداقل یکی از زیرمجموعه های آن مکرر نباشد[34,35,36].

1) L1 = { large 1-itemset };
2) for ( k = 2; Lk-1 ≠ 0; k++ ) do begin
3) Ck = apriori-gen ( Lk-1 ) ; // New candidates
4) for all transactions t ∈ D do begin
5) Ct = subset ( Ck , t ) ; // Candidates contained in t
6) for all candidates c ∈ Ct do
7) c.count++;
8) end
9) Lk = { c ∈ Ck | c.count ≥ minsup }
10) end
11) Answer =⋃_k▒L k ;
الگوریتم استقرایی

تولید کاندید استقرایی

2-1-3 شیوه تاخر، تناوب، مالی :
برای شناسایی رفتار مشتری، معروفترین روش مدل تاخر، تناوب، مالی است که برای نشان دادن ویژگی های رفتاری مشتری استفاده شده است.مدل های تاخر، تناوب، مالی بیش از 30 سال است که در بازاریابی مستقیم مورد استفاده قرار می گیرند.با توجه به نرخ پاسخ پایین در این صنعت، این مدل ها با هدف بهبود نرخ پاسخ در مشتریان خاص توسعه داده شدند.
فرض اصلی استفاده از مدل تاخر، تناوب، مالی این است که الگوهای آتی خرید و بازرگانی مشتری مشابه الگوهای گذشته و فعلی آن است.
مقادیر جمع آوری شده تاخر، تناوب، مالی خلاصه سازی می شود تا الگوهای رفتاری مشتری را مشخص کند.
متغیر های تاخر، تناوب، مالی بصورت زیر تعریف می شوند:
تاخر: آخرین خرید مشتری
تناوب: تعداد کل خریدها در طول یک دوره معین
مالی: مقدار مالی صرف شده در طول همان دوره معین
رویکردهای زیادی این 3 بعد از داده تراکنشی مشتری را برای دسته بندی کردن رفتار مشتری مدل می کنند.بعد اول تاخر است که اشاره به مدت زمان از شروع یک تراکنش دارد.بعد دوم تناوب است که اشاره به این دارد که یک مشتری چه تعداد محصول را در طی یک دوره معین خریده است.سرانجام بعد مالی، مقدار مالی که مشتری در طول یک دوره صرف کرده است را اندازه می گیرد[37].
تاخر، تناوب، مالی در صنعت های گوناگونی مورد استفاده قرار میگیرد و متناسب با هر صنعت پارامترهای دیگری نیز می توان به آن اضافه کرد[38,39,40].
برای مثال طبق معیاردهی تاخر، تناوب، مالی در یک تحقیق واقعی که در جدول ( 2-2 ) آمده است، معیار تاخر، تناوب، مالی یک مشتری که آخرین خرید او در تاریخ 2006/06/27 بوده و تعداد دفعات خرید او در سال 2006 ، 4 بار بوده است و در کل مقدار 40000 خرج کرده است ( 2,3,2 ) می باشد[39].
جدول 2-2 : مثال معیاردهی RFM
Scaling
Scaling name
Recency
Frequency
Monetary
5
Very high
2006/12/19~2006/12/31
Over 30records
Over 250001
4
High
2006/11/10~2006/12/18
6-29 records
103001-250000
3
Medium
2006/09/15~2006/11/09
3-5 records
52151-103000
2
Low
2006/06/15~2006/09/14
2 records
20001-52150
1
Very low
2006/01/01~2006/06/14
One record
Under 20000

2-2 پیشینه تحقیقاتی:
با رشد روز افزون اینترنت علاقه شرکت های تجاری و صاحبان کالا به تبلیغات اینترنتی نیز افزایش پیدا کرده است و شرکت های تجاری در رقابت شدید با هم سعی در حفظ مشتریان خود و جذب مشتریان جدید دارند.یک راه حل برای این کار این است که تبلیغاتی هدفمند برای مشتریان عرضه کنند و به مشتریان خود آنچه را که مطابق علایق آن ها است، پیشنهاد دهند.یکی از چالش های مهم در توسعه تجارت الکترونیک و تبلیغات اینترنتی و هدفمند، شخصی سازی تبلیغات برای کاربران است.یعنی تطبیق دادن تبلیغ با ترجیحات فردی کاربران.
تحقیقات زیادی در این زمینه انجام شده و در حال انجام است و در اغلب آنها محققان به دنبال دسته بندی کردن کاربران می باشند تا کاربران و مشتریانی که رفتار خرید مشابهی با هم دارند در یک دسته قرار گیرند و رفتار خرید آن ها برای ارائه پیشنهاد محصولاتی مطابق با ترجیحات و علایق آن ها بررسی شود.زیرا برای شخصی سازی تبلیغات برای مشتریان و کاربران نیاز است تا اطلاعاتی از رفتار خرید آنها در دست داشت.
در اغلب تحقیقاتی که انجام گرفته برای دسته بندی کاربران از الگوریتم خوشه بندی K-means استفاده شده است [41,42,43,39,44,45,54]. و با استفاده از این الگوریتم یا الگوریتم هایی مشابه با این، کاربران یا مشتریانی که رفتار خرید آنها مشابه با یکدیگر می باشد در یک خوشه مشابه قرار می گیرند.
برخی از محققان برای خوشه بندی مشتریان از شیوه تاخر، تناوب، مالی یا بسطی از آن استفاده کرده اند تا توسط معیارهای آن مختصات هر نقطه داده ای ( مشتری ) را در فضای خوشه بندی مشخص کنند و توسط این مختصات نقاط داده ای را خوشه بندی کنند[39,43,46,53]. Liang در تحقیقی از شیوه تاخر، تناوب، مالی بهره برد تا مشتریان صنعت نگهداری خودرو را توسط تکنیک های خوشه بندی، بر اساس ارزش آنها دسته بندی کند[53]. در تحقیق دیگری از شیوه تاخر، تناوب، مالی برای تعیین ارزش چرخه زندگی مشتریان استفاده شده و بر این اساس مشتریان توسط الگوریتم k-means دسته بندی شدند[54].
در کارهای دیگری Hwang و همکارانش یک مدل جدید ارزش چرخه زندگی مشتری را بوسیله در نظر گرفتن سود وارد آورده قبلی، سودمندی بالقوه، و احتمال ترک مشتری مطرح کردند و سرانجام مشتریان را بر اساس ارزش آنها بخش بندی کردتد[50]. Kim و Hong فاکتورهای زمان استفاده از اینترنت، تعداد خرید در فروشگاه های برخط، مقدار کلی خرید را برای خوشه بندی مشتریان بازار اینترنتی در نظر گرفت
ه اند و دلیل آن را تاثیر این فاکتورها در قصد مشتری برای خرید عنوان کرده اند[51].
با استفاده از این امتیازدهی و تعیین مختصات برای هر مشتری می توان آنها را با استفاده از تکنیک خوشه بندی از با ارزش ترین تا کم ارزش ترین مشتریان دسته بندی کرد و سیاست های تجاری جداگانه ای را در مورد هر دسته اعمال کرد.این سیاست های تجاری بر اساس نتایج و قوانینی که از رفتارهای خرید مشتریان در هر خوشه بدست می آیند تنظیم می شوند.این قوانین نیز با بکار گیری تکنیک قوانین وابستگی که یکی از تکنیک های داده کاوی است بدست می آید.
پس از خوشه بندی مشتریان، رفتار خرید مشتریان در هر خوشه مورد بررسی قرار می گیرد و با استفاده از تکنیک قوانین انجمنی، قوانینی مانند A,B F ( به این معنی که اگر کالای A و B توسط این مشتری خریداری شود آنگاه به احتمال زیاد کالای F نیز خریداری می شود ) استخراج می شوند که کمک می کنند تا صاحبان کالا بتوانند پیشنهاد درستی به مشتری بدهند و تبلیغ کالایی که او علاقه بیشتری نسبت به خرید آن را دارد به او عرضه کنند و به این ترتیب تبلیغات را برای مشتری شخصی سازی کنند.
در اغلب تحقیقاتی که در زمینه کشف دانش مشتری و کشف الگوهای رفتاری مشتری انجام شده است، برای بکار گیری تکنیک قوانین انجمنی از الگوریتم استقرایی یا بهبودهایی از آن استفاده شده است,52] [40,42,47,48,49.
Liao و همکارانش در تحقیق خود مشتریان بازار توریسم را با استفاده از خوشه بندی دو-گامی1 به چند دسته تقسیم می کنند و با استفاده از الگوریتم استقرایی به استخراج الگوها از هر دسته می پردازند[52]. در تحقیق دیگری Liao و همکارانش از الگوریتم استقرایی و الگوریتم k-means به عنوان تکنیک هایی از قوانین انجمنی و تحلیل خوشه در داده کاوی برای استخراج دانش مشتری جهت استفاده در بسط دادن خط تولید در خرده فروشی استفاده کردند[55]. Liao همچنین در دیگر تحقیق خود با استفاده از الگوریتم خوشه بندی k-means مشتریان را به گروه های مجزا تقسیم کرد و بر روی هر یک از این گروه ها الگوریتم استقرایی را بکار برد تا از نتایج آن در روش فروش مستقیم2 استفاده کند[42]. Liao همچنین همین شیوه را برای جستجو و کشف رفتار خرید گروهی برخط انجام داد[23].
در کار دیگری محمدی و فرجیان برای کاوش رفتار مشتریان بانک از شیوه تاخر، تناوب، مالی استفاده کردند تا ارزش مشتریان را مشخص کنند و بر اساس این توسط الگوریتم K-means مشتریان را خوشه بندی کردند.بعد از خوشه بندی مشتریان از الگوریتم استقرایی برای کشف قوانین انجمنی و رابطه های معنا داری که بین تعداد زیادی از آیتم ها بصورت همگام اتفاق می افتند استفاده کردند و پروفایل مشتریان را ساختند که ویژگی های هر گروه از مشتریان را شرح می دهد تا به برقراری بهتر استراتژی های بازاریابی بانک کمک کنند[56].
در کار دیگری مشتریان بانکداری الکترونیکی را توسط تکنیک تاخر، تناوب، مالی و الگوریتم های خوشه بندی K-Means و SOMS مطابق با پروفایل های شخصی و کارکردهای قبلیشان بخش بندی کردند، سپس الگوریتم استقرایی را بکار بردند تا روابط میان ویژگی های سرویس های بانکداری الکترونیکی را تشخیص دهد.نتایج بدست آمده کمک می کند تا بسته های خدماتی جدیدی برای مشتریان تولید شود که برای هر مشتری و کاربر بانکداری الکترونیکی شخصی شده هستند[57].
با بررسی کارهایی که انجام گرفته است مشخص می شود یکی از راه حل ها برای شخصی سازی تبلیغات یا شخصی سازی خدمات برای مشتریان گام های زیر را دنبال می کند:
1. آماده سازی داده
2. معیاردهی ارزش مشتری با استفاده از شیوه تاخر، تناوب، مالی
3. خوشه بندی مشتریان بر اساس ارزش آنها که معمولا توسط الگوریتم k-means یا بهبودهایی از آن انجام می گیرد.
4. استخراج دانش مشتری و قوانین انجمنی که معمولا توسط الگوریتم استقرایی یا بهبودهایی از آن بر روی هر یک از خوشه ها انجام می گیرد.
5. استفاده از نتایج بدست آمده در مراحل قبل برای تعیین استراتژی های بازاریابی جدید و شخصی سازی تبلیغات یا خدمات برای هر دسته از مشتریان.

فصل سوم :
روش شناسی تحقیق

3-1 مقدمه:
همانطورکه در قبل اشاره گردید رهیافت ها و راه حل های فراوانی برای دستیابی به علایق مشتریان جهت ارائه خدمات و یا عرضه محصولات به مشتریان بر اساس این علایق مطرح گردید که از جمله آنها رهیافت مبتنی بر داده کاوی اطلاعات خریدهای قبلی مشتریان می باشد.طبق مطالعاتی که صورت گرفت، دیدیم که بیشتر تحقیقاتی که در این زمینه انجام شد و مورد استفاده قرار گرفت از الگوریتم خوشه بندی K-Means جهت دسته بندی مشتریان و کاربران استفاده شد.اما به خاطر عیوبی که این الگوریتم دارا می باشد و همچنین عدم فازی بودن این الگوریتم ( که منجر به اختصاص دادن هر مشتری تنها به یک خوشه می شود ) ما به ارائه یک مدل جدید که به اصلاح این عیوب نیز می پردازد علاقه مند شدیم که این مدل و فرایندهای آن در ادامه این فصل بصورت مرحله به مرحله مورد بررسی قرار گرفته است.
شکل (3-1) شمای کلی مدل و فرایندهایی که در آن وجود دارند را نشان می دهد:

شکل3-1: فرایند شخصی سازی تبلیغات توسط داده کاوی
مرحله اول مرحله آماده سازی داده ها می باشد و بعد از آن ارزش مشتریان با استفاده از معیار تاخر، تناوب و مالی مقیاس دهی و تعیین می شود.با توجه به این ارزش ها
ی تعیین شده، مشتریان بصورت موازی با الگوریتم های K-Means و K-Harmonic Means خوشه بندی می شوند.الگوریتم K-means بصورت قطعی و خاص مشخص می سازد هر مشتری به کدام خوشه تعلق دارد و الگوریتم استقرایی بر روی هر کدام از خوشه های منتج شده از K-Means اعمال می شود و قوانینی درمورد رفتار خرید مشتریان مربوط به هر خوشه استخراج می کند.در مرحله آخر برای استفاده از این قوانین جهت شخصی سازی تبلیغات برای مشتریان، قوانین هر خوشه را برای هر مشتری که در خوشه بندی K-Harmonic Means دارای درجه تعلق حداقلی مشخصی نسبت به آن خوشه می باشد معتبر در نظر گرفته و از آن استفاده می کنیم.

3-2 اطلاعات مجموعه داده ها و آماده سازی داده:
در این تحقیق از یک مجموعه داده مربوط به یک سایت خرده فروشی اینترنتی استفاده شد. این مجموعه داده طوری طراحی شده است که مشخصات هر کاربر و مشخصات هر خریدی که در سایت انجام می دهد ثبت شود.در این مجموعه داده 10 کالا برای خرید توسط مشتریان وجود دارد که مشخصات آنها در جدولی به نام محصولات در پایگاه داده ثبت شده است و همچنین بخشی از این مشخصات در جدول ( 3-1 ) آمده است. بعد از هر خرید، اطلاعات مربوط به آن خرید که تاریخ خرید، نوع کالا و مشخصات مشتری می باشد در جدولی به نام جدول خرید ثبت می شود.مشخصات مربوط به هر مشتری نیز پس از ثبت نام وی در سایت در جدولی به نام مشتری درج می گردد.
برای راحتی کار به هر کالا یک حرف از حروف الفبای انگلیسی را اختصاص داده شد تا به جای نام آن بکار برده شود که در جدول ( 3-1 ) آمده است.

جدول 3-1 : مشخصات کالاهای موجود

شماره کالا
نام کالا
قیمت کالا
1
دست بند مغناطیسی ( A )
2000
2
جا سوئیچی ( B )
2000
3
مچ بند ورزشی ( C )
2000
4
عطر ( D )
5000
5
روسری سنتی ( E )
5000
6
تابلو ( F )
5000
7
آلبوم عکس ( G )
5000
8
گلدان ( H )
5000
9
ساعت مچی ( I )
10000
10
تی شرت مردانه ( Z )
10000

برای این تحقیق نیاز به آن وجود داشت که مجموعه داده ها ویژگی های زیر را داشته باشند:
1. هر مشتری در هر جلسه کاری بیش از یک خرید انجام داده باشد.
2. تاریخ آخرین خرید هر مشتری از سایت مشخص باشد.
3. تعداد دفعات خرید هر مشتری از سایت مشخص باشد.
4. کل مبلغی که هر مشتری در سایت خرج کرده است مشخص باشد.
تاریخ آخرین خرید هر مشتری از سایت را می توان به راحتی از جدول خرید بدست آورد، همچنین با شمارش تعداد رکوردهای مربوط به هر مشتری در جدول خرید می توان تعداد دفعات خرید هر مشتری از سایت را نیز مشخص کرد و با جمع کردن مبلغ هر خرید توسط هر مشتری می توان مشخص کرد که هر مشتری چه مبلغی را در سایت خرج کرده است.
اما برای اینکه تنها داده هایی را داشته باشیم که در آنها هر مشتری درهر جلسه کاری بیش از یک خرید انجام داده باشد، نیاز داریم تا تمام رکوردهایی که در آنها هر مشتری در یک جلسه کاری تنها یک خری

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *