قابل خودداری شده است. در ضمن با توجه بـهقابلیت یادشده، به تعریف متغیرهایی که تلفیق شده اند یا منتج از متغیرهای دیگرند، نیازی نیست.
برای ایجاد مدل شناسایی تقلب در کارت های بانکی، یک متغیر افراز5 ایجـاد شـد تـا بتـوانداده ها را به دو بخش آموزش و اعتبارسنجی تقسیم بندی کرد. اسـتفاده از داده هـای آزمـایش درایجاد مدل الزامی نیست؛ زیرا اگر داده ای برای آزمایش در نظر گرفته نشود، از داده های آمـوزشبرای پیگیری خطاها استفاده می شود. این موضوع تنها زمان آموزش شبکه را افزایش میدهد. در این پژوهش، بهدلیل محدودبودن تعداد داده های تقلب و استفاده از حداکثر این داده هـا در فراینـدآموزش شبکه، از تخصیص داده های آزمایش خودداری شده است. به واسطه تعریف متغیر افـراز وانتخاب داده هایی که برای آموزش و اعتبارسنجی استفاده خواهند شد، از مجموع 111,349 داده، 66,648 داده (60 درصد) برای آموزش و ایجاد مدل اختصاص یافت و 44,698 داده (40 درصـد )
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Error back propagation
Mean Square Error
Parsimony
Pattern recognition
Partition variable
برای اعتبارسنجی مدل به صورت تصادفی تخصیص داده شد. برای تخصیص تصادفی داده ها بـهمجموعه های یادشده، از توزیع برنولی با احتمال 60 درصد برای متغیر افراز استفاده شده است.
تابع تبدیل انتخاب و استفاده شده برای تمامی نورون هـای لایـه هـای پنهـان، تـابع تانژانـتهیپربولیک1 است. رابطه 1 ، تابع تبدیل یادشده را نشان می دهد. این تابع، مقادیر حقیقی را پس از دریافت به مقداری در بازه (1,1) تبدیل می کند.

( ) = tanh( ) =

(1 رابطه
+
تابع تبدیل Softmax برای واحدهای لایه خروجی انتخـاب شـده اسـت . ایـن تـابع تبـدیل،برداری از المان هایی با مقدار حقیقی را دریافت می کند و به برداری که هر یک از المان هایش در بازه (1,0) قرار می گیرد و مجموع المان هایش برابر یک می شـود ، تبـدیل مـی کنـد . تـابع تبـدیلSoftmax به صورت رابطه 2 است. تابع Softmax زمانی برای نورون های لایه خروجی اسـت فاده می شود که تمامی متغیرهای وابسته از نوع طبقه ای باشند. به همین دلیـل در ایـن پـژوهش کـهمتغیر وابسته از نوع طبقه ای است، تابع Softmax، تابع تبدیل واحدهای لایـ ه خروجـی انتخـاب شده است.
() = Softmax

(2 رابطه
در این پژوهش با توجه به اینکه تعداد داده های متقلبانه (متغیر وابسته با مقدار یـک) محـدوداست، تلاش بر این بوده است که هیچ یک از دادههای متقلبانه از فرایند آموزش حذف نشـود. بـههمین منظور از روش گروهی2 برای آموزش شبکه بهره جویی شده است. الگوریتم بهینـه سـازی3 برای برآورد وزن های سیناپسی استفاده می شود. الگوریتم بهینه سازی از نوع »گرادیـان همجـوارمقیاس بندی شده«4 انتخاب شده است که گونه ای از الگوریتم پس انتشار خطـا شـمرده مـی شـود .
همان طور که پیش از این هم اشاره شد، الگوریتم پـس انتشـار خطـا، نـوعی از الگـوریتم حـداقلمربعات خطا است. این روش برای نوع آموزش گروهی مناسب است و برای آموزش لحظـه ای و نیمه گروهی مناسب نیست. قواعد اختتام آموزش، به ترتیب »یک مرحله بدون کاهش در خطـا « و
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Hyperbolic tangent
Batch training
Optimization algorithm
Scaled Conjugate Gradient (SCG)
»حداکثر 500 دوره1 آموزش (عبور داده ها)« انتخاب شده است. این قواعـد مـیتواننـ د از مسـئلهانطباق بیش از حد2 جلوگیری کنند.
خروجی یک مدل طبقه بندی می تواند یک مقدار حقیقی باشد. سیستم طبقه بندی، این مقادیر حقیقی (شبه احتمال) را برای هر مورد با آستانه افتراق3 (مقـدار بـرش)4 مـی سـنجد و در صـورتبزرگتر بودن از مقدار برش، آن مورد را در طبقه مثبت قرار می دهد.
توضیح اینکه برای هر طبقه متغیر(های) وابسته طبقه ای با تابع تبـدیلSoftmax و خطـای Cross-Entropy، مقداری توسط شبکه محاسبه می شود که این مقدار، احتمال ایـن اسـت کـهیک رکورد به یک طبقه تعلق دارد یا خیر.
همانطور که پیش از این نیز اشاره شد، هدف از ایجاد شـبکه عصـبی پرسـپترون چندلایـه،طبقه بندی تراکنش های کارت های بانکی به دو طبقه سالم و متقلبانـه اسـت کـه ایـن کـار را بـامحاسبه یک شبه احتمال برای هر طبقه در هر تراکنش انجام می دهد. مقدار پیش فرض برای حد آستانه 5/0 فرض شده است که می توان این حد آستانه را تغییر داد. بنابراین مقادیر شـب هاحتمـالبزرگتر از 5/0، متعلـق بـه طبقـه مربوطـه اسـت. از ایـن رو بهتـرین شـبکه عصـبی پرسـپترون انتخابشده برای این پژوهش، شبکه ای با دو لایه پنهـان اسـت. لایـه ورودی ( لایـه اول) ایـنشبکه، 61 گره یا نورون (بدون در نظر گرفتن بایاس5) دارد که از 15 متغیر مستقل بهدست آمـدهاست. شبکه، هریک از طبقه های متغیرهای طبقه ای را یک نورون در نظر مـی گیـرد . بـه همـیندلیل تعداد نورون های لایه ورودی به جای 15 واحد، 61 واحد است.
شبکه منتخب دارای 12 گره (نورون) و یک بایاس در لایه پنهان اول (لایه دوم شـبکه) و 9 گره (نورون) و یک بایاس در لایه پنهان دوم (لایه سوم شبکه) است. لایه آخر (خروجی شـبکه)، دو گره دارد (دو طبقه مربوط به متغیر وابسته) که پس از تـأثیر تـابع تبـدیلSoftmax ، بـرداریشامل مؤلفه هایی با مقدار شبهاحتمال هر طبقه برآورد می کند. با توجه به توضیحاتی که بیان شد، شبکه حاصل را می توان به صورت 61-12-9-2MLP بیان کرد. توضیح اینکه تمامی گـره هـای هـرلایه به تمامی گرههای لایههای قبل متصل است. این اتصال ها به منزله وزن هر یـک از عناصـرشبکه است (شکل 2).

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Epoch
Over fitting

در این سایت فقط تکه هایی از این مطلب با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

Discrimination threshold
Cutoff Value
Bias

شکل 2. شبکه عصبی پرسپترون چندلایه برای شناسایی تقلب در کارت های بانکی
یافته های پژوهش
از آنجا که مدل های ارائه شده این پژوهش به منظور طبقه بندی طراحی شده اند، باید با معیارهـایخاص طبقه بندی ارزیابی شوند. برای ارزیابی عملکرد مدل شبکه عصبی پرسپترون چندلایه، باید طبقه بندی واقعی تراکنش های کار ت های بانکی را با طبقه بندی انجام شده شبکه عصبی مقایسـهکرد و توانایی مدل را در شناسایی تراکنش های متقلبانه (یا مشکوک به تقلب) آزمـود . معیارهـایمندرج در جدول 1 برای ارزیابی عملکرد سیستم طبقه بندی استفاده شده است (برادرسـن، اُنـگ،استفان و بوهمان، 2010). در روابط جدول 1، TP تعداد مثبت های درست؛ FP تعداد مثبت هـاینادرست؛ TN تعداد منفی های درست و FN تعداد منفیهای نادرست است.
زمانی که تعداد منفیها بسیار بیشتر از تعداد مثبت هاست (مانند پژوهش حاضر)، ممکن است که معیار دقت طبقه بندی، معیار مناسبی برای ارزیابی عملکرد نباشد. بنابراین معیارهـای دیگـریمانند میانگین هـای هندسـی (g-mean)1 (تانـگ، ژانـگ، چـاولا و کـراس، 2002) و همچنـینمعیارهای F و Fβ (پاورز، 2011 و تانگ و همکـاران، 2002) را بـرای ارزیـابی عملکـرد سیسـتمطبقه بندی می توان در نظر گرفت که با اضافه کردن TP بـه معـادلات، محاسـبه مـی شـوند . در محاسبه Fβ، مؤلفه β مقداری بین صفر و بینهایت دارد و برای کنترل وزن تخصـیص داده شـده
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Geometric Mean
به TP و P استفاده می شود؛ بدین ترتیب که هرچه β بزرگتـر باشـد، بـه همـان نسـبت اهمیـتبیشتری برای TPR (حساسیت) قائل شده ایم تا P (صحت).
جدول 1. معیارهای ارزیابی عملکرد طبقه بندی
نام معیار نام جایگزین توضیح فرمول محاسبه
852297-415123

نسبت درست1 مثبت حساسیتفراخوانی2 3یا طبقه نسبت بندی موارد شده اند.مثبتی است که به درستی +=

+ نس بت م وارد منف ی اس ت ک ه ب هنادرست، مثبت طبقه بندی شده اند. خطای نوع اول نسبت مثبت
نادرست4
=

+ نسبت موارد منفی است که به درستی طبقه بندی شده اند. ویژگی6 نسبت منفی
درست5
=

+ نس بت م وارد مثبت ی اس ت ک ه ب ه نادرست منفی طبقه بندی شده اند. خطای نوع دوم نسبت منفی
نادرست
+
AC =

+++ نسبت نتایج درست (هم مثبت درست و هم منفی درست) به کل جامعه — دقت7 طبقه بندی
P =

+ نسبت تعداد مثبت های درست به کـلنتایج مثبت (هم مثبت هـای درسـت وهم مثبت های نادرست) صحت8
طبقه بندی

√× – – g-mean1 میانگین
هندسی یک

√× – – g-mean2 میانگین
هندسی دو
=

F – –
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
True Positive Ratio
Sensitivity
Recall
False Positive Ratio
True Negative Ratio
Specificity
Accuracy
Precision
با توجه به هدف اصلی پژوهش که شناسایی بهتر تراکنش های متقلبانه از میـان تـراکنشهـا
است، چهار معیار g-mean2 ،FNR ،TPR و Fβ از میان معیارهای موجود برای معیارهای اصـلیسنجش عملکرد مدل های شبکه عصبی پرسپترون چندلایه انتخا