هدف از این پایان نامه استفاده از داده کاوی برای ضد پولشویی و کشف تقلب می باشد
تعداد صفحات | 151 |
حجم | 1755 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | رشته فناوری اطلاعات (IT) |
این پایان نامه در مورد داده کاوی و با عنوان استفاده از داده کاوی برای ضد پولشویی و کشف تقلب می باشد. هدف از این پایان نامه شناسایی جرایم پولشویی در بانکها با استفاده داده کاوی می باشد.
دادهکاوی عبارت است از تحلیل دادهها بهمنظور کشف روابطِ از قبل نامعلومی که اطلاعات مفیدی ارائه میکنند. کشف تقلب به یکی از جا افتادهترین کاربردهای دادهکاوی چه در صنعت و چه در دولت تبدیل شده است. هر چند بستههای نرمافزاری تجاری مختلفی با محیط تعاملی آسان برای کاربران، در حال حاضر در دسترس هستند که انجام کارهای پیچیده دادهکاوی را بهظاهر آسان میکنند و الگوریتمهای دادهکاوی بسیاری برای کشف تقلب مورد استفاده قرار گرفتهاند، اما کاربرد آنها، همچنان از چارچوب سنتی دادهکاوی یعنی انتخاب ویژگی، نمایندگی، گرداوری و مدیریت دادهها، پیشپردازش، دادهکاوی، پسپردازش و ارزیابی عملکرد پیروی میکند.
دادهکاوی این توان را دارد که سناریوهای جدیدی برای کشف نمونههای پولشویی ارائه دهد.دادهکاوی به عنوان فرایندی خودکار برای استخراج اطلاعات و الگوهای جالب توجه، بارز، ضمنی، از قبل ناشناخته و بالقوه مفید از انبار دادههای حجیم، شناخته می شود. . هنگامی که الگوریتمها و تکنیکهای دادهکاوی روی چنین تراکنشهایی اعمال می شوند، الگوهای پنهان از جریان وجوه را پرده برداری میکنند [21]همراه شدن اطلاعات مشتری و دانش فرد خبره منجر به آن میگردد که معاملات مشکوک به طور همروند با زمان اتفاق افتادنشان شناسائی شوند.سیستم ضد پولشویی قابلیت اجرا با الگوریتمهای نظارت شده و بدون نظارت را به طور همزمان دارد.در این سیستم علاوه بر به کارگیری الگوریتمهای رایج در دادهکاوی، شاخصهایی محاسبه میشوند که میتوانند بخوبی ملاکی برای میزان مشکوک بودن عملکرد یک مشتری باشند و بر اساس آن شاخصها، دادههای پرت (خارج از محدوده ) تفکیک و شناسائی شوند.
فهرست مطالب
1 فصل اول کلیات تحقیق 1
1.1 تعریف مسأله و بیان سئوالهای اصلی تحقیق 2
1.2 اهمیت و ضرورت پژوهش 3
1.3 اهداف پژوهش 4
1.4 روش پژوهش 5
1.5 جامعۀ تحقیق 5
2 فصل دوم مطالعه پولشویی، دادهکاوی و ارتباط این دو دیباچه 8
2.1 پولشویی و بررسی ابعاد آن 10
2.1.1 مفهوم پولشویی 10
2.1.2 تاریخچه و خاستگاه پولشویی 11
2.1.3 ایران و ریسک پولشویی 13
2.1.4 انواع پولشویی 14
2.1.5 مراحل پولشویی 14
2.1.6 روشهای پولشویی 16
2.1.8 ضرورت بهره گیری از راه حلهای ضد پولشویی 24
2.1.9 روشهای مبارزه با پولشویی 25
2.1.10 وظایف و اصول الزامی برای بانکها و مؤسسات اعتباری در مبارزه با پولشویی 33
2.1.11 انواع گزارشهای مفید جهت شناسایی موارد مشکوک 42
2.2 دادهکاوی 46
2.2.1 تاریخچه دادهکاوی 46
2.2.2 چارچوبی کلی برای الگوریتمهای دادهکاوی 48
2.2.3 کاربرد دادهکاوی در کشف تقلبات مالی 51
2.2.5 رویکرد دادهکاوی در حل مسائل پولشویی 60
2.2.6 برخی تحقیقات مرتبط 67
2.3 جمع بندی 71
3.1 روششناسی تحقیق 76
3.1.1 روش تحقیق 76
3.2 شیوهها و ابزارهای جمعآوری دادهها 78
3.2.1 بررسی دادههای قابل دریافت 78
3.2.2 بررسی سایر اطلاعات موجود در بانک 79
3.2.3 بررسی محدودیتهای بانک در ارائه اطلاعات 79
3.2.4 بررسی محدودیتهای بانک اطلاعاتی 79
3.2.5 مشخص شدن دادههای مورد نیاز برای فازهای مختلف پروژه . 80
3.2.6 ارائه فرمت دریافت اطلاعات از بانک اطلاعاتی . 80
3.2.7 حجم ، زمان و مکان مورد نیاز جهت ارائه اطلاعات . 81
3.2.8 آمایش دادهها 81
3.3 جامعه نظری و روش نمونهگیری 82
3.4 مفروضات تحقیق 83
3.5 شیوه تجزیه و تحلیل دادهها 84
3.5.1 مرور پیشینه تحقیق 84
3.5.2 نظرخواهی از خبرگان 85
3.5.3 بررسی اسناد و مدارک آرشیوی 94
3.5.4 طراحی مدل ضد پولشویی بر اساس دادهکاوی 98
3.5.5 جمع بندی 106
4 فصل چهارم اجرای تحقیق دیباچه 107
4.1 جزئیات پیادهسازی مدل 108
4.1.1 آمایش دادهها 108
4.1.2 دسته بندی اطلاعات براساس شاخصهای خطی و جدا نمودن بخش مشکوک 109
4.1.3 فیلترینگ و جداسازی اطلاعات مناسب 112
4.1.4 خوشه بندی 116
4.1.5 اجرای الگوریتم نظارتشده 127
4.1.6 جمعآوری نتایج 129
4.2 ارزیابی 129
4.2.1 نحوه تست 130
4.2.2 محاسبه معیارهای Precision، Recall، Specificity و Sensitivity 131
4.3 نتیجه گیری 133
5 فصل پنجم جمعبندی و نتیجهگیری دیباچه 134
5.1 نتیجه گیری 135
5.2 محدودیتهای پژوهش 137
5.3 پیشنهاد برای پژوهشهای آینده 138
6 مراجع 140
فهرست شکلها
شکل 2 1 مدل CRISP-DM 34
شکل 3 1 فلوچارت کشف موارد پولشوئی با دادهکاوی 72
شکل 4 1 توزیع شاخص MLI 79
شکل 4 2 توزیع شاخص MLISQR 79
شکل 4 3 نمودار واریز نقدی مشتریان 80
شکل 4 4 مراحل ایجاد شاخص MLISQR 81
شکل 4 5 جدول دادههای تفکیک شده بر اساس شاخص پولشویی(MLISQR) 82
شکل 4 6 هیستوگرام مجموع واریز در خوشهبندی ایام 84
شکل 4 7 هیستوگرام مجموع برداشت در خوشه بندی ایام 84
شکل 4 8 هیستوگرام تعداد واریز در خوشه بندی ایام 85
شکل 4 9 هیستوگرام تعداد برداشت در خوشه بندی ایام 85
شکل 4 10 خوشهبندی توسط کامینز، کوهنن، گروه متناظر 86
شکل 4 11 خوشه بندی گروه متناظر مدل اول 87
شکل 4 12 خوشه بندی گروه متناظر مدل دوم 88
شکل 4 13 خوشهبندی گروه متناظر مدل سوم 89
شکل 4 14 جدا کردن خوشه اکثریت 90
شکل 4 15 خوشهبندی توسط کامینز و کوهنن 91
شکل 4 16 اجرای الگوریتمهای نظارتشده 93
فهرست جداول
جدول 4 1 معیارهای ارزیابی 95
جدول 4 2 محاسبه معیارهای ارزیابی برای شبکه عصبی 95