تریس G را که یک ماتریس M×M است و شبکه اعتماد بین کاربران را بیان میکند، در نظر مـی گیـریم. ایـن شـبکه اعتمـاد از ارتباطـاتصریح میان کاربران شکل گرفته است. guv عناصر داخل ماتریس G را نشان مـی دهـد کـه اگـررابطه اعتمادی بین کاربران وجود داشته باشد به آن مقدار 1 و در غیر ایـن صـورت مقـدار صـفراختصاص داده می شود (تانگ و همکاران، 2014).
در مقاله فاضلی، لونی، بلوجین، دراچسلر و اسلوپ (2014)، مقادیر اعتماد صـریح بیـان شـدهمیان کاربران در قالب ماتریس G لحاظ شده و به ماتریس تجزیـه اضـافه شـده اسـت. هـدف ازمقاله حاضر تنها روابط اعتماد صریح بیان شده میان کاربران نیست، بلکه شدت این روابط مد نظر است. به همین دلیل اگر روش معناداری برای اندازهگیری شدت رابطه اعتماد بین کاربران در نظر گرفته شود، میتوان کاربرانی که اثرگذاری بیشتری دارند را از کاربران کمتر اثرگذار تفکیک کـردو از این طریق دقت روش پیشنهادی را افزایش داد. برای این منظور، در گام نخست باید شـدتاعتماد میان کاربران محاسبه شود. از این رو، علاوه بـر مـاتریسG ، مـاتریس S را نیـز در نظـرمی گیریم که S نیز یک ماتریس M×M است و شدت اعتماد میان کاربران را نشان میدهد.
همانطور که در بخش پیشینه نظری تحقیق بیان شد، نظریه هموفیلی مهم ترین نظریه برای استنتاج شدت ارتباطات میان کاربران است (تانگ، چانگ و لیو، 2014). این شباهت مـیتوانـد از
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Quadratic regulariser
جنبه زمینهای یا سـاختاری مطـرح شـود. شـباهت زمینـه ای بـین زوج کـاربران از بازخوردهـا ورتبه بندی آنها در مجموعه موضوعات مشترک به دست میآید که بسته به نوع سیستم مـیتوانـدشامل کالاهای مشترک، اطلاعات یا سرویسهای مشترک باشد. حال آنکـه شـباهت سـاختاری،مبتنی بر توپولوژی مشابه در شبکه تعریف میشود. روابط مربوط به این معیارها نیز در رابطههای 1، 2 و 3 بیان شده است. معیارهای مختلف مربوط به محاسبه شدت اعتمـاد ، بررسـی شـدند تـامشخص شود کدام معیار، برای مدل پیشنهادی بهتر است.
در روش استاندارد تجزیه ماتریس برای پیشبینی امتیاز یک کاربر به یـک کـالا، ترجیحـات کاربر u و خصیصههای محصول i در نظر گرفته شده است. هدف مقالـه حاضـر، افـزودن معیـارشدت اعتماد به ماتریس تجزیه به منظور بررسی تأثیر آن بر دقت پیش بینی امتیازهای داده شـدهبه محصولات است. از این رو، لحاظ کردن شباهت در رتبهدهی شبکه کاربران مـورد اعتمـاد، در کنار رتبه هایی که کاربر مد نظر به محصول داده است، برای بهبود دقت پیشبینی مؤثرتر خواهد بود. بنابراین از میان معیارهای شباهت معرفی شده، شباهت زمینه ای فـاکتور مناسـب تـری بـرایلحاظ کردن در مدل پیشنهادی است. مطابق رابطه 1 و 2، برای شباهت زمینهای، شـدت ارتبـاطبین کاربران زیاد است، اگر هر دو امتیاز بالا یا پایینی به محصـول بدهنـد (امتیازهـای داده شـدهمشابه باشد) یا دو کاربر رتبههای متفاوتی داده باشند، شدت ارتباط بین آنها کم خواهد بود.
توسعه روش تجزیه ماتریس از طریق اضافه کردن پارامتر شدت اعتماد
با توجه به توضیحات، فرض شده است امتیازی که یک کاربر به یک کـالا تخصـیص مـیدهـد،تحت تأثیر علاقه ذاتی خود کاربر و میزان اثرگذاری سایر کاربران روی آن کاربر قرار میگیرد. بر اساس این توضیحات، معادله مربوط به حالت استاندارد تجزیه ماتریس را مطابق رابطـه 7 بسـطمیدهیم.
k  ∀u g, uv >0 s uv rui rˆui =αk =1 p quk ik − −(1 α)

 ∀u g, uv >0 s uv ) (7 رابطه
مطابق رابطه 7، برای پیشبینی امتیاز یک کاربر به یک کالا، دو پارامتر اثرگذار است. میـزاناثرگذاری این دو پارامتر از طریق ضریب α مشخص شـده اسـت. پـارامتر نخسـت بـا توجـه بـهترجیحات کاربر u و خصیصههای محصول i تعیین میشود. به این پارامترهـا در روش اسـتانداردتجزیه ماتریس نیز توجه شده است. از سوی دیگر، امتیازی که کاربر u بـه محصـول i مـیدهـد تحت تأثیر کاربرانی که کاربر u به آنها اعتماد دارد، قرار می گیرد؛ به طوری که اگر کـاربران مـورداعتماد u امتیاز بالایی به محصول i داده باشند، کاربر u نیز احتمالاً تمایل خواهد داشت که امتیاز بالایی به محصول i بدهد. همچنین فرض شده است کاربر u بهطور برابر از طرف همه کـاربرانتأثیر نمی پذیرد و تعدادی از این کاربران بر تخمین رتبه کاربر مد نظر تأثیر بیشتری مـی گذارنـد .
میزان این اثرگذاری به شدت اعتماد بین کـاربران بسـتگی دارد کـه مبتنـی بـر فـاکتور شـباهتمحاسبه می شود. در این رابطه،Suv شدت اعتماد مربوط به کاربرانی را نشان میدهد که کاربر u به آنها اعتماد کرده است. مقدار این پارامتر با توجه به رابطـه 5 محاسـبه مـی شـود . R معـرف امتیازهایی است که کاربران مورد اعتماد u به محصولات متفاوت دادهاند. در صورتی که کاربر مد نظر به هیچ کاربر دیگری اعتماد نداشته باشد، پارامتر دوم خودبه خود حذف می شـود. بـرای حـلاین مشکل، یک کاربر دیگر به نام Z در نظر گرفته شده است. ایـن کـاربر، مـورد اعتمـاد همـهکاربران است (, ∀u1 =). همچنین کاربر Z کلیه محصولات را رتبهبندی کرده است. برای هر محصول، امتیازی که کاربر فرضی Z به محصولات اختصاص میدهد با میـانگین امتیاز هـای داده شده به آن محصول برابر است. میانگین امتیازات داده شـده بـا توجـه بـه رابطـه 8 محاسـبه میشود. در این رابطه، X یک متغیر گسسته است که امتیـاز کـاربر Z بـه ازای هـر محصـول رانشان میدهد. این امتیازها در بازه 1 تا 5 قرار دارند. E(X)، میـانگین مقـدار مـورد انتظـار بـرایمتغیر X و برابر با مجموع حاصل ضرب احتمال وقوع هر یک از امتیازهـای ممکـن در مقـدار آنامتیاز است. از طریق تعریف این متغیر می توان اثر امتیاز کلی داده شده به یک محصول در شبکه را نیز بر نمره داده شده به آن محصول از طرف کاربر در نظر بگیریم (ویدلی، 2013).
r max
E (X) =  X P. (X) (8 رابطه
X r= minبا توجه به رابطه جدید تعریف شده برای مقدارrˆui ، مسئله بهینهسازی توضیح داده شده بـرای حالت توسعه یافته روش تجزیه ماتریس، مطابق رابطه 9 خواهد بود.
67059-65845181432277116

 −α− −α+  
min 2 (u,i,r) O (rk 1 p qukik(1) ∀v g, uv >0 s ruv uis)2 β2 (u k, p uk2 + i k, q ik2) (9 رابطه
∀v g, uv >0uv
در ادامه، نتایج به دست آمده از حالت توسعهیافته روش تجزیه ماتریس بررسی مـی شـود و بـاحالت استاندارد روش تجزیه ماتریس و نیز، حالتی که در آن فقط روابط اعتماد صریح لحاظ شده است، مقایسه خواهد شد.
ساختار اجرایی تحقیق
در این بخش، ابتدا دادههای استفاده شده معرفی می شوند، سپس نتـایج بـه دسـت آمـده از حالـتتوسعهیافته روش تجزیه ماتریس، نشان داده خواهد شد.
مجموعه داده
چارچوب پیشنهادی، با استفاده از دادههای جمع آوری شده از وبسایت نقد و بررسـی محصـولاتاپینیونز پیادهسازی شده است. دادههای مورد نیاز شامل دادههای مرتبط با نظرات مانند نام کاربر، نام محصول، دسته و گروه محصول و رتبه محصول است. همچنین دادههای مرتبط بـا پروفایـلکاربران و دادههای مرتبط با شبکه اجتماعی کاربران که بیان کننده ارتباطات اعتماد و عدم اعتماد بین کاربران است نیز لازم است. ویژگیها و خصیصههای آماری مربوط به این دادهها در جـدول2 درج شده است. شکل 2 نیز فراوانی مربوط به امتیازهای اختصاص داده شـده بـه محصـولات را نشان می دهد. دادههای موجود، به دو بخش دادههای آموزش (80 درصـد ) و دادههـای آزمـایش(20 درصد) دسته بندی شده اند.
جدول2. خصیصههای آماری مجموعه داده جمع آوری شده
تعداد مشخصات داده
120492 کاربران
7557600 محصولات
13668320 رتبه بندی ها
841372 اعتماد

شکل
2
.
رتبه

توزیع

نمودار

0
2
4
6
8
10
12
1
3
4
5
2
10
6
×
فراوانیامتیازها