تشخیص کانال های کلاه برداری تلگرام با استفاده از تحلیل متن و یادگیری ماشین[پايان نامه فارسي]

سید علی محمد معنوی

شناسگر رکورد: ۵۱۷۸۲
رشته تحصیلی: علوم داده
عنوان: تشخیص کانال های کلاه برداری تلگرام با استفاده از تحلیل متن و یادگیری ماشین
نويسنده: سید علی محمد معنوی
استاد راهنما : دکتر بهنام بهرک
مقطع تحصیلی : کارشناسی ارشد
دانشگاه : خاتم
تاریخ دفاع : ۱۴۰۳
چکیده: ﺩﺭ ﺍﻳﻦ ﭘﮋﻭﻫﺶ، ﺑﺎ ﻫﺪﻑ ﺷﻨﺎﺳﺎﻳﻲ ﻭ ﺗﺸﺨﻴﺺ ﻛﺎﻧﺎﻝﻫﺎﻱ ﻛﻼﻫﺒﺮﺩﺍﺭﻱ ﺩﺭ ﭘﻴﺎﻡﺭﺳﺎﻥ ﺗﻠﮕﺮﺍﻡ، ﺍﺯ ﺗﺮﻛﻴﺒﻲ ﺍﺯ ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﻭ ﺭﻭﺵﻫﺎﻱ ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷﻴﻦ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﺍﺑﺘﺪﺍ، ﻭﻳﮋﮔﻲﻫﺎﻱ ﻣﺨﺘﻠﻔﻲ ﺍﺯ ﻛﺎﻧﺎﻝﻫﺎﻱ ﺗﻠﮕﺮﺍﻣﻲ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪ ﻭ ﺳﭙﺲ ﺍﻳﻦ ﻭﻳﮋﮔﻲﻫﺎ ﺩﺭ ﻣﺪﻝﻫﺎﻱ ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷﻴﻦ ﺑﻪ ﻛﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻧﺪ. ﻣﺪﻝﻫﺎﻱ ﻣﺨﺘﻠﻔﻲ ﻫﻤﭽﻮﻥ ﺟﻨﮕﻞ ﺗﺼﺎﺩﻓﻲ ﻭ ﺷﺒﻜﻪﻫﺎﻱ ﻋﺼﺒﻲ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻨﺪ ﻭ ﻧﺘﺎﻳﺞ ﺁﻥﻫﺎ ﺑﺎ ﻳﻜﺪﻳﮕﺮ ﻣﻘﺎﻳﺴﻪ ﺷﺪ. ﺩﺍﺩﻩﻫﺎﻱ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺎﻣﻞ ﻛﺎﻧﺎﻝﻫﺎﻱ ﻛﻼﻫﺒﺮﺩﺍﺭﻱ ﻭ ﻏﻴﺮﻛﻼﻫﺒﺮﺩﺍﺭﻱ ﺑﻮﺩﻧﺪ ﻛﻪ ﺑﻪ ﻛﻤﻚ ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﻭ ﺗﻌﺎﻣﻼﺕ ﻛﺎﺭﺑﺮﺍﻥ ﺩﺭ ﺍﻳﻦ ﻛﺎﻧﺎﻝﻫﺎ، ﻭﻳﮋﮔﻲﻫﺎﻱ ﻣﺘﻤﺎﻳﺰ ﺁﻥﻫﺎ ﺷﻨﺎﺳﺎﻳﻲ ﺷﺪﻧﺪ. ﭘﺲ ﺍﺯ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻲﻫﺎ، ﺍﺯ ﺭﻭﺵ ﺧﻮﺩﺁﻣﻮﺯﻱ ﺑﺮﺍﻱ ﺷﺒﻪ ﺑﺮﭼﺴﺐ ﺯﺩﻥ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪ. ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ، ﻣﺪﻝ ﺍﻭﻟﻴﻪ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺩﺍﺩﻩﻫﺎﻱ ﺩﺍﺭﺍﻱ ﺑﺮﭼﺴﺐ ﺁﻣﻮﺯﺵ ﺩﺍﺩﻩ ﺷﺪ ﻭ ﺳﭙﺲ ﺑﺮﺍﻱ ﺩﺍﺩﻩﻫﺎﻱ ﺑﺪﻭﻥ ﺑﺮﭼﺴﺐ، ﭘﻴﺶﺑﻴﻨﻲﻫﺎﻳﻲ ﺻﻮﺭﺕ ﮔﺮﻓﺖ ﺗﺎ ﺑﻪ ﺁﻥﻫﺎ ﺷﺒﻪ ﺑﺮﭼﺴﺐ ﺍﺧﺘﺼﺎﺹ ﺩﺍﺩﻩ ﺷﻮﺩ. ﺍﻳﻦ ﺩﺍﺩﻩﻫﺎﻱ ﺷﺒﻪ ﺑﺮﭼﺴﺐ ﺩﺍﺭ ﺳﭙﺲ ﺗﻮﺳﻂ ﻣﺘﺨﺼﺼﺎﻥ ﺍﻧﺴﺎﻧﻲ ﺑﺎﺯﺑﻴﻨﻲ ﻭ ﺑﻪﺻﻮﺭﺕ ﺩﻗﻴﻖ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﻱ ﺷﺪﻧﺪ. ﺍﻳﻦ ﻣﺮﺣﻠﻪ ﺑﻪ ﺑﻬﺒﻮﺩ ﺩﻗﺖ ﻧﻬﺎﻳﻲ ﻣﺪﻝ ﻭ ﺍﻃﻤﻴﻨﺎﻥ ﺍﺯ ﻛﻴﻔﻴﺖ ﺩﺍﺩﻩﻫﺎ ﻛﻤﻚ ﺷﺎﻳﺎﻧﻲ ﻛﺮﺩ. ﻭﻳﮋﮔﻲﻫﺎﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺷﺎﻣﻞ ﻣﺤﺘﻮﺍﻱ ﭘﻴﺎﻡﻫﺎ، ﺗﻌﺪﺍﺩ ﻭ ﻧﻮﻉ ﺗﻌﺎﻣﻼﺕ ﻛﺎﺭﺑﺮﺍﻥ، ﻭ ﻫﻤﭽﻨﻴﻦ ﺗﺤﻠﻴﻞﻫﺎﻱ ﺯﺑﺎﻧﻲ ﺑﺮ ﺍﺳﺎﺱ ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﺑﻮﺩ. ﭘﺲ ﺍﺯ ﺟﻤﻊﺁﻭﺭﻱ ﺍﻳﻦ ﻭﻳﮋﮔﻲﻫﺎ، ﻣﺪﻝﻫﺎﻱ ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷﻴﻦ ﺁﻣﻮﺯﺵ ﺩﺍﺩﻩ ﺷﺪﻧﺪ ﺗﺎ ﺑﺘﻮﺍﻧﻨﺪ ﻛﺎﻧﺎﻝﻫﺎﻱ ﻛﻼﻫﺒﺮﺩﺍﺭﻱ ﺭﺍ ﺑﺎ ﺩﻗﺖ ﺑﺎﻻﻳﻲ ﺍﺯ ﻛﺎﻧﺎﻝﻫﺎﻱ ﻋﺎﺩﻱ ﺗﻔﻜﻴﻚ ﻛﻨﻨﺪ. ﺩﺭ ﺍﻳﻦ ﺗﺤﻘﻴﻖ، ﻣﺪﻝﻫﺎﻱ ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷﻴﻦ ﺍﺯ ﺟﻤﻠﻪ ﺟﻨﮕﻞ ﺗﺼﺎﺩﻓﻲ ﻭ ﺷﺒﻜﻪﻫﺎﻱ ﻋﺼﺒﻲ ﺑﻪ ﻛﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻧﺪ. ﻧﺘﺎﻳﺞ ﻧﺸﺎﻥ ﺩﺍﺩ ﻛﻪ ﺷﺒﻜﻪﻫﺎﻱ ﻋﺼﺒﻲ، ﺑﻪ ﺩﻟﻴﻞ ﺗﻮﺍﻧﺎﻳﻲ ﺑﺎﻻﻱ ﺁﻥﻫﺎ ﺩﺭ ﻳﺎﺩﮔﻴﺮﻱ ﺍﻟﮕﻮﻫﺎﻱ ﭘﻴﭽﻴﺪﻩ ﻭ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻲﻫﺎﻱ ﭘﻨﻬﺎﻥ ﺩﺭ ﺩﺍﺩﻩﻫﺎ، ﺩﻗﺖ ﺑﻴﺸﺘﺮﻱ ﺩﺭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﻣﺪﻝﻫﺎﻱ ﺳﻨﺘﻲ ﺩﺍﺷﺘﻨﺪ. ﻣﻘﺎﻳﺴﻪ ﻧﺘﺎﻳﺞ ﺍﻳﻦ ﻣﺪﻝﻫﺎ ﺑﺎ ﺭﻭﺵﻫﺎﻱ ﻗﺒﻠﻲ ﻧﺸﺎﻥ ﺩﺍﺩ ﻛﻪ ﺗﺮﻛﻴﺐ ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﻭ ﺷﺒﻜﻪﻫﺎﻱ ﻋﺼﺒﻲ ﻣﻲﺗﻮﺍﻧﺪ ﺩﻗﺖ ﻭ ﺻﺤﺖ ﺗﺸﺨﻴﺺ ﺭﺍ ﺑﻪ ﻃﻮﺭ ﻗﺎﺑﻞ ﺗﻮﺟﻬﻲ ﺍﻓﺰﺍﻳﺶ ﺩﻫﺪ. ﺩﺭ ﻧﻬﺎﻳﺖ، ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﻱ ﺑﺎ ﺑﻬﺒﻮﺩ ﺣﺪﻭﺩ ۱۰ ﺩﺭﺻﺪﻱ ﻧﺴﺒﺖ ﺑﻪ ﻛﺎﺭﻫﺎﻱ ﭘﻴﺸﻴﻦ، ﺑﻪ F۱_score ۹۵ ﺩﺭﺻﺪ ﺩﺳﺖ ﻳﺎﻓﺖ. ﺍﻳﻦ ﺑﻬﺒﻮﺩ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﻛﺎﺭﺍﻳﻲ ﺑﺎﻻﻱ ﻣﺪﻝ ﺩﺭ ﺷﻨﺎﺳﺎﻳﻲ ﻛﺎﻧﺎﻝﻫﺎﻱ ﻛﻼﻫﺒﺮﺩﺍﺭﻱ ﺍﺳﺖ ﻭ ﺗﺄﻛﻴﺪ ﻣﻲﻛﻨﺪ ﻛﻪ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﻫﻤﺮﺍﻩ ﺑﺎ ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷﻴﻦ، ﺑﻪ ﻭﻳﮋﻩ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺷﺒﻜﻪﻫﺎﻱ ﻋﺼﺒﻲ ﻭ ﺭﻭﺵ ﺳﻠﻒﺗﺮﻳﻨﻴﻨﮓ ﺑﺮﺍﻱ ﺷﺒﻪ ﺑﺮﭼﺴﺐ ﺯﺩﻥ ﻭ ﺑﺎﺯﺑﻴﻨﻲ ﺍﻧﺴﺎﻧﻲ، ﻣﻲﺗﻮﺍﻧﺪ ﺑﻪ ﻃﻮﺭ ﻣﺆﺛﺮﻱ ﺩﺭ ﺷﻨﺎﺳﺎﻳﻲ ﺗﻬﺪﻳﺪﺍﺕ ﺁﻧﻼﻳﻦ ﻭ ﺣﻔﺎﻇﺖ ﺍﺯ ﻛﺎﺭﺑﺮﺍﻥ ﺩﺭ ﺑﺮﺍﺑﺮ ﻛﻼﻫﺒﺮﺩﺍﺭیﻫﺎی اینترنتی ﻣﻮﺛﺮ ﺑﺎﺷﺪ. ﻭﺍﮊﻩﻫﺎی ﻛﻠﻴﺪی: ﺗﻠﮕﺮﺍﻡ، ﺗﺤﻠﻴﻞ ﻣﺘﻦ ﺷﺒﻜﻪﻫﺎی ﺍﺟﺘﻤﺎعی، ﻳﺎﺩﮔﻴﺮی ﻣﺎﺷﻴﻦ، ﺗﺸﺨﻴﺺ ﻛﻼﻫﺒﺮﺩﺍﺭی، ﺍﺳﺘﺨﺮﺍﺝ ویژگی، ﻃﺒﻘﻪﺑﻨدی ﺩﺍﺩﻩﻫﺎ.
شماره ثبت نسخه جلد بخش مرجع شماره بازیابی در دست امانت تاریخ بازگشت ملاحظات
284648 1
Copyright 2025 by Payam Hannan co ltd. PayamLib.com