تحلیل وابستگی مدل های چندزبانه به انگلیسی با ابزارهای توضیح پذیری [Persian Thesis]

پیمان ناصری

شناسگر رکورد: ۵۲۵۳۹
رشته تحصیلی: علوم داده
عنوان: تحليل وابستگی مدل های چندزبانه به انگليسی با ابزارهای توضيح پذيری
نويسنده: پيمان ناصری
استاد راهنما : دکتر بهنام بهرک
مقطع تحصیلی : کارشناسی ارشد
دانشگاه : خاتم
تاریخ دفاع : ۱۴۰۴
چکیده: مدل های زبانی بزرگ چندزبانه توانايی پردازش زبان های متعدد را دارند، اما شواهد فزاينده ای نشان می دهدكه اين مدل ها در لايه های داخلی خود به فضايی انگليسي محور متكی هستند. اين پايان نامه با هدف بررسی تجربی اين پديده، سه محور تحليلی مكمل را به كار می گيرد: تحليل لنز لجيت براي رديابی زبان غالب در لايه های ميانی، ارزيابی استدلال زنجيره ای برای سنجش تأثير زبان استدلال بر عملكرد، و تحليل شباهت بازنمايی ها برای بررسی ساختار هندسی فضای چند زبانه. آزمايش ها روی مجموعه ای متنوع از مدل ها شامل لاما، ميسترال، جما،كِوِن، ديپ سيك، و آيا انجام شد. نتايج نشان می دهد كه اكثر مدل ها يك الگوی سه فازی در پردازش زبان هاي غيرانگليسی دارند: وابستگی به زبان ورودی در لايه های ابتدايی، همگرايی به فضای انگليسی در لايه های ميانی، و بازگشت به زبان خروجی در لايه های نهايی. در آزمايش استدلال زنجيره ای، مدل های كوچک تر عملكرد بهتری با استدلال انگليسی نسبت به فارسی نشان دادند، در حالی كه اين تفاوت در مدل های بزرگ تر و استدلال محور ناچيز بود. تحليل شباهت بازنمايی ها تأييد كرد كه فضای تعبيه ی مدل ها به صورت ساختاری به انگليسی و زبان های پرمنبع لاتين متمايل است. يافته ها نشان می دهد كه انگليسی محوری نه يك ترجمه ی صريح، بلكه يك سوگيری هندسی در فضای بازنمايی است. اين سوگيری با افزايش اندازه ی مدل و در مدل های جديدتر كاهش می يابد، اما به طور كامل حذف نمی شود. اين پژوهش با ارائه ی شواهد تجربی و چارچوب تحليلي يكپارچه، به درك بهتر رفتار چندزبانه ی مدل های زبانی بزرگ و شناسايی مسيرهای بهبود آن ها كمک می كند.
واژگان کلیدی: مدل های زبانی بزرگ،سوگيری چندزبانه،انگليسی محوری،تبيين پذيری،لنز لجيت،استدلال زنجيره ای،تحليل بازنمايی،زبان فارسی
Register Number Part3 Version Volume Part Part2 Reference Call Number lended Date Back Description
284989 1
Copyright 2026 by Payam Hannan co ltd. PayamLib.com