رئیس پژوهشکده هوش مصنوعی دانشگاه امیرکبیر با هشدار درباره چالشهای استفاده از ابزارهای بینالمللی برای زبان فارسی، بر ضرورت تولید مدلهای بومی هوش مصنوعی با دادههای غنی فارسی و فرهنگمحور تأکید کرد.
سعیده ممتازی در گفتوگو با خبرنگار خبرگزاری صداوسیما با اشاره به رشد چشمگیر ابزارهای هوش مصنوعی متنی و گفتاری گفت: زبان فارسی در بسیاری از ابزارهای هوش مصنوعی بینالمللی پشتیبانی میشود؛ اما کیفیت پاسخدهی آنها در مقایسه با زبانهایی مانند انگلیسی بسیار پایینتر است.
خانم ممتازی با بیان علت اصلی این ضعف افزود: حجم پایین دادههای آموزشی زبان فارسی در مقایسه با زبان انگلیسی کم است و این ابزارها اغلب با تکیه بر دادههای انگلیسی توسعه یافتهاند.جامعه هوش مصنوعی کشور دست به کار شود زیرا غنای فرهنگی زبان فارسی در آنها لحاظ نشده است.
استاد هوش مصنوعی دانشگاه امیرکبیر با تقسیمبندی ابزارهای هوش مصنوعی به دو دسته متنباز و بسته، گفت: ابزارهای بسته امکان توسعه و بومیسازی ندارند؛ بلکه در حوزههایی مانند امنیت داده نیز میتوانند تهدید باشند.
وی یکی از مهمترین چالشها را تولید اطلاعات توهمزا، سوگیریهای جنسیتی، قومی یا مذهبی و همچنین تهدیدهای امنیتی دانست و گفت: این چالشها برای همه زبانها وجود دارد، اما برای زبانهایی با داده کمتر مانند فارسی شدت و اثرگذاری بیشتری دارند.
رئیس پژوهشکده هوش مصنوعی دانشگاه امیرکبیر گفت: برای ارتقای دقت و عمق پاسخدهی ابزارهای هوش مصنوعی به زبان فارسی، باید مدلهای بومی مبتنی بر دادههای فراگیر، دقیق و فرهنگمحور توسعه یابد؛ این اقدام تنها با مشارکت نهادهای علمی، دانشگاهی و شرکتهای فناوری داخلی ممکن است.
سعیده ممتازی در پایان افزود: هماکنون شرکتها و مراکزی در کشور در حال کار روی طراحی مدلهای هوش مصنوعی بومی هستند که با فراهم شدن زیرساختهای لازم، میتواند گامی مؤثر در حفظ و تقویت زبان فارسی باشد؛ البته این ابزارها باید نقش دستیار هوشمند را داشته باشند، نه جایگزین تصمیمگیری انسانی.