تولید خودکار نامههای اداری با استفاده از مدل زبانی Automatic generation of business letters using language model (Persian) (original) (raw)
Abstract
یکی از موضوعات نسبتاً جدید در حوزۀ پردازش زبان طبیعی، ساخت سیستمهای تولید خودکار زبان است. این سیستمها، با بکارگیری شیوههای رایج در هوش مصنوعی و زبانشناسی رایانهای اقدام به تولید خودکار متنِ قابلفهم به زبانهای گوناگون مینمایند. متن تولیدشده ممکن است گزارش، نامه، توضیح، خلاصه، مقاله، پیام، داستان و غیره باشد. در این مقاله، قصد داریم سیستمی برای تولید خودکار نامههای اداری فارسی ارائه کنیم. این سیستم قادر به تولید سه نوع نامۀ اداری شامل دعوتنامه، تبریکات و تقدیرنامه است و دو حالتِ تولید متن بصورت پیشفرض و تولید متن با استفاده از اطلاعات شخصی کاربر را دربرمیگیرد. خروجی این سیستم بهگونهای است که نیاز به دخالت انسان برای ویرایش متن تولیدشده ندارد. در طراحی این سیستم، از روش مبتنی بر داده استفاده شده است. سه روشِ مختلف که همگی از مدل احتمالاتی برای پیشبینیِ کلمه یا کلمات بعدی استفاده میکنند آموزش داده شدند. این سه روش شامل استفاده از احتمال مدل زبانی 4-گرام کلمات، احتمال دنبالۀ 4-تایی از کلمات و تركيب احتمالات مدلزبانی و دنبالۀ 3-تایی از کلمات هستند. نامههای تولیدشده با استفاده از معیار بلو (BLEU) و امتیازدهیِ انسانی ارزیابی شدند که بهترین نتیجه مربوط به روش اول با امتیازِ بلوی 85/0 بوده است.
Paria Jamshidlou hasn't uploaded this paper.
Let Paria know you want this paper to be uploaded.
Ask for this paper to be uploaded.