تولید خودکار نامه‌های اداری با استفاده از مدل زبانی Automatic generation of business letters using language model (Persian) (original) (raw)

Abstract

یکی از موضوعات نسبتاً جدید در حوزۀ پردازش زبان طبیعی، ساخت سیستم‌های تولید خودکار زبان است. این سیستم‌ها، با بکارگیری شیوه‌های رایج در هوش مصنوعی و زبان‌شناسی رایانه‌ای اقدام به تولید خودکار متنِ قابل‌فهم به زبان‌های گوناگون می‌نمایند. متن تولیدشده ممکن است گزارش، نامه، توضیح، خلاصه، مقاله، پیام، داستان و غیره باشد. در این مقاله، قصد داریم سیستمی برای تولید خودکار نامه‌های اداری فارسی ارائه کنیم. این سیستم قادر به تولید سه نوع نامۀ اداری شامل دعوتنامه، تبریکات و تقدیرنامه است و دو حالتِ تولید متن بصورت پیش‌فرض و تولید متن با استفاده از اطلاعات شخصی کاربر را دربرمی‌گیرد. خروجی این سیستم به‌گونه‌ای است که نیاز به دخالت انسان برای ویرایش متن تولیدشده ندارد. در طراحی این سیستم، از روش مبتنی بر داده استفاده شده است. سه روشِ مختلف که همگی از مدل احتمالاتی برای پیش‌بینیِ کلمه یا کلمات بعدی استفاده می‌کنند آموزش داده شدند. این سه روش شامل استفاده از احتمال مدل زبانی 4-گرام کلمات، احتمال دنبالۀ 4-تایی از کلمات و تركيب احتمالات مدل‌زبانی و دنبالۀ 3-تایی از کلمات هستند. نامه‌های تولیدشده با استفاده از معیار بلو (BLEU) و امتیازدهیِ انسانی ارزیابی شدند که بهترین نتیجه مربوط به روش اول با امتیازِ بلوی 85/0 بوده است.

Paria Jamshidlou hasn't uploaded this paper.

Let Paria know you want this paper to be uploaded.

Ask for this paper to be uploaded.