بهبود روش استخراج ریشه کلمات عربی با استفاده از روش N گرم
AN IMPROVED ARABIC WORD’S ROOTS EXTRACTION METHOD USING N-GRAM TECHNIQUE
نویسندگان |
این بخش تنها برای اعضا قابل مشاهده است ورودعضویت |
اطلاعات مجله |
thescipub.com |
سال انتشار |
2014 |
فرمت فایل |
PDF |
کد مقاله |
23673 |
پس از پرداخت آنلاین، فوراً لینک دانلود مقاله به شما نمایش داده می شود.
چکیده (انگلیسی):
Arabic language is distinguished by its morphological richness, which forces the workers in the field of
Arabic language Processing (i.e., information retrieval, document’s classification, text summarizing) to deal
with many words that seem to be different but in reality they came from an identical root word. One of the
methods to overcome this problem is to return the words to their roots. This research aims to provide a new
algorithm, that returns roots of Arabic words using n-gram technique without using morphological rules in
order to avoid the complexity arising from the morphological richness of the language in one hand and the
multiplicity of morphological rules in other hand. The proposed algorithm uses a list that contains over
4,500 identical roots words.
کلمات کلیدی مقاله (فارسی):
استخراج ريشه عربي ، پردازش طبيعي زبان ، N گرم
کلمات کلیدی مقاله (انگلیسی):
Keywords: Arabic Root Extraction, Natural Language Processing, N-Gram
پس از پرداخت آنلاین، فوراً لینک دانلود مقاله به شما نمایش داده می شود.