[Corpora-List] PP-attachment labelled dataset for Arabic

امتياز حسين خان اكبر حسين خان ihkhan at kau.edu.sa
Thu Apr 13 22:13:04 CEST 2017

Dear corpora members,

We are working on a project: pp-attachment ambiguity resolution in Arabic. The idea is to apply corpus-based word collocation frequencies (available via Kilgarriff's word sketches) to predict the most likely interpretation and then validate the prediction model using a human-labelled dataset. Just wondering, if such a dataset is available for Arabic.



-- Imtiaz Hussain Khan, PhD Associate Professor Department of Computer Science Faculty of Computing & IT King Abdulaziz University, Jeddah, KSA

-- Disclaimer: The information contained in this message is intended for the addressee only and may contain classified information. If you are not the addressee, please delete this message and notify the sender; you should not copy or distribute this message or disclose its contents to anyone. Any views or opinions expressed in this message are those of the individual(s) and not necessarily of the university. No reliance may be placed on this message without written confirmation from an authorized representative of its contents. No guarantee is implied that this message or any attachment is virus free or has not been intercepted and amended.

إخلاء مسؤليه: ان جميع المعلومات المتضمنة في هذه الرسالة تخص المستلم، وربما تتضمن معلومات سرية، واذا لم تكن انت المستلم فالرجاء الغاء الرسالة واشعار المرسل، كما يمنع نسخ او توزيع هذه الرسالة او افشاء محتوياتها لاخرين. ويجدر بالعلم ان جميع الآراء ووجهات النظر الواردة في هذه الرسالة تعتبر شخصية وليست بالضرورة منسوبة للجامعة. كما لايمكن ان يعتمد على هذه الرسالة ما لم تحصل على موافقة خطية من المسئول عن محتوياتها. كما لايوجد ضمان بان هذه الرسالة أو مرفقاتها خالية من الفيروسات أو انها لم يتم اعتراضها وتعديلها -------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 4686 bytes Desc: not available URL: <https://mailman.uib.no/public/corpora/attachments/20170413/bfd2efca/attachment.txt>

More information about the Corpora mailing list