المدونة اللغوية العربية لمدينة الملك عبدالعزيز للعلوم والتقنية

أدوات ذات علاقة

في هذه الصفحة نقدم لكم مجموعة من الأدوات تهدف لخدمة اللغة العربية وتسهيل عمل الباحثين اللغويين. يجدر بالذكر أن هذه الأدوات تم تطويرها من قبل مدينة الملك عبدالعزيز للعلوم والتقنية ممثله في المركز الوطني لتقنية الذكاء الاصطناعي والبيانات الضخمة.


قاموس لتحليل المشاعر في تويتر للهجة السعودية

يحتوي القاموس على مفردات من العربية المعاصرة واللهجة السعودية مستخلصة يدويا من تغريدات الوسوم الأكثر رواجا بين مستخدمي تويتر في المملكة العربية السعودية. يحتوي القاموس على 4431 مفردة.
تنزيل | الورقة العلمية


المستخلص العربي

أداة قادرة على إنشاء وتحديث المدونات اللغوية بشكل آلي عن طريق استخدم RSS feeds. حيث تقوم بحفظ النصوص العربية بشكل منظم ومصنف بحسب احتياجات المستخدم.
تنزيل | الورقة العلمية


مصاحب

هي أداة لاستخراج المتلازمات اللفظية من المدونات سواء كانت هذه المتلازمات متتابعات لفظية أو ضمن سياق معين يحدده المستخدم. ما يميزها هو إمكانية استخراج جميع المتلازمات اللفظية (دفعة واحدة) الموجودة في المدونة أو جزء منها باستخدام ٨ مقاييس إحصائية وبحسب المعايير التي يضعها المستخدم دون الحاجة للبحث عن المتلازمات اللفظية لكل كلمة على حدة مثلما هو الحال في الأدوات المتوفرة حاليا.
تنزيل | الورقة العلمية


غواص

أداة لمعالجة المدونات العربية
تنزيل | الورقة العلمية


المشذب العربي

أداة للمعالجة القبلية (preprocessing) لنصوص المدونات اللغوية أو أنظمة التنقيب في النصوص العربية . وهو جزء من النظام المستخدم في إدارة هذه المدونة وتجهيز نصوصها للمعالجة. يعمل المشذب على التقليل من تشتت البيانات من خلال: إزالة التطويل (الكشيدة) من وسط الكلمة، فصل الرموز والأرقام الملتصقة بالكلمات، إزالة الفراغات والأسطر الفارغة وغير ذلك من الوظائف.
تنزيل