This page conducted for publishing Zekavat dataset
این پروژه برای در دسترس قراردادن مجموعه داده های ساخته شده توسط تیم ذکاوت ایجاد شده است. همه مجموعه داده های منتشر شده روی متون فارسی و برای توسعه مدل های هوشمند مختلفی است که در پروژه ذائقه سنجی کاربران شبکه های اجتماعی حاشیه نویسی شده است. تیم ذکاوت میتواند مجموعه داده های کامل تر، شیوه نامه برچسب زنی، مدل هوشمند ساخته شده مرتبط با این داده را با شما به اشتراک بگذارد و در این راستا به شما کمک کند. جزئیات برخی از مدل های هوشمند ساخته شده در مقالات منتشر شده است که می توانید مطالعه نمایید. برخی از مجموعه داده های منتشر شده فقط حاوی بخش هایی از داده ها می باشند، برای دریافت مجموعه داده کامل و دریافت اطلاعات کامل تر از مدل های هوشمند توسعه داده شده می توانید با ما تماس بگیرید. تیم ما از هیچ کمکی به شما دریغ نمی کند.
ایمیل : Zekavat@itrc.ac.ir
1- مدل تشخیص اخبار جعلی در حوزه کرونا (Covid19_Fakenews) روی متون خبری فارسی - حدود 8000 خبر برچسب گذاری شده
2- تشخیص گفتمان کاربران پلتفرم توئیتر در برابر بحران های خشكسالي با کمک روش های یادگیری ماشین (drought opinion detection )- حدود 2300 توئیت برچسب گذاری شده مقاله مرتبط:
3- تشخیص هیجان (Emotion detection) در حوزه کرونا - تشخیص احساس غم، ترس، شادی و ... نسبت به واکسن و کرونا - حدود 9670 توئیت برچسب گذاری شده
4- تشخیص گفتمان حجاب- حدود 2879 توئیت برچسب گذاری شده
مقاله مرتبط: تشخیص گفتمان در بستر توییتر با کاربست نظریه تمرکز نظارتی؛کاربست روشهای متن کاوی
http://ensani.ir/file/download/article/1668312050-10114-42-2.pdf
5- مشابهت سنجی معنایی متون کوتاه فارسی در شبکه های اجتماعی- مجموعه داده FarSSim و با کمک مدل زبانی FasSSibert- حدود 1123 جفت توئیت با امتیاز شباهت معنایی
6- برچسب گذاری صرفی (Part of speach tagging)
مقاله مرتبط
https://arxiv.org/abs/2310.00572
بخش دوم- تکه تکه کردن جملات (شناسایی عبارت های اسمی) (chunker)
7-مجموعه داده برچسب گذاری دسته بندی موضوعی پست های اینستاگرام
8-مجموعه داده برچسب گذاری دسته بندی موضوعی پست های توئیتر، تعداد پست های توئیتر 89218
لطفا هنگام استفاده از مجموعه داده ها به مقالات مرتبط و همچنین پروژه توسعه و بهبود سامانه ذکاوت (ذائقه سنجی هوشمند کاربران فضای مجازی و تحلیل ترافیک) با قابلیت پیشبینی رویدادهای محتمل بر مبنای طبقهبندی محتوای متنی، تصویری و ویدئویی در پژوهشگاه ارتباطات و فناوری اطلاعات ارجاع دهید.
ٍ