Skip to content

zekavat-ITRC/Zekavat-Dataset

Repository files navigation

Zekavat-Dataset

This page conducted for publishing Zekavat dataset

این پروژه برای در دسترس قراردادن مجموعه داده های ساخته شده توسط تیم ذکاوت ایجاد شده است. همه مجموعه داده های منتشر شده روی متون فارسی و برای توسعه مدل های هوشمند مختلفی است که در پروژه ذائقه سنجی کاربران شبکه های اجتماعی حاشیه نویسی شده است. تیم ذکاوت میتواند مجموعه داده های کامل تر، شیوه نامه برچسب زنی، مدل هوشمند ساخته شده مرتبط با این داده را با شما به اشتراک بگذارد و در این راستا به شما کمک کند. جزئیات برخی از مدل های هوشمند ساخته شده در مقالات منتشر شده است که می توانید مطالعه نمایید. برخی از مجموعه داده های منتشر شده فقط حاوی بخش هایی از داده ها می باشند، برای دریافت مجموعه داده کامل و دریافت اطلاعات کامل تر از مدل های هوشمند توسعه داده شده می توانید با ما تماس بگیرید. تیم ما از هیچ کمکی به شما دریغ نمی کند.

ایمیل : Zekavat@itrc.ac.ir

1- مدل تشخیص اخبار جعلی در حوزه کرونا (Covid19_Fakenews) روی متون خبری فارسی - حدود 8000 خبر برچسب گذاری شده

2- تشخیص گفتمان کاربران پلتفرم توئیتر در برابر بحران های خشكسالي با کمک روش های یادگیری ماشین (drought opinion detection )- حدود 2300 توئیت برچسب گذاری شده مقاله مرتبط:

3- تشخیص هیجان (Emotion detection) در حوزه کرونا - تشخیص احساس غم، ترس، شادی و ... نسبت به واکسن و کرونا - حدود 9670 توئیت برچسب گذاری شده

4- تشخیص گفتمان حجاب- حدود 2879 توئیت برچسب گذاری شده

مقاله مرتبط: تشخیص گفتمان در بستر توییتر با کاربست نظریه تمرکز نظارتی؛کاربست روشهای متن کاوی

http://ensani.ir/file/download/article/1668312050-10114-42-2.pdf

5- مشابهت سنجی معنایی متون کوتاه فارسی در شبکه های اجتماعی- مجموعه داده FarSSim و با کمک مدل زبانی FasSSibert- حدود 1123 جفت توئیت با امتیاز شباهت معنایی

6- برچسب گذاری صرفی (Part of speach tagging)

مقاله مرتبط

https://arxiv.org/abs/2310.00572

بخش دوم- تکه تکه کردن جملات (شناسایی عبارت های اسمی) (chunker)

7-مجموعه داده برچسب گذاری دسته بندی موضوعی پست های اینستاگرام

8-مجموعه داده برچسب گذاری دسته بندی موضوعی پست های توئیتر، تعداد پست های توئیتر 89218

لطفا هنگام استفاده از مجموعه داده ها به مقالات مرتبط و همچنین پروژه توسعه و بهبود سامانه ذکاوت (ذائقه سنجی هوشمند کاربران فضای مجازی و تحلیل ترافیک) با قابلیت‌ پیش‌بینی رویدادهای محتمل بر مبنای طبقه‌بندی محتوای متنی، تصویری و ویدئویی در پژوهشگاه ارتباطات و فناوری اطلاعات ارجاع دهید.

ٍ

About

This page conducted for publishing Zekavat dataset

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages