Ето някои интересни data sets, с които можете да работите ! ;)
Тук може да откриете данни за почти всичко - образование, здравеопазване, държавен бюджет, земеделие и тн. Ако нещо ви липсва дори можете да поискате данни през формата. Част от тях са и визуализирани.
Отворени данни на всички звена в Европейския съюз са предоставени за свободно използване.
Това е повече от страхотен data set, NASA споделят данни, които можете да използвате за вашите проекти. (каквито и да са те, дори и междузвездни)
В това github репо са събрани множество линкове към всякакви datasets - образование, правителства, machine learning, психология, спорт са само част от тях.
Wikipedia също споделят данни, които може да използватe свободно.
Reddit е една от най-големите платформи за новини, събираща на едно място съдържание, възможност за оценяване на новините и дискусия.
Stack-Exchange е платформа, състояща се от Q&A сайтове, включително и Stack-Overflow. Цялата тази информация, включваща стотици отговори на един въпрос може да бъде свалена в XML файл.
А за какво може да използвате тези данни?
За да се сдобием с информация колко от въпросите са уникални? Ако сме имали отговори на въпроси преди, защо да не можем да направим автоматична система даваща ни отговори? Можем ли да научим машина да програмира, на база отговори в Stack-Overflow
Защо просто да четем новини, когато можем да хакваме яки проекти с тях? Както се досещате тук може да видите и работите с информация от всякакви новини! NY Times имат архив от 1851 г. , където можете да търсите статии, коментари, ревюта на филми, а също може да използвате и Semantic API към техния Articles API.
Pokemon започва като японска игра с карти, а днес вече се е превърнала в световен феномен. Споделяме линк към публичния API, откъдето може да достъпите информация за всички покемони.
Линк и допълнитлена информация
Регистрация за HackFMI 8 - Hack for Data ще бъде отворена до 14-ти декември. Побързайте да се включите! :)
Повече за условията и детайлите за хакатона.
Perpettoподготвиха сървър с e-commerce данни специално за всички участници. Повече за dataset-те вижте тук.