Skip to content
servet-kurt edited this page Oct 30, 2016 · 1 revision

Welcome to the ir wiki!

Proje kapsamında, Chicago Polis Departmanının tutmuş olduğu, Chicago şehrinde 2001 yılından bu yana işlenmiş suçların(cinayet hariç) detayının mevcut olduğu bir data set kullanılıcaktır.

Aşağıdaki başlıklar veri de mevcuttur:

ID,Case,Number,Date,Block,IUCR,Primary,Type,Description,Location Description,Arrest,Domestic,Beat,District,Ward,Community Area,FBI Code,X Coordinate,Y Coordinate,Year,Updated On,Latitude,Longitude,Location

Data set e link: https://catalog.data.gov/dataset/crimes-2001-to-present-398a4 Data set boyutu 1.45 GB ve CSV

Information Retrieval konusu kapsamında yapılması planlanan çalışma, düz yazı şeklinde sorulacak sorulardan data set içinden istenilen bilgiyi getirme şeklinde planlanmıştır.

Örneğin şöyle bir soru sorulacak ve yanıtı getirlecektir: 'Chicago Central Ave' de 'Caddede' işlenen 'silahlı suçlar'

İlk olarak düz yazı şeklinde girilen query için data set incelenirken oluşturulmuş olan sözlük üstünden transformation işlemi yapılacaktır. Sonrasında işlenmiş olan (ders kapsamında anlatılan teknikler kullanılarak-indexing,clustering,classification-gibi)veriden-> 'suç tipi, suç tanımı, suç un işlendiği mekan, suçun işlendiği lokasyon' gibi yazılan query ye en uygun şekilde sonuç getirilecektir. Sonucun bir küme veri ve özeti ya da başka bir şekilde mi olacağına karar verilecektir.

Clone this wiki locally