Skip to content

inspectorgadgetteknofest/inspector-gadget-acikhack2021

Repository files navigation

INSPECTOR GADGET

1. Biz kimiz:

  • Davut Emre TAŞAR

1986 yılında İzmir'de doğmuştur. Celal Bayar Üniversitesi İnşaat Mühendisliği Bölümü'nden mezun olan Emre, Karabük Üniversitesi Bilgisayar Mühendisliği Yüksek Lisans, Dokuz Eylül Üniversitesi Yönetim Bilişim Sistemleri Yüksek Lisans öğrencisidir. Ege Üniversitesi Güneş Enerjisi Enstitüsü-Enerji Teknolojileri ve Ege Üniversitesi İnşaat Mühendisliği-Yapı anabilim dallarından da 12 adet yüksek lisans dersi almış ve başarı ile tamamlamıştır. C Sınıfı İş Güvenliği Uzmanı ve Bina/Sanayi Enerji yöneticisidir. 2010 yılından 2015 yılına kadar Serbest İnşaat Mühendisi olarak çalışmıştır. 2015 yılından 2020 yılının Temmuz ayına kadar da Kamer Kentsel Dön. Mim. Müh. İnş. A.Ş.'nin yönetim kurulu başkanlığı görevini yürütmüştür. 2019 Yılında yazılım sektörüne olan ilgisi sonucu aldığı 22 adet sertifika sonrasında kariyerine bu alanda devam etmektedir. Yapay Zeka, Derin Öğrenme, Kuantum Kodlama konularıyla ilgilenmektedir. Doğal dil işleme alanında 1 adet konferans makalesi, 1 dergi makalesi, 2 adet arxiv pre-print yayını bulunmaktadır. Garanti BBVA teknoloji firmasında veri bilimi uzmanı olarak çalışmaktadır.

  • Semih GÜLÜM

1998 yılında Sivas'ta doğmuştur. Üniversite öğrenimini Marmara Üniversitesi Mekatronik Mühendisliği bölümünde bu sene tamamlamıştır. Öğreniminin son 1.5 yılında görüntü işleme ve yapay zeka projelerinde sıklıkla yer almış; maske, güneş gözlüğü ve sigara tespitinin yanı sıra panoramik röntgenler üzerinden diş ve hastalık tespiti üzerine projeler gerçekleştirmiştir. Geçmiş olduğumuz son yarım yıl içerisinde ise Türkçe Doğal Dil İşleme alanında çalışmalarını sürdürmüş ve akademik bir yayın ile de çalışmalarına devam etmektedir.

  • Mehmet Fatih AKCA

1999 yılında Manisa’da doğmuştur 2021 senesinde Sakarya Üniversitesi Yönetim Bilişim Sistemleri’nden mezun olmuş olan Mehmet Fatih, yaklaşık 3 yıldır makine öğrenmesi ve yapay zeka alanlarında kendini geliştirmeye çalışmaktadır. Bu zamana kadar doğal dil işleme, makine öğrenmesi, görüntü işleme üzerine bir çok projede yer almış ve öğrendiği bilgileri blog yazarak insanlara aktarmaya çalışmıştır. Doğal dil işleme üzerine bir akademik makale yazmış Mehmet Akif Ersoy'ın şiir yazımını taklit eden bir yapay zeka, pankreas kanseri teşhisi akciğer kanseri teşhisi tespiti ve evrelendirilmesi gibi projelerde yer almıştır.

2. Projelerimiz:

  • Zeroshot + BERT:

Zeroshot+BERT yapısını kullanarak oluşturduğumuz pipeline ile elinizdeki metinleri otomatik bir şekilde etiketlemeyi amaçladık. Projemize göz atmak için: Link

  • Osmanlıca -> Türkçe:

Osmanlıca metinlerin Türkçe'ye rahatça akatarılmasını amaçladık. Link

  • Turkish NLP Toolkit:

Türkçe metinler için Doğal Dil İşleme süreçlerinde lazım olabilecek araçları topladık. Projemize göz atmak için: Link

3. Arayüzümüz:

4. Faydalandığımız Literatür:

[1] Mikolov, T., Chen, K., Corrado, G., and Dean, J., “Efficient estimation of word representations in vector space,” arXiv preprint arXiv:1301.3781, 2013.

[2] Kilimci, Z. H. and Akyoku¸s, S., “The evaluation of word embedding models and deep learning algorithms for turkish text classification,” in 2019 4th International Conference on Computer Science and Engineering (UBMK). IEEE, 2019, pp. 548–553.

[3] Sel, S. and Hanbay, D., “E-mail classification using natural language processing,” in 2019 27th Signal Processing and Communications Applications Conference (SIU). IEEE, 2019, pp. 1–4.

[4] Le, Q. and Mikolov, T., “Distributed representations of sentences and documents,” in Proceedings of the 31st International Conference on International Conference on Machine Learning - Volume 32. 2014, ICML’14, p. II–1188–II–1196, JMLR.org.

[5] Tang, D., Qin, B., Feng, X., and Liu, T., “Effective lstms for targetdependent sentiment classification,” arXiv preprint arXiv:1512.01100, 2015.

[6] Ayata, D., Saraçlar, M., and Özgür, A., “Turkish tweet sentiment analysis with word embedding and machine learning,” in 2017 25th Signal Processing and Communications Applications Conference (SIU). IEEE, 2017, pp. 1–4.

[7] Ertugrul, A. M. and Karagoz, P., “Movie genre classification from plot summaries using bidirectional lstm,” in 2018 IEEE 12th International Conference on Semantic Computing (ICSC). IEEE, 2018, pp. 248–251.

[8] Ciftci, B. and Apaydin, M. S., “A deep learning approach to sentiment analysis in turkish,” in 2018 International Conference on Artificial Intelligence and Data Processing (IDAP). IEEE, 2018, pp. 1–5.

[9] Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K., “Bert: Pretraining of deep bidirectional transformers for language understanding,” arXiv preprint arXiv:1810.04805, 2018.

[10] Gao, Z., Feng, A., Song, X., and Wu, X., “Target-dependent sentiment classification with bert,” IEEE Access, vol. 7, pp. 154290–154299, 2019.

[11] Acikalin, U. U., Bardak, B., and Kutlu, M., “Turkish sentiment analysis using bert,” in 2020 28th Signal Processing and Communications Applications Conference (SIU). IEEE, 2020, pp. 1–4.

[12] Hochreiter, S. and Schmidhuber, J., “Long short-term memory,” Neural computation, vol. 9, no. 8, pp. 1735–1780, 1997.

[13] Schweter, S., “Berturk - bert models for turkish,” Apr. 2020.

[14] Stamatatos, E., Fakotakis, N., Kokkinakis, G.: 2000. Automatic text categorization in terms of genre and author. Comput. Linguist. 26(4), 471–495

[15] Sebastiani, F. 2002. Machine Learning in Automated Text Categorization. ACM Computing Surveys, 34(1): 1-47.

[16]Zheng, Rong, et al. 2006. “A framework for authorship identification of online messages: Writing‐style features and classification techniques.” Journal of the American society for information science and technology 57.3 : 378-393.

[17]Burrows, J.F. 1987. Word Patterns and Story Shapes: The Statistical Analysis of Narrative Style. Literary and Linguistic Computing 2: 61-70.

[18]Diederich, J., J. Kindermann, E. Leopold, and G. Paass. 2003.. Authorship Attribution with Support Vector Machines. Applied Intelligence 19(1/2): 109-123

[19]Luyckx, K., Daelemans 2011, W.: The effect of author set size and data size in authorship attribution. Literary Linguist. Comput. 26(1), 35–55

[20]Abbasi, Ahmed, and Hsinchun Chen. 2008. “Writeprints: A stylometric approach to identity-level identification and similarity detection in cyberspace.” ACM Transactions on Information Systems (TOIS) 26.2 : 1-29.

[21]Holmes, D. 1998. The Evolution of Stylometry in Humanities Scholarship. Literary and Linguistic Computing, 13(3): 111-117.

[22]Mikolov, Tomas, et al.2013. “Efficient estimation of word representations in vector space.” arXiv preprint arXiv:1301.3781.

[23] Mikolov, Tomas, et al. 2013. “Distributed representations of words and phrases and their compositionality.” Advances in neural information processing systems. 26: 3111-3119.

[24] Cortes, Corinna, and Vladimir Vapnik.1995. “Support-vector networks.” Machine learning 20.3: 273-297.

[25] Li, J., Huang, G., Fan, C., Sun, Z., & Zhu, H. (2019). Key word extraction for short text via word2vec, doc2vec, and textrank. Turkish Journal of Electrical Engineering & Computer Sciences, 27(3), 1794-1805.

[26] Rehurek, R., Sojka, P. 2010. Software framework for topic modelling with large corpora. In: Proceedings of the LREC 2010 Workshop on New Challenges for NLP Frameworks, ELRA, pp. 45–50.

[27] Kim, Donghwa, et al. 2019 “Multi-co-training for document classification using various document representations: TF–IDF, LDA, and Doc2Vec.” Information Sciences 477 : 15-29.

[28] Peng, Chao-Ying Joanne, Kuk Lida Lee, and Gary M. Ingersoll. 2002. “An introduction to logistic regression analysis and reporting.” The journal of educational research 96.1: 3-14.

[29] Zhang, Ye, Stephen Roller, and Byron Wallace. 2016. “MGNCCNN: A simple approach to exploiting multiple word embeddings for sentence classification.” arXiv preprint arXiv:1603.00968 .

[30] Radford, Alec, Luke Metz, and Soumith Chintala. 2015 “Unsupervised representation learning with deep convolutional generative adversarial networks.” arXiv preprint arXiv:1511.06434