Skip to content

smallerhand/portfolio

Repository files navigation

portfolio

Python Deep Learning (Kaggle Image / Sound Classification)

Kaggle의 MNIST 숫자 이미지 분류(0~9)/Sound 분류(41종류) 문제를 Python으로 딥러닝을 이용해서 해결했습니다. Tensorflow의 CNN을 이용하여 이미지 및 숫자를 분류(리더보드에서 99.4%, 87.6% 의 점수 기록)하였으며, 파이썬 코드로 이미지 분류 결과를 토대로 파일 이름을 변경시키는 프로그램 및 캐글 답안을 작성하는 프로그램 등을 만들었습니다.

We solved Kaggle's MNIST number image classification (0 to 9) / Sound classification (41 types) problem using Deep Learning in Python. Using CNN in Tensorflow, we have categorized images and numbers (99.4% and 87.6% of each on the leader board) and created a file name based on the results of the image classification.

KaggleのMNIST数字のイメージ分類(0~9)/Sound分類(41種類)問題をPythonでディプラーニングを利用して解決しました。 TensorflowのCNNを利用してイメージや数字を分類(リーダーボードで99.4%、87.6%の点数記録)して、パイソンコードでイメージ分類結果をもとに、ファイルの名前を変更させるプログラムおよび答案を作成するプログラムなどを作りました。

Python이미지 분류 코드는 이 곳을 참고하시기 바랍니다.
Python Image Classification Source Code
数字イメージ分類コードはこちらをご参考ください。

Python사운드 분류 코드는 이 곳을 참고하시기 바랍니다.
Python Sound Classification Source Code
Sound分類コードはこちらをご参考ください。

R Machine Learning (Kaggle Credit Card Fraud)

Kaggle의 신용카드 사기거래 검출 문제를 R로 풀었습니다. 데이터셋은 약 28만개 row와 31개 column(마지막 열은 사기나 아닌지를 나타내는 라벨)으로 구성되어 있습니다. KNN알고리즘을 이용하여 모델링하였습니다. 데이터의 분포가 매우 넓게 퍼져 있어서 log값을 취하고 정규화시키는 등의 전처리를 했습니다. 마지막으로 k값을 3부터 11까지 넣어 가장 정확도가 좋은 k값을 찾아 모델을 완성했습니다. 이렇게하여 c&rt, c5.0 알고리즘으로 예측했을 때보다 높은 정밀도를 가진 KNN 모델을 만들었습니다.

I solved Kaggle's problem of detecting fraudulent credit card transactions with R. The data set consists of approximately 280,000 rows and 31 columns (the last column is a label indicating whether or not it is fraudulent). Modeled using KNN algorithm. The distribution of the data is so extensive that we performed pre-treatment such as taking and qualifying log values. Finally, we added k values from 3 to 11 to find the most accurate k values and complete the model. This is how I created KNN models with higher precision than predicted by the C&RT, C5.0 algorithm.

Kaggleのデータセットでクレジットカード詐欺検出モデリングをしてみました。このデータセットは、約28万個rowと31個column(最後の列は詐欺か否かを示すラベル)で構成されていました。KNNアルゴリズムを利用してモデル化しました。データの分布が非常に広く広がっており、偏っている場合には、log値をとり、正規化させるなどの前処理をしました。kの値を3~11までの入れ最もアキュラシーが良いk値を見つけ、モデルを完成しました。 このようにしてc&rt、c5.0アルゴリズムで予測したよりも高い精度を持ったKNNモデルを作成しました。

R코드는 이 곳을 참고하시기 바랍니다.
R Machine Learning Source Code
Rコードはこちらをご参考ください。

About

my portfolios

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published