Skip to content

This repository is based on the Data Science Book and provides a kit to start experimenting with natural language processing in Japanese.

License

Notifications You must be signed in to change notification settings

gomano-shigure/NLP-notebook-in-JAPANESE

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

What's this?

This repository provides kits and samples to easily get started experimenting with natural language processing in Japanese, based on the Data Science Book.
このリポジトリでは、日本語自然言語処理の実験を簡単に始めるためのキットとサンプルを提供しています。

Feature

  • This repository makes it easy to set up a Japanese natural language processing environment.

  • This repository uses only commercially available licensed libraries and can be quickly deployed for commercial use.

  • Sample source code for Japanese natural language processing is provided to help you learn from these codes.

  • 日本語の自然言語処理環境を簡単に立ち上げることができます。

  • このリポジトリでは商用利用可能なライセンスライブラリのみを使用しているため、商用利用に素早く展開することができます。

  • 日本語の自然言語処理に関するサンプルソースコードを用意しているため、これらのコードを元に学習することができます。

Requirements

This repository uses docker and docker-compose as the environment.
このリポジトリでは、環境としてgit, dockerおよびdocker-composeを利用しています。

How to Use

We've prepared a tutorial for you.
チュートリアルを用意したので御覧ください.

Directories

  • experiments/example_experiments/ ...... Sample code for natural language processing is located here.

  • experiments/your_experiments/ ...... A place for users to manage their own code.

  • libraries/ ...... Libraries for natural language processing and settings for building them.

  • wiki ....... Stores the files associated with README.md.

  • experiments/example_experiments/ ...... 自然言語処理に関するサンプルコードが配置されています。

  • experiments/your_experiments/ ...... ユーザーが自分で作ったコードを管理するための場所です。

  • libraries/ ...... 自然言語処理に必要なライブラリとそのビルドについての設定が書かれています。

  • wiki ....... README.mdに付随するファイルを保管しています。

Adding a Library

If you want to install the library permanently, add it to the libraries/Dockerfile directory.

ライブラリを永続的にインストールする場合、libraries/Dockerfileにインストールするライブラリを追加してください。

## install python library
RUN pip3 install\
    MeCab==0.996.2\
    stanfordcorenlp==3.9.1.1\
    nltk==3.5\
    new_package==0.0 # Add library with version here like this.

About

This repository is based on the Data Science Book and provides a kit to start experimenting with natural language processing in Japanese.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published