Skip to content

SUDA-LA/CIP

Repository files navigation

HLT基础编码练习

新生夏令营主页

用法

# 复制仓库到本地并进入目录
$ git clone git@github.com:SUDA-LA/CIP.git && cd CIP
# 切换到相应的分支
$ git checkout -b <branch> origin/<branch>
# ...
# 主分支有变动请注意及时更新(optional)
# $ git merge origin/master
# ...
# 提交代码到自己的分支(不属于你的分支无法提交)
$ git push

练习列表

  • 汉字编码(C/C++语言实现)
  • 最大匹配分词
  • 网页正文抽取,请见2016春季学期《信息检索》(课程主页)
  • HMM (slides)
  • LinearModel (slides)
  • LogLinearModel (slides)
  • GlobalLinearModel (slides)
  • CRF (slides)

数据

根据不同任务从到新生夏令营主页中下载。

可选练习