Skip to content

Latest commit

 

History

History
116 lines (77 loc) · 5.34 KB

semister2018-undergrad.md

File metadata and controls

116 lines (77 loc) · 5.34 KB

第一周(9月18日):课程说明

本说明适用于南开大学周恩来政府管理学院2018-2019秋季学期的《R语言统计应用入门》本科课程。课程需自备电脑。

基本说明

  • 真正的零基础。当然,有基础更好。
    • 无须R软件基础。
    • 无须推论性统计学基础。不过多涉及,但后期可能会简单介绍t检验、方差分析、线性回归的基本命令操作与结果解读。
  • 主要内容
    • 数据导入
    • 数据管理
    • 描述统计
    • 基本绘图
    • 网页爬虫
    • 文本数据清洗
    • 正则表达式基础

更详细内容,请参见此目录。里面包含了本门课程的基本内容和代码,可提前阅读和自行学习。

软件准备

仅限windows平台进行说明。Mac系统请参照此说明自行探索相关细节。

  • 安装R,安装RStudio,安装Rtool
  •  所有软件请保证安装在系统盘,且所有安装路径(包括Windows登陆账户名称)无任何中文及特殊字符。一般选择默认安装方式即可保证这一点。
  • 注册GitHub账户,不妨顺便找到这个链接

语法准备

请系统学习 Markdown语言。

Markdown是一种可以使用普通文本编辑器编写的标记语言。关于Markdown的简洁说明可参考相关网页,以下是一些推荐。

以上三个链接请大家自行仔细阅读,第三个文档请花10分钟左右的时间完成在线学习。Markdown语法不是课程本身的内容,但对于了解本课程文档的最基本格式具有根本性的作用。

上述每一个软件或语言环境都需要较长时间的学习和训练,课程中会以尽量清晰简洁的方式进行介绍,仍请做好一定的心理准备。

相关教材

课程所有内容均可在网上找到免费公开的版本。为阅读方便,推荐(但不强求)以下书目:

考核方式

论文形式结课。

平时作业(40%)

  • 执行一定量的问卷调查,完成数据录入的工作,然后基于汇总数据完成指定任务的分析。
  • 完成平时布置的各种习题任务。
  • 协助完善教学资料与练习题。
  • 完成数据可视化任务。
  • 网络爬虫与数据分析。
  • 其他,待丰富。

平时作业最后集中到一个大作业中,在2019年1月8日晚上6:00之前提交到本人学院二楼的邮箱。

期末作业(60%)

论文形式提交,一般不少于5000字(不计空格),学院规定格式下A4纸不少于4页。字数无上限。word版打印出来提交教科办。。

可选方式

  • 寻找一篇提供原始数据、但不是用R做分析的量化文章,使用R重新完成数据分析流程。
  • 使用CGSS、CFPS等公开数据,自选主题,完成一篇研究报告。
  • 完成某一数据可视化任务。
  • 翻译某常用R包的操作说明文档。
  • 翻译某数据分析类的英文文章。
  • 其他,待丰富。

与平时作业一起(期末论文与期中作业分开装订),在2019年1月15日晚上6:00之前提交到本人学院二楼的邮箱。

附:本课程自开课伊始,尚未出现选课而未及格的同学。

本周作业

下周上课前要完成的工作:  

  • 完成昨天的问卷链接,并尽量转发扩散一下,让学过统计学的、从事定量研究的研究生或博士生或老师/科研人员填写。链接如下:   https://github.com/xkdog/PCI/blob/master/README.md    
  • 从学校的软件正版化平台安装Office 2016版本。  
  • 安装R、Rstudio,Windows平台同学安装Rtools。一律安装在C盘(系统盘)。操作 系统账户名称不能出现中文或特殊字符,一律使用英文(或不设账户名称)。
  • 联网状态下,打开R,尝试如下命令:install.packages(“rmarkdown”)。  
  • 打开Rstudio,尝试新建一个Rmarkdown。  
  • 使用教育网邮箱注册GitHub账户,关注我指定的文件夹。  
  • 自己了解一下R、Rstudio,Markdown与Rmardown的关系。可百度、Bing、Google。谷歌需要翻墙。

本周录屏

请及时查看群内链接。录屏暂不主动公开,因为课堂上的某些“只言片语”显然不足为外人道也。