Skip to content

lidingruc/2017R

master
Switch branches/tags

Name already in use

A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
nyu
 
 
 
 
 
 

2017R

这里我试图创建、分享2017年秋季学期的《数据科学与社会研究》的课程资料

课程针对没有编程经验、统计基础的本科生,因此难度不大,理论较少,偏操作化。重点在于让他们对数据科学产生强烈的兴趣,了解数据科学技能累积的学习路径,掌握一些基本的数据获取、数据整理、数据分析和结果呈现的基本方法。尽量当做学习游戏技能一样,玩起来。

课程初步结构如下

第1讲、望远:备战大数据时代

课程介绍:大数据时代对于青年人的要求,如何达到这些要求!(PPT)

课程安排:做好课前预习和课后作业;成绩构成(70%作业;30%考试)。

课后作业:建一个群;安装好相关的软件,不懂则问;速读一本大数据相关的通俗读物,加深对于大数据的理解。

相关资料:http://note.youdao.com/noteshare?id=351a5e712274bd552b70aeb557a9cae5

第2讲、登高:数据、信息、知识与理论

课前预习:社会研究方法教材速读一遍。

课堂演示:对社会研究方法体系进行串讲(PPT)。

课后作业:针对大数据时代和社会研究方法中的某个问题,你如何积累条件并将之解决?你可以简单写写自己的学习规划。

第3讲、立靶:数据汇总

课前预习:预习教材中数据可视化和基础部分

http://r4ds.had.co.nz/workflow-basics.html

http://r4ds.had.co.nz/data-visualisation.html

课堂演示:基于tidyverse的数据分析过程展示。请认真阅读课程演示大纲和设计:

http://note.youdao.com/noteshare?id=94c815919f88613d071d2254934ca53e

课后作业:完成大纲中的R基础操作部分的自学;尝试将ggplot的cheatsheet中的示例敲出来。

第4讲、夯基:关于R的基础

课前预习:将一份练习代码敲进电脑

课堂演示:R的基础性操作示范

示例1:http://r4ds.had.co.nz/workflow-basics.html

示例2:http://r4ds.had.co.nz/workflow-scripts.html

课后作业:用R完成几道简单的题目。

第5讲、备砖:数据管理

课前预习:将一份代码敲进电脑(R-basic cheatsheet)

课堂演示:如果利用dplyr包进行数据管理

示例1:http://r4ds.had.co.nz/transform.html

示例2:http://moderndive.com/5-wrangling.html

课后作业:用R完成一个数据处理的任务

第6讲、装修:信息呈现

课前预习:将一份数据图表和可视化的命令敲进电脑。

课堂演示:如何利用ggplot画图

示例1:http://moderndive.com/3-viz.html 示例2:http://r4ds.had.co.nz/data-visualisation.html

课后作业:用R完成一个数据可视化的任务。

第7讲、回炉:综合实例

课前预习:了解实例的数据和问题,分解出任务步骤,尝试寻找方案。

课堂演示:一起完成实例

示例1:http://r4ds.had.co.nz/exploratory-data-analysis.html

课后作业:在实例的基础上完成几个扩展问题

第8讲、推论:统计检验

课前预习:第二讲讲义中关于抽样和统计推论的部分

课堂演示:如何用R来进行卡方检验、T检验、方差检验、分析检验,模拟抽样分布

示例1:http://moderndive.com/7-sim.html

示例2:http://moderndive.com/8-hypo.html

示例3:http://moderndive.com/9-ci.html

课后作业:阅读 http://moderndive.com/B-appendixB.html;https://github.com/andrewpbray/infer

第9讲、建模:线性回归

课前预习:预习回归模型相关的内容

课堂演示:

示例1:http://r4ds.had.co.nz/model-basics.html

示例2:http://moderndive.com/6-regression.html

课后作业:将示例中的命令操作一遍

第10讲、控制:一般化回归

课前预习:预习回归诊断、模型选择的相关教材

课堂演示 示例1:http://r4ds.had.co.nz/model-building.html

示例2:http://r4ds.had.co.nz/many-models.html 课后作业:将示例联系一遍,并完成其中的作业题。

第11讲、连通:网络分析

课前预习:预习社会网络分析的基本概念和历史

网址:http://note.youdao.com/share/?id=28c7b0a4e947ae29462fb424cf11dd21&type=note#/

课堂演示:

网址:http://note.youdao.com/noteshare?id=253f889e679ee73b33423819e18b6604

课后作业:将相关演示命令操作一遍

第12讲、邻里:空间分析

课前预习:空间分析的基本原理

网址1:http://note.youdao.com/noteshare?id=92cbe89d3e03cc530ac28c4a0eb6449e 网址2:http://note.youdao.com/noteshare?id=4f4180ea28db7fdd238b882b681c5cd2

课堂演示:

网址:http://www.people.fas.harvard.edu/~zhukov/spatial.html

课后作业:将演示中的相关命令和问题操作一遍。

第13讲、异型:文本分析

课前预习:http://note.youdao.com/noteshare?id=f0d94703ba72b57c54ad9318bdf0f274

课堂演示:http://tidytextmining.com/

课后作业:将演示教材中的例子操作一遍。

第14讲、采集:爬虫与数据获取

课前预习:http://note.youdao.com/noteshare?id=57cc2a7d0f893b58d4fbb217f65f167d

课堂演示:http://note.youdao.com/noteshare?id=6d0aab0f55880292730ff9535488b356

课后作业:尝试爬取一个网站。

第15讲、新招:python爬虫

课前预习:

http://note.youdao.com/noteshare?id=8b5797ca96ee80737a6a9048c0423b6f

http://note.youdao.com/noteshare?id=ab8f1f4e84519a6eb3881c8d7ca37841

http://note.youdao.com/noteshare?id=aa3b31703ff6468eb2c884494e11b939

课堂演示:

http://note.youdao.com/noteshare?id=8d72a2741f381b292d40c7583047c891

课后作业: 安装配置好python,尝试爬取一个网页