WWDC 2013 视频字幕（英文，共100个）

###1. How I get them?

这要从下面1和2两个gist说起。。。

extract.py (fork from Nicholas Riley's extract.py) 用来获取视频的fileSequence*.webvtt文件，该文件是web格式的英文字幕文件，苹果把字幕文件切分成了很多小段，每一段是一个独立的fileSequence*.webvtt文件。(*表示序号，从0开始)，使用的方法我写在了Comment里了。这个脚本我没做贡献，直接fork的，非常感谢Nicholas Riley
wwdc_combine_webvtt.rb 这个gist的功能是将上面获得的很多fileSequence*.webvtt文件合并一整个文件，其实格式理论上还是webvtt，不过我试了一下，在MPlayerX中是可以完美的显示出来的。这个script是现学的ruby现用，欢迎批评、pull request以及改成python版（偶是python文盲）。。。。
下载的字幕是以Video的序号命名的, @lexrus 童鞋的这个gist里提供了序号和Video名称的对应表, 感谢他。另外@puttin同学提供了一个批量修改文件名的脚本,点进去有图有真相哦，非常实用，Thx~4.

###2.欢迎大家提交pull request补充其他video字幕

在用extract.py脚本获得字幕的时候比较慢，可能是我这边网络的问题，从上面的第3项的对应表可以看出来WWDC2013 一共差不多有100个视频，目前已经获得的字幕文件是33个，还差了67个，大家如果通过上面的两个脚本拿到了剩余Video的字幕欢迎pull request和大家分享。

至此，所有的100字幕文件都已经完全提交，Enjoy!!!

##3.TODO ###3.1 去重和格式化为真正srt格式的字幕文件（以支持手机播放）看了一天的Bash相关的命令，写下了下面的脚本来去重和格式化为srt格式的字幕文件，下面的408.srt改为你想格式化的文件名：

awk -v RS="" '{gsub("\n", "-Z"); print}' 408.srt | awk '$0 !~/^WEB/ {print $0}' | uniq | awk '{printf "\n%s-Z%s", NR,$0 }'  | awk -v ORS="\n\n" '{gsub("-Z", "\n"); print}' >> 408-SD.srt

逐行解释下:

awk -v RS="" '{gsub("\n", "-Z"); print}' 408.srt   把换行换为-Z，在后面还要换回来
awk '$0 !~/^WEB/ {print $0}'  去掉以WEB开头的
uniq   去重
awk '{printf "\n%s-Z%s", NR,$0 }' 加上行号
awk -v ORS="\n\n" '{gsub("-Z", "\n"); print}' >> 408-SD.srt 格式化并把—Z换成\n

###4. 有图有真相

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
100.srt		100.srt
101.srt		101.srt
102.srt		102.srt
109.srt		109.srt
200.srt		200.srt
201.srt		201.srt
202.srt		202.srt
203.srt		203.srt
204.srt		204.srt
205.srt		205.srt
206.srt		206.srt
207.srt		207.srt
208.srt		208.srt
209.srt		209.srt
210.srt		210.srt
211.srt		211.srt
213.srt		213.srt
214.srt		214.srt
215.srt		215.srt
216.srt		216.srt
217.srt		217.srt
218.srt		218.srt
219.srt		219.srt
220.srt		220.srt
221.srt		221.srt
222.srt		222.srt
223.srt		223.srt
224.srt		224.srt
225.srt		225.srt
226.srt		226.srt
227.srt		227.srt
228.srt		228.srt
300.srt		300.srt
301.srt		301.srt
302.srt		302.srt
303.srt		303.srt
304.srt		304.srt
305.srt		305.srt
306.srt		306.srt
307.srt		307.srt
308.srt		308.srt
309.srt		309.srt
310.srt		310.srt
400.srt		400.srt
401.srt		401.srt
402.srt		402.srt
403.srt		403.srt
404.srt		404.srt
405.srt		405.srt
406.srt		406.srt
407.srt		407.srt
408.srt		408.srt
409.srt		409.srt
410.srt		410.srt
412.srt		412.srt
413.srt		413.srt
414.srt		414.srt
415.srt		415.srt
416.srt		416.srt
417.srt		417.srt
500.srt		500.srt
501.srt		501.srt
502.srt		502.srt
503.srt		503.srt
504.srt		504.srt
505.srt		505.srt
506.srt		506.srt
507.srt		507.srt
508.srt		508.srt
509.srt		509.srt
600.srt		600.srt
601.srt		601.srt
602.srt		602.srt
603.srt		603.srt
604.srt		604.srt
605.srt		605.srt
606.srt		606.srt
607.srt		607.srt
608.srt		608.srt
609.srt		609.srt
610.srt		610.srt
611.srt		611.srt
612.srt		612.srt
613.srt		613.srt
614.srt		614.srt
615.srt		615.srt
700.srt		700.srt
701.srt		701.srt
702.srt		702.srt
703.srt		703.srt
704.srt		704.srt
705.srt		705.srt
707.srt		707.srt
708.srt		708.srt
709.srt		709.srt
710.srt		710.srt
711.srt		711.srt
712.srt		712.srt
713.srt		713.srt
714.srt		714.srt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WWDC 2013 视频字幕（英文，共100个）

About

Releases 1

Packages

Contributors 2

XueshiQiao/WWDC_2013_Video_Subtitle

Folders and files

Latest commit

History

Repository files navigation

WWDC 2013 视频字幕（英文，共100个）

About

Resources

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 2

Packages