Skip to content

feelins/Python-Data-Innovation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python-Data-Innovation

这个项目主要是想从最基础的一些Python学习开始,包括了一些实现较小功能的脚本,后续也慢慢更新一些稍复杂的脚本,主要领域关注于语言学专业的数据处理,包括但不限于语音、文本等方面。

欢迎关注公众号:极地语音工作室; CSDN博客:https://blog.csdn.net/shaopengfei

效果

说明:每一部分为一个主题,第一部分适合初学者练手;第二部分每一小部分为一个主题;第三部分为;

第一部分 入门脚本

本部分的脚本多为10行以内的代码量,主要目的是针对一个小小的知识点,了解一个概念或者一个用法。更适合于学习者了解某一个点的语法知识。

分类目录 知识点 详情阅读 应用举例
P01-001 * 学习编程语言第一步,学会打印hello, world!;
* Python可以使用单引号,也可以使用双引号;
* 如果在引号内部有引号,注意使用不同的就可以了;
* 如果必须使用相同的符号,那么需要加转义符号,斜杠;
* 笔者习惯于所有引号位置都使用单引号,内部使用双引号;
[阅读原文] -
P01-002 * 读文本内容,并打印在屏幕上 [阅读原文] -
P01-003 * 字典的内置函数;
* dict.clear()清除字典;
* dict.get()搜索字典,如果发现返回关联的值。如果未找到,则返回None;
* dict.items(), 返回字典中的键值对列表;
* dict.keys(), dict.values(), 返回字典的键和值的列表;
* dict.pop(), 从字典中删除一个键;
* dict.popitem(), 从字典删除键值对,删除最后一个;
* dict.update(), 将字典与另一个字典或可迭代的键值对合并;
[阅读原文] -
P01-004 * 用三种方法将两个列表,转化为字典, 使用zip函数 [阅读原文] -
P01-005 * 对字典列表,根据键,值进行排序 [阅读原文] -
P01-006 * 对字符串列表进行排序
* sort 与 sorted 区别
[阅读原文] -
P01-007 * 以字节为单位获取字符串大小
* 如何获取字符串的字节数
[阅读原文] -
P01-008 * VS Code中使用Python相对路径问题 [阅读原文] -
P01-009 python是如何实现两个变量交换的? [阅读原文] -
P01-010 * python修饰符@的使用 [阅读原文] -
P01-011 * 几个例子,代码的一些更好的形式 [阅读原文] -
P01-012 * 字符串的大写,小写,第一个字母大写用法 [阅读原文] -
P01-013 理解一些关于函数的概念
* 函数的对象特性,也可以赋值,也可以当作参数,返回值也可以是函数
* 函数也可以在字典里当参数使用
[阅读原文] -
P01-014 字符串连接,加号和join的区别
* 在连接字符串数组的时候,我们应考虑优先使用join
[阅读原文] -
P02-001 进度条的一些实现形式
* p02_001_alive_progress_bar.py, 有一些动画效果的进度条
* p02_001_normal_progress_bar.py, 普通进度条
* p02_001_progress_bar_iterations.py, 用于定义迭代次数的进度条
* p02_001_progress_bar_with_time.py, 带时间进度条
* p02_001_tqdm_progress_bar.py, tqdm进度条
[阅读原文] -
P02-002 [阅读原文] -
P02-003 文件名排序问题
* 文件名可以按包含的数字排序,而不是按整个文件名字符串排序
阅读原文 -
P02-004 《深度学习入门-基于Python的理论与实现》学习记录 [阅读原文] -
P02-005 Pandas的一些学习知识点 [阅读原文] -
P02-006 《Head First Python》学习记录 [阅读原文] -
P02-007 《Python for Data Analysis》学习记录 [阅读原文] -

第二部分 音频处理

分类目录 知识点 详情阅读 应用举例
P03-001 * 基本的读取wav的操作 [阅读原文] -
P03-002 * 计算一个音频目录里的wav文件的总时长和每个文件的时长。 * 基本的读取wav的操作 [阅读原文]
P05-001 * 检查两个目录里文件对应情况,分别保存两个目录都有的文件,
每个目录独有的文件,以及上述文件的log
阅读原文 -
P05-002 * 通过基频曲线的距离做一个声调判别器 阅读原文 -

第三部分 文本处理

分类目录 知识点 详情阅读 应用举例
P04-001 前后项分词 [阅读原文] -
P04-002 对一个有几列的文本,通过某种分割符分别保存 [阅读原文] -

第四部分 数据综合处理相关

分类目录 知识点 详情阅读 应用举例
P06-001 * 获取豆瓣的读书和影视列表 阅读原文 -
P06-002 * 获取某网站所有网页的内容 阅读原文 -

第五部分 api调用

参考文档

第〇部分 相关文档

索引此项目请参考

About

some basic scripts for linguistics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published