# Python Basic

@Author: 吴炜坤

@email：weikun.wu@xtalpi.com/weikunwu@163.com

PyRosetta顾名思义，是Rosetta的Python界面的API封装。因此本章节将以pyrosetta的一些例句为例，介绍一些关于python的**非常基础**语法和语句，以方便读者阅读和理解本系列教程的内容。

更加详细的python教程课程可以再网络上找到很多，比如https://juejin.cn/post/6844903765410070535

### 0. 库与Import
模块是一个包含所有你定义的函数和变量的文件，其后缀名是.py。模块可以被别的程序引入，以使用该模块中的函数等功能。在pyrosetta中所有的函数和方法都是定义在rosetta.io文件中(C++)的。但和一般的python标准库的导入方法类似。

In [1]:
# 导入pyrosetta
import pyrosetta

In [2]:
# 也可以等价写于:
from pyrosetta import init

导入了函数或某个函数的上级的库，我们就可以来调用这个函数来实现一些功能了。

In [3]:
# 使用这个函数的方法1:库名+"."+函数。“.”代表在指定在这个库中寻找我们需要的函数。
pyrosetta.init()

PyRosetta-4 2020 [Rosetta PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release 2020.23+release.0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 2020-06-04T19:12:24] retrieved from: http://www.pyrosetta.org
(C) Copyright Rosetta Commons Member Institutions. Created in JHU by Sergey Lyskov and PyRosetta Team.
[0mcore.init: {0} [0mChecking for fconfig files in pwd and ./rosetta/flags
[0mcore.init: {0} [0mRosetta version: PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release r257 2020.23+release.0d6f90a8cb9 0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 http://www.pyrosetta.org 2020-06-04T19:12:24
[0mcore.init: {0} [0mcommand: PyRosetta -ex1 -ex2aro -database /opt/miniconda3/envs/pyrosetta/lib/python3.6/site-packages/pyrosetta/database
[0mbasic.random.init_random_generator: {0} [0m'RNG device' seed mode, using '/dev/urandom', seed=-573114774 seed_offset=0 real_seed=-573114774 thread_index=0
[0mbasic.random.init_random_generator: {0} [0mRandomGenerator:init: Normal mode, se

In [4]:
# 也可以这样来调用, 因为 我们先前已经指定了 from pyrosetta import init。从pyrosetta中导入叫init的函数。
init()

PyRosetta-4 2020 [Rosetta PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release 2020.23+release.0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 2020-06-04T19:12:24] retrieved from: http://www.pyrosetta.org
(C) Copyright Rosetta Commons Member Institutions. Created in JHU by Sergey Lyskov and PyRosetta Team.
[0mcore.init: {0} [0mChecking for fconfig files in pwd and ./rosetta/flags
[0mcore.init: {0} [0mRosetta version: PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release r257 2020.23+release.0d6f90a8cb9 0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 http://www.pyrosetta.org 2020-06-04T19:12:24
[0mcore.init: {0} [0mcommand: PyRosetta -ex1 -ex2aro -database /opt/miniconda3/envs/pyrosetta/lib/python3.6/site-packages/pyrosetta/database
[0mbasic.random.init_random_generator: {0} [0m'RNG device' seed mode, using '/dev/urandom', seed=-578603057 seed_offset=0 real_seed=-578603057 thread_index=0
[0mbasic.random.init_random_generator: {0} [0mRandomGenerator:init: Normal mode, se

#### 提示:
如此一来，pyrosetta在我们的内存中就已经激活了。

在运行pyrosetta的任何函数之前，**一定记得进行初始化。** 否则将会报错。

### 1. 变量与数据类型
PyRosetta和Python能处理的数据类型类似:
- 整数
- 浮点数
- 字符串
- 布尔值

### 2. 列表与切片
在Python中列表和切片是非常重要的概念，此处我们以一些简单的例子来说明;

**列表** 就是用“[]”符号，将一系列的变量和数据以“,”分隔的一个数据格式。

**切片** 就是用索引号去获取列表中的某个或某个范围内的数据，并返回值或列表。但是注意索引的顺序是从0开始。

In [5]:
# 创建一个列表: 
mylist = [1, 2, 3, 4, 5, 6]

# 索引: 第一个元素:
mylist[0]

1

In [6]:
# 索引: 一个范围, 第二个元素到第三个元素:
mylist[1:3]

[2, 3]

因此所有pyrosetta返回的数据类型，只要是列表，就可以使用索引切片进行数据获取。

### 3. For循环
循环在数据分析中具有重要的作用。

使用for…in 循环是python最简单理解的一种循环方式，可以直白的逻辑可以理解为:
```
for(对于)。。in(在某个集合)中的元素进行循环。
```
举例，我想对一个列表循环并将这个列表中的所有值进行打印:

print()函数代表，将“()”中的内容进行打印输出到屏幕上。

In [7]:
# 循环:
for x in mylist:
    print(x)

1
2
3
4
5
6


for x in mylist: 代表在mylist中的元素x进行循环。而且对于每个循环需要做的处理就是print()。

### 4. Def(函数)
函数是组织好的，可重复使用的，用来实现单一，或相关联功能的代码段。
函数能提高应用的模块性，和代码的重复利用率。你已经知道Python提供了许多内建函数，比如print()。但你也可以自己创建函数，这被叫做用户自定义函数。


In [8]:
# 定义一个函数:
def init_pyrosetta():
    import pyrosetta
    pyrosetta.init()
    return 0

In [9]:
# 调用函数::
init_pyrosetta()

PyRosetta-4 2020 [Rosetta PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release 2020.23+release.0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 2020-06-04T19:12:24] retrieved from: http://www.pyrosetta.org
(C) Copyright Rosetta Commons Member Institutions. Created in JHU by Sergey Lyskov and PyRosetta Team.
[0mcore.init: {0} [0mChecking for fconfig files in pwd and ./rosetta/flags
[0mcore.init: {0} [0mRosetta version: PyRosetta4.conda.mac.cxx11thread.serialization.python36.Release r257 2020.23+release.0d6f90a8cb9 0d6f90a8cb9fa0567ca76bb71ee93bfe73340c70 http://www.pyrosetta.org 2020-06-04T19:12:24
[0mcore.init: {0} [0mcommand: PyRosetta -ex1 -ex2aro -database /opt/miniconda3/envs/pyrosetta/lib/python3.6/site-packages/pyrosetta/database
[0mbasic.random.init_random_generator: {0} [0m'RNG device' seed mode, using '/dev/urandom', seed=1475936894 seed_offset=0 real_seed=1475936894 thread_index=0
[0mbasic.random.init_random_generator: {0} [0mRandomGenerator:init: Normal mode, se

0

### 5. Class(类)
（新手向: 也可以简单地理解为一些函数的集合!）

在Python中，定义类是通过class关键字, class后面紧接着是类名(用户自定义)，类名通常是大写开头的单词，紧接着是object(指明类从哪继承)。

类中最重要的两个概念是:
- 方法
- 属性


**1. 类中的函数即称为方法**。

`__init__()` 是函数的构造方法，每档创建新实例时 Python 都会自动运行它。注意构造方法名字必须是这个，是规定好的。

print_words函数 是类test的一个方法。

**2. 类中的变量即称为属性**。

self.words 是类的一个属性，__init__()函在实例化的过程中，将外部输入的words转换为内部的一个属性。



In [10]:
# 一个类的代码示例:
class test(object):

    def __init__(self, words):
        self.words = words

    def print_words(self):
        print(self.words)

可见，类是抽象的模板，是属性和方法抽象的模板，但类进行实例化(传递参数时)，类创建出来的一个个具体的“对象”。

有了对象之后，然后方可调用其中的方法(函数);

In [11]:
# 实例化，通过传递参数’hello‘。并实例化test。
test1 = test('hello')

# 使用类中的方法: 实例化的变量名+'.'+函数名(传递的参数，如果有的话)。
test1.print_words()

hello


运行类中的方法实现了打印我们最开始传递的参数“hello”。

### 6. PyRosetta Class & Function的使用**
在PyRosetta中, 所有的功能相关的代码都是封装在类和函数当中的，因此我们只需要学会如何调用这些功能，就能达到学习和应用的目的。
区分函数和类的使用也十分简单。可直接在PyRosetta的API网站中查询，一般而言，如果是类，那么都是以class字段直接开头。

如果是函数: 就可以直接调用。比如我们想从序列直接生成结构，可以使用**pose_from_sequence函数**。
![Alt Text](./img/pyrosetta_function.png)

In [12]:
# 调用函数的例子:
from pyrosetta.io import pose_from_sequence
pose = pose_from_sequence('AAAAAAA')

[0mcore.chemical.GlobalResidueTypeSet: {0} [0mFinished initializing fa_standard residue type set.  Created 980 residue types
[0mcore.chemical.GlobalResidueTypeSet: {0} [0mTotal time to initialize 0.734775 seconds.


如果是一个类，那么我们必须首先对他进行实例化，才能使用它。
比如:
![Alt Text](./img/pyrosetta_class.png)

In [13]:
# 导入类
from pyrosetta.rosetta.protocols.minimization_packing import MinMover

# 实例化，并赋予一个变量名。
minmover = MinMover()

PyRosetta的类被实例化后，大多数负责执行功能的都是叫apply()的函数，该函数接受的对象也大多数是Rosetta的Pose对象。

In [16]:
# 运行类，执行结构进行能量最小化。
minmover.apply(pose)

**有的时候一些类会强制用户传递必要的参数才能实例化**

还是以MinMover作为例子，在实例化过程中，如果没有传递参数。那么类会有一些默认的设置。

当然用户也可以传递自己想要的参数进去，但是必须满足参数的格式要求，如init3, 用户需要传递4个参数，才能实例化这个类。

![Alt Text](./img/class_init_doc.png)

### 进阶阅读

#### 1. What is a "Size" or a "Real"?

Within Rosetta, several simple objects are used for basic data structures. If these are seen within PyRosetta help, they can be replaced by their appropriate Python data type.
    Size in an int
    Real is a double or float (use float in Python)
    Vector or Vector1 often serves the purpose of a Python list

#### 2. Where are Vector objects?

Within Rosetta, Vector objects are used for various list structures. The common Vector objects are found in various locations. Please consult the question below for more information.
 Vector1                     
 rosetta.Vector1                       
 xyzVector
 rosetta.numeric.xyzVector          
 vector1_(data type)
 rosetta.utility.vector1_(data type)


#### 3. Why are Rosetta objects 1-indexed?

Within Rosetta has its roots in FORTRAN so counting is "1-indexed" (the first element is numbered 1). Python on the other hand is "0-indexed" (the first element is numbered 0). The documentation discusses this in a little more depth.

#### 4.  How do I construct Rosetta Vector0/Vector1 objects?

Vector0/1 is exposed in newer versions of PyRosetta and lives in pyrosetta.rosetta.utility.vector{0/1}_*. Specific Vector1 objects live in rosetta.utility.vector1_type.

There is also pyrosetta.Vector1 helper function that will do construction of most common types using Python list as input. For or example:
    print rosetta.Vector1( [ 1 , 2 , 3 ] )
    print rosetta.Vector1( [ 1.0 , 2.0 , 3.0 ] )
    print rosetta.Vector1( [ True , False , True ] )
    print rosetta.Vector1( [ 'a' , 'b' , 'c' ] )

    v = rosetta.utility.vector1_SSize()
    v.append( 1 )
    print v


#### 5.  How do I construct various C++ std objects, like std::map?

C++ sts:: types is exposed in PyRosetta in pyrosetta.rosetta.std module. For example all map types could be accessed as: pyrosetta.rosetta.std.map_type1_type2.

For example:
    m = pyrosetta.rosetta.std.map_string_Real()
    m['aaa'] = 1.0;  m['bb']= 3.0
    print m

#### 6.  How do I construct std::set objects?

std::set templates is exposed in PyRosetta and lives in pyrosetta.rosetta.std_*. There is also helper function Set that will convert Python list/set object into  PyRosetta, it could be found in pyrosetta namespace:

    print pyrosetta.Set( [ 1 , 2 , 3 ] )
    print pyrosetta.Set( [ 1.0 , 2.0 , 3.0 ] )
    print pyrosetta.Set( [ 'a' , 'b' , 'c' ] )

    s = pyrosetta.utility.Set_SSize()
    s.add(1);  s.add(2);  s.add(1);  s.erase(2)
    print s

#### 7.  How do I convert "AP" or "CAP" objects to regular class objects?

Use the "get" function (rosetta.utility.utility___getCAP in older releases). This is an involved issue which does not come up in common usage of PyRosetta.
For example, to create a "ALA" residue:
(new way)
    chm = rosetta.core.chemical.ChemicalManager.get_instance()
    rts = chm.residue_type_set( 'fa_standard' ).get()
    ala = rosetta.core.conformation.ResidueFactory.create_residue( rts.name_map( 'ALA' ) )
    print ala

(old way)
    chm = rosetta.core.chemical.ChemicalManager.get_instance()
    rts_AP = chm.residue_type_set( 'fa_standard' )
    rts = rosetta.utility.utility___getCAP( rts_AP )    # converts a CAP object to a ResidueTypeSet object
    ala = rosetta.core.conformation.ResidueFactory.create_residue( rts.name_map( 'ALA' ) )
    print ala

#### 8.  How do I use std::ostream or std::istream for methods that require it?  

The objects std::ostream and std::istream are bound in PyRosetta as  pyrosetta.rosetta.std.ostream and pyrosetta.rosetta.std.istream, respectively. Generally, objects that require these objects will also accept classes that are pyrosetta.rosetta.std.istringstream  and pyrosetta.rosetta.std.ostringstream objects.  Use these types of objects instead.