## 工厂模式

创造模式处理一个对象的创建。创造模式的目的是为了在不按照约定而直接地创建的地方提供可选择的情况。

在工厂模式中，客户端查询一个对象而不知道这个对象来自哪里（即，哪一个类被用来生成它）。在一个工厂背后的思想是简化一个对象的创建。如果这个结果是通过一个中心函数来完成，相比之下要让一个客户端直接地使用类实例化来创建对象，跟踪哪一个对象被创建则会更容易些。通过分离要使用的代码，工厂减少了一个应用维护的复杂性。

工厂通常以两张形式出现：工厂模式，是一个每次输入参数都返回一个不同的方法（在Python术语中称为函数）；抽象工厂，它是一组工厂方法用于创建相关产品的系列。

在工厂方法中，我们执行一个单独的函数，传递一个参数，它提供了我们想要的是什么 信息。我们不要求知道任何关于这个对象的如何实现的细节，以及它来自哪里。

一个工厂方法模式现实中的使用是用在塑料玩具厂。建模粉用于制造塑料玩具是相同的，但不同的外形可以使用不同的塑料模具生产它。这就像有一个工厂模式它有一个可以输入我们想要的外形名称的地方，而且输出是我们所要求的塑料外形。

如果你意识到你不能够追踪应用的对象创建，那是因为这些代码被写在很多地方而不是一个单独的函数或者方法，你就应该考虑使用那个工厂方法模式。工厂方法使一个对象的创建集中化，追踪对象也变得非常简单。注意，它是完完全全可以创建不止一个工厂方法的。逻辑上，每一个工厂方法组的对象创建都是相似的。例如，一个工厂方法可以负责连接不同的数据库（MySQL， SQLite），另外一个工厂方法可以负责创建你所请求的几何对象（圆形，三角形），等等。

工厂方法在你想要从对象使用中分离对象创建时也是大有裨益的。我们在创建一个对象时不合并或者绑定到一个指定的类，通过调用一个函数我们只提供我们所想要的部分信息。这意味着将改变引入到函数很简单而且不要求任何对所使用代码的改变。

另外的用法值得一提是一个应用的提高性能和内存使用的关联。工厂方法可以由只创建一个绝对必要的新对象来提高性能和内存利用。当我们创建对象时使用一个直接的类实例，每次一个新对象（除非，类使用内部缓存，不过通常没有这种情况）都要额外的内存来分配。我们可以看到在下面代码（文件id.py）的实践中，它创建同一个类A的两个实例，使用id()函数去对比这些实例的内存地址。

这些地址也在输出中打印出来，所以我们可以检验它们。如下，内存地址的实际情况是两个有明显区别的对象的以不同方法来创建：

In [2]:
class A(object):
	pass
	
if __name__ == '__main__':
	a = A()
	b = A()
	
	print(id(a) == id(b))
	print(a, b)

False
<__main__.A object at 0x0000000004C9D630> <__main__.A object at 0x0000000004C9D5C0>


### 实现
数据表现有很多形式。存储和重取数据有两种主要的文件类型：人类可读的文件和二进制文件。人类可读的文件例子有XML，Atom，YAML和JSON。二进制文件的例子有被SQLite所使用的 .sq3 文件格式，用于听音乐的 .mp3 文件格式。

这个例子中，我们会关注两个流行的人类可读格式：XML和JSON。尽管，人类可读文件通常解析较慢于二进制文件，但是它们让数据交换，检查，和修改变得非常容易。因此，建议选择使用人类可读文件，除非有其他的限制让你不允许你这样做（主要地是难以接收的性能和专有的二进制格式）。

这个问题中，我们在XML和JSON文件里已经有一些存储的数据，我们想要解析它们，重新取回一些信息。与此同时，我们想要集中化客户这些扩展服务的连接（以及未来所有的连接）。我们会使用工厂方法解决这个问题。这个例子只关注于XML和JSON，但是添加更多的服务支持也应该是简单明了的。

首先，让我们看看数据文件。如下，XML文件person.xml，基于Wikipedia的例子，包含单独的信息（firstName, lastName, gender，等等）：

In [None]:
<persons>
    <person>
	<firstName>John</firstName>
    <lastName>Smith</lastName>
    <age>25</age>
    <address>
      <streetAddress>21 2nd Street</streetAddress>
      <city>New York</city>
      <state>NY</state>
      <postalCode>10021</postalCode>
    </address>
	<phoneNumbers>
	      <phoneNumber type="home">212 555-1234</phoneNumber>
	      <phoneNumber type="fax">646 555-4567</phoneNumber>
	    </phoneNumbers>
	    <gender>
	      <type>male</type>
	    </gender>
	  </person>
	  <person>
	    <firstName>Jimy</firstName>
	    <lastName>Liar</lastName>
	    <age>19</age>
	    <address>
	      <streetAddress>18 2nd Street</streetAddress>
	      <city>New York</city>
	      <state>NY</state>
	      <postalCode>10021</postalCode>
	    </address>
	    <phoneNumbers>
	      <phoneNumber type="home">212 555-1234</phoneNumber>
	  	</phoneNumbers>
		      <gender>
		        <type>male</type>
		      </gender>
		    </person>
		    <person>
		      <firstName>Patty</firstName>
		      <lastName>Liar</lastName>
		      <age>20</age>
		      <address>
		        <streetAddress>18 2nd Street</streetAddress>
		        <city>New York</city>
		        <state>NY</state>
		        <postalCode>10021</postalCode>
		      </address>
		      <phoneNumbers>
		        <phoneNumber type="home">212 555-1234</phoneNumber>
		        <phoneNumber type="mobile">001 452-8819</phoneNumber>
		      </phoneNumbers>
		      <gender>
		        <type>female</type>
				    </gender>
				  </person>
				</persons>

JSON文件donut.json，来自Github上面的Adobe账户， 包含甜甜圈信息（type,即价格和单元，ppu, topping，等等）如下：

In [None]:
[
	  {
	    "id": "0001",
	    "type": "donut",
	    "name": "Cake",
	    "ppu": 0.55,
	    "batters": {
	      "batter": [
	        { "id": "1001", "type": "Regular" },
	        { "id": "1002", "type": "Chocolate" },
	        { "id": "1003", "type": "Blue berry" },
		        { "id": "1004", "type": "Devil's Food" }
		      ]
		    },
		    "topping": [
		      { "id": "5001", "type": "None" },
		      { "id": "5002", "type": "Glazed" },
		      { "id": "5005", "type": "Sugar" },
		      { "id": "5007", "type": "Powdered Sugar" },
		      { "id": "5006", "type": "Chocolate with Sprinkles" },
		      { "id": "5003", "type": "Chocolate" },
		      { "id": "5004", "type": "Maple" }
		    ]
		  },
		  {
		    "id": "0002",
		"type": "donut",
		    "name": "Raised",
		    "ppu": 0.55,
		    "batters": {
		      "batter": [
		        { "id": "1001", "type": "Regular" }
		      ]
		    },
		    "topping": [
		      { "id": "5001", "type": "None" },
		      { "id": "5002", "type": "Glazed" },
		      { "id": "5005", "type": "Sugar" },
		      { "id": "5003", "type": "Chocolate" },
		      { "id": "5004", "type": "Maple" }
		    ]
		  },
		  {
		    "id": "0003",
		    "type": "donut",
		    "name": "Old Fashioned",
		    "ppu": 0.55,
		    "batters": {
		      "batter": [
		        { "id": "1001", "type": "Regular" },
		        { "id": "1002", "type": "Chocolate" }
		      ]
		    },
		    "topping": [
		      { "id": "5001", "type": "None" },
		      { "id": "5002", "type": "Glazed" },
		      { "id": "5003", "type": "Chocolate" },
		      { "id": "5004", "type": "Maple" }
		    ]
		  }
		]

In [6]:
import xml.etree.ElementTree as etree
import json

class JSONConnector:
		def __init__(self, filepath):
			self.data = dict()
			with open(filepath, mode='r', encoding='utf-8') as f:
				self.data = json.load(f)
		
		@property
		def parsed_data(self):
			return self.data
        
class XMLConnector:
		
		def __init__(self, filepath):
			self.tree = etree.parse(filepath)
			
		@property
		def parsed_data(self):
			return self.tree
        
def connection_factory(filepath):
		if filepath.endwith('json'):
			connector = JSONConnector
		elif filepath.endwith('xml'):
			connector = XMLConnector
		else:
			raise ValueError('Cannot connect to {}'.format(filepaht))
		return connector(filepath)

In [7]:
import json
import xml.etree.ElementTree as etree


class JSONDataExtractor:

    def __init__(self, filepath):
        self.data = dict()
        with open(filepath, mode='r', encoding='utf-8') as f:
            self.data = json.load(f)

    @property
    def parsed_data(self):
        return self.data


class XMLDataExtractor:

    def __init__(self, filepath):
        self.tree =  etree.parse(filepath)

    @property
    def parsed_data(self):
        return self.tree


def dataextraction_factory(filepath):
    if filepath.endswith('json'):
        extractor = JSONDataExtractor
    elif filepath.endswith('xml'):
        extractor = XMLDataExtractor
    else:
        raise ValueError('Cannot extract data from {}'.format(filepath))
    return extractor(filepath)


def extract_data_from(filepath):
    factory_obj = None
    try:
        factory_obj = dataextraction_factory(filepath)
    except ValueError as e:
        print(e)
    return factory_obj


def main():
    sqlite_factory = extract_data_from('data/person.sq3')
    print()

    json_factory = extract_data_from('data/movies.json')
    json_data = json_factory.parsed_data
    print('Found: {} movies'.format(len(json_data)))
    for movie in json_data:
        print("Title: {}".format(movie['title']))
        year = movie['year']
        if year:
            print("Year: {}".format(year))
        director = movie['director']
        if director:
            print("Director: {}")
        genre = movie['genre']
        if genre:
            print(f"Genre: {genre}")
        print()

    xml_factory = extract_data_from('data/person.xml')
    xml_data = xml_factory.parsed_data
    liars = xml_data.findall(f".//person[lastName='Liar']")
    print(f'found: {len(liars)} persons')
    for liar in liars:
        firstname = liar.find('firstName').text
        print(f'first name: {firstname}')
        lastname = liar.find('lastName').text
        print(f'last name: {lastname}')
        [print(f"phone number ({p.attrib['type']}):", p.text) 
              for p in liar.find('phoneNumbers')]
        print()
    print()


SyntaxError: invalid syntax (<ipython-input-7-2c47a8376110>, line 52)