# 課題

指定した動作をするプログラムを作成し、ソースコードを提出してください。

## 課題内容

GitHub Flavored Markdownで書かれた文章は、見出しによって階層構造となっているとみなすことができます。たとえば、下記のような文章があったときに、「大見出し」は「中見出し」を含み、「中見出し」は「小見出し1」と「小見出し2」とを含み、「小見出し1」は「本文1」を含んでいるとみなすことができます。

```
# 大見出し
## 中見出し
### 小見出し1

本文1

### 小見出し2

本文2
```

Markdown 形式のポートフォリオがあったときに、見出しを指定すると、その見出しに含まれる要素を抽出するプログラムをつくってください。見出しの指定方法は、コマンドライン引数などで指定するものとします。具体的には、コマンドライン引数として「大見出し 中見出し 小見出し2」が与えられたときには、そこに含まれる要素の「本文2」の内容を出力してください。また、該当する見出しが無い場合には何も出力しません。

なお、実装にあたってのプログラム言語や処理系は問いません。ただし、 Mac で動作確認を行ないますので、どのようにプログラムを動作させるのかについて、補足ドキュメントを添えてください。

ライブラリの利用については制限しませんが、応募者の実力が分かるシンプルな実装を期待しています。

In [524]:
%%file cookpad.py 
import sys
import re
from itertools import islice

def read_md(f, headings):
    level = -1
    for head_index, heading in enumerate(headings, start = 1):
        for line in f:
            rank = re.match("#+(?=\s)", line)
            if rank and len(rank.group()) <= level:
                return
            if re.fullmatch("#+\s" + heading + "\n", line):
                level = len(line.split()[0])
                if head_index == len(headings):
                    head_index = head_index+1
                    continue
                break
            if head_index > len(headings):
                print(line, end = "")
    return
        
if __name__ == "__main__":
    with open("cookpad.md", "r") as f:
        read_md(f, sys.argv[1:])

Overwriting cookpad.py


In [288]:
%%file cookpad.py 
import re
import sys

class Md:
    def __init__(self, f, heads):
        self.file = f
        self.heads = heads
        self.heads_level = [0 for _ in range(len(heads))] #それぞれのheadのレベルを記憶
        self.i_search_head = 0 #
        self.current_level = 0

    def search(self):
        for line in self.file:
            #print(line, self.i_search_head, self.current_level, self.heads_level)
            line_head_level = re.match("\s{0,6}(#+)\s", line)
            if line_head_level:
                self.current_level = len(line_head_level.group(1))
                self.lower_level()
                #if self.print_target(line):
                    #continue
            if self.print_target(line):
                continue
            match_head = re.match("\s{{0,6}}(#+)\s{}".format(self.heads[self.i_search_head]), line)
            if match_head:
                self.heads_level[self.i_search_head] = len(match_head.group(1))
                self.i_search_head += 1
        
    def lower_level(self):
        for i in range(self.i_search_head):
            if self.heads_level[i] >= self.current_level:
                self.i_search_head = i
                return True
            
    def print_target(self, line):
        if self.i_search_head == len(self.heads):
            print(line)
            return True


if __name__ == "__main__":
    with open("cookpad.md", "r") as f:
        m = Md(f, sys.argv[1:])
        m.search()

Overwriting cookpad.py


In [316]:
%%file cookpad.py 
import re
import sys
from itertools import groupby

class Md:
    def __init__(self, f, heads):
        self.file = f
        self.heads = heads
        self.heads_level = [0 for _ in range(len(heads))] #それぞれのheadのレベルを記憶
        self.i_target_head = 0 #リストheadsにおける探しているheadのindex
        self.current_level = 0 #今見ている行のlevel

    def print_target(self):
        for is_target, line_block in groupby(self.file, lambda x: self.search(x)):
            if is_target:
                print("".join(list(line_block)), end="")       
        
    def search(self, line):
        self.do_if_line_is_head(line)
        if self.i_target_head == len(self.heads):
            return True
        self.do_if_line_is_target_head(line)
        return False
    
    def do_if_line_is_head(self, line):
        is_head = re.match("\s{0,3}(#{1,6})\s+", line)
        if is_head:
            self.current_level = len(is_head.group(1))
            self.change_target_head()         
    
    def change_target_head(self):
        for i in range(self.i_target_head):
            if self.heads_level[i] >= self.current_level:
                self.i_target_head = i
                return True
    
    def do_if_line_is_target_head(self, line):
        match_head = re.match("\s{{0,3}}(#{{1,6}})\s+{}(\s+#+\s+)?".format(self.heads[self.i_target_head]), line)
        if match_head:
            self.heads_level[self.i_target_head] = len(match_head.group(1))
            self.i_target_head += 1
            
if __name__ == "__main__":
    with open(sys.argv[1], "r") as f:
        m = Md(f, sys.argv[2:])
        m.print_target()

Overwriting cookpad.py


In [317]:
!python cookpad.py cookpad.md 大見出し

### 中見出し

#### 小見出し1

### 中見出し



本文1
## 中見出し

### 小見出し



本文2


a




In [227]:
from itertools import groupby
for is_target, line_block in groupby(lambda x: x, ['A','A','B','C','C']):
        if is_target:
            print("\n".join(list(line_block)))  

TypeError: 'function' object is not iterable

In [70]:
a = [1,2]
for i in range(len(a)):
    "a{}".format(i) = i
print(a1)

SyntaxError: can't assign to function call (<ipython-input-70-2f1c7046d11c>, line 3)

In [134]:
import re
re.match("\s{0,6}(#+)\s", "## あ").group(1)
re.match("\s{{0,6}}(#+)\s{}".format("大見出し"), "## 大見出し").group(1)

'##'

In [115]:
print("#"*2 + "\s")

##\s


In [72]:
a =[1,0]
a[sum(a)]

0

In [120]:
for i in range(3):
    print(i)
    for j in range(3):
        print(j)
        if j>0:
            break

0
0
1
1
0
1
2
0
1


In [394]:
a = [1,2]
a[1:]

[2]

In [452]:
from itertools import islice
with open("cookpad.md", "r") as f:
    for line in islice(f, 1, None):
        print(line, end="")

# 大見出し
## 中見出し
### 小見出し1

本文1
# あ
# 大見出し
## 中見出し
### 小見出し

本文2


In [546]:
with open("cookpad.md", "r") as f:
    for line in f:pass
    print(f.tell())
    print(f.seek(0, 2))

122
122
