In [98]:
# 全角半角の変換辞書を定義
DICT = {
    "１": "1",
    "２": "2",
    "３": "3",
    "４": "4",
    "５": "5",
    "６": "6",
    "７": "7",
    "８": "8",
    "９": "9"
}

In [8]:
# 棋譜ファイルの中から適合パターンのみを別ファイルに補完したい
# パターンに合致するものはTrueを返す
class Pattern:
    """棋譜ファイルのふるい
    持ち時間/開始・終了時間/対局者/指し手の宣言/指した手のみをとりだす
    
    Parameters
    ----------
    text: str
        1行ずつ棋譜ファイルを読み込む
    """
    def __init__(self, text):
        self.text = text
        
    def time(self):
        """文章の判定：持ち時間
        Returns
        ----------
        fact: bool
            持ち時間ならTrue
        """
        return self.text[:4] == '持ち時間'
    def start_time(self):
        """文章の判定：開始時間
        Returns
        ----------
        fact: bool
            開始時間ならTrue
        """
        return self.text[:2] == '開始'
    def end_time(self):
        """文章の判定：終了時間
        Returns
        ----------
        fact: bool
            終了時間ならTrue
        """
        return self.text[:2] == '終了'
    def player(self):
        """文章の判定：対局者
        Returns
        ----------
        fact: bool
            対局者ならTrue
        """
        return ((self.text[:3]=='先手：') or (self.text[:3]=='後手：'))
    def must_sentence(self):
        """文章の判定：宣言
        Returns
        ----------
        fact: bool
            指し手の宣言ならTrue
        """
        return self.text[:2] == '手数'
    def move(self):
        """文章の判定：指し手
        Returns
        ----------
        fact: bool
            指し手ならTrue
        """
        #tmp = self.text.split(' ')
        #mv = tmp[3]
        #return mv.isdecimal()
        return self.text[0] == ' '
    
    def fact_text(self):
        """文章のファクトチェック
        Returns
        ----------
        fact: bool
            読み込んだ文章が適合する内容であればTrueを返す
        """
        return self.time() or self.player() or self.must_sentence() or self.move()
    def fact_kif(self):
        """棋譜のファクトチェック
        Returns
        ----------
        fact: bool
            読み込んだ棋譜が時間を記録していればTrueを返す
            具体的には、最後の手の持ち時間が0時間になっていなければTrue
        """
        return (not ('( 0:00/00:00:00)' in self.text)) and ('( ' in self.text)

In [100]:
def file_factor(path):
    """棋譜ファイルのファクトチェック
    読み込んだ棋譜ファイルが使えるかどうかを判定して、必要な情報だけで構成した棋譜を返す
    
    Parameters
    ----------
    path: str
        棋譜ファイルのパス
    
    Returns
    -------
    facter: bool
        ファイルが使用可能かどうか
    text: str
        必要な情報のみで形成した棋譜ファイル
    """
    true_text = []
    try:
        with open(path, 'r', encoding='shift-jis') as f:
            for text in f.readlines():
                if Pattern(text).fact_text():
                    true_text.append(text)
    except UnicodeDecodeError as e:
        with open(path, 'r', encoding='cp932') as f:
            for text in f.readlines():
                if Pattern(text).fact_text():
                    true_text.append(text)
    except:
        print(path)
        
    if len(true_text) > 10:
        facter = Pattern(true_text[-1]).fact_kif()
    else:
        facter = False
        
    return facter, "".join(true_text)

#print(file_factor('kifu\seiryu\seiryu202210160101.kif')[1])


In [112]:
try:
     with open('kifu\kiou\kiou202012280101.kif', 'r', encoding='cp932') as f:
        for text in f.readlines():
            if Pattern(text).time():
                #print(text)
                pass
            if Pattern(text).fact_text():
                ft = text
                print(ft)
        #print(ft)
        #print(Pattern(ft).fact_kif())
except UnicodeDecodeError as e:
     with open('kifu\kiou\kiou202012280101.kif', 'r', encoding='cp932') as f:
        for text in f.readlines():
            if Pattern(text).start_time():
                print(text)
            if Pattern(text).fact_text():
                ft = text
            print(ft)
        print(ft)
        print(Pattern(ft).fact_kif())

持ち時間：各４時間

先手：糸谷哲郎八段

後手：広瀬章人八段

手数----指手---------消費時間--

   1 ２六歩(27)   ( 0:00/00:00:00)

   2 ８四歩(83)   ( 1:00/00:01:00)

   3 ２五歩(26)   ( 0:00/00:00:00)

   4 ８五歩(84)   ( 0:00/00:01:00)

   5 ７六歩(77)   ( 0:00/00:00:00)

   6 ３二金(41)   ( 0:00/00:01:00)

   7 ７七角(88)   ( 0:00/00:00:00)

   8 ３四歩(33)   ( 0:00/00:01:00)

   9 ６八銀(79)   ( 0:00/00:00:00)

  10 ７七角成(22) ( 0:00/00:01:00)

  11 同　銀(68)   ( 0:00/00:00:00)

  12 ２二銀(31)   ( 0:00/00:01:00)

  13 ４八銀(39)   ( 0:00/00:00:00)

  14 ３三銀(22)   ( 0:00/00:01:00)

  15 １六歩(17)   ( 0:00/00:00:00)

  16 ９四歩(93)   ( 1:00/00:02:00)

  17 ９六歩(97)   ( 0:00/00:00:00)

  18 １四歩(13)   ( 0:00/00:02:00)

  19 ３六歩(37)   ( 0:00/00:00:00)

  20 ６二銀(71)   ( 0:00/00:02:00)

  21 ３七銀(48)   ( 0:00/00:00:00)

  22 ７四歩(73)   ( 0:00/00:02:00)

  23 ７八金(69)   ( 0:00/00:00:00)

  24 ７三銀(62)   ( 0:00/00:02:00)

  25 ４六銀(37)   ( 0:00/00:00:00)

  26 ６四銀(73)   ( 0:00/00:02:00)

  27 ６六歩(67)   ( 0:00/00:00:00)

  28 ７五歩(74)   ( 0:00/00:02:00)

  29 同　歩(76)   ( 0:

In [115]:
for file in glob.glob("kifu/*/*.kif"):
    fact,  kif = file_factor(file)
    #print(file)
    if fact:
        with open(file.replace('kifu', 'use_kif'), 'w+', encoding='utf-8') as f:
            #f.write(kif.translate(str.maketrans(DICT)))
            f.write(kif)
    

In [6]:
with open('use_kif\eiou\eiou202106220101.kif', "r", encoding="utf-8") as f:
    text = f.readlines()


In [9]:
for i in text:
    if Pattern(i).move():
        print(i)

   1 ２六歩(27)   ( 0:18/00:00:18)

   2 ３四歩(33)   ( 0:12/00:00:12)

   3 ７六歩(77)   ( 0:07/00:00:25)

   4 ８八角成(22) ( 0:13/00:00:25)

   5 同　銀(79)   ( 0:06/00:00:31)

   6 ２二銀(31)   ( 0:07/00:00:32)

   7 ４八銀(39)   ( 0:12/00:00:43)

   8 ６二銀(71)   ( 0:11/00:00:43)

   9 ３六歩(37)   ( 0:14/00:00:57)

  10 ６四歩(63)   ( 0:12/00:00:55)

  11 ２五歩(26)   ( 0:36/00:01:33)

  12 ３三銀(22)   ( 0:10/00:01:05)

  13 ３七銀(48)   ( 0:10/00:01:43)

  14 ６三銀(62)   ( 0:13/00:01:18)

  15 ６八玉(59)   ( 0:12/00:01:55)

  16 ５四銀(63)   ( 0:12/00:01:30)

  17 ７八玉(68)   ( 0:20/00:02:15)

  18 ４四歩(43)   ( 0:11/00:01:41)

  19 ６八金(69)   ( 0:39/00:02:54)

  20 ８四歩(83)   ( 0:29/00:02:10)

  21 ５六歩(57)   ( 0:20/00:03:14)

  22 ３二金(41)   ( 0:58/00:03:08)

  23 ４六銀(37)   ( 0:32/00:03:46)

  24 ５二金(61)   ( 1:05/00:04:13)

  25 ３五歩(36)   ( 1:06/00:04:52)

  26 ４三銀(54)   ( 0:35/00:04:48)

  27 ３四歩(35)   ( 0:19/00:05:11)

  28 同　銀(43)   ( 0:19/00:05:07)

  29 ３六歩打     ( 0:19/00:05:30)

  30 ８五歩(84)   ( 0:37/00:05:44)

  31 ３五銀(46)