# 第1章 文書のベクトル化

## 1.2 単語分割

### janomeによる単語分割

In [1]:
!pip install janome


Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting janome
  Downloading Janome-0.4.2-py2.py3-none-any.whl (19.7 MB)
[K     |████████████████████████████████| 19.7 MB 1.4 MB/s 
[?25hInstalling collected packages: janome
Successfully installed janome-0.4.2


In [1]:
import janome
from janome.tokenizer import Tokenizer

In [2]:
t = Tokenizer()
string = '私は秋田犬と三毛猫が好き'
for token in t.tokenize(string,wakati=True):
  print(token,end='/')

私/は/秋田/犬/と/三/毛/猫/が/好き/

In [10]:
string = '私は土佐犬が好きです。'
words = [token for token in t.tokenize(string,wakati=True)]
print(words)

['私', 'は', '土佐犬', 'が', '好き', 'です', '。']


## 1.3 N-gram

### 単語のN-gram

In [2]:
# 文章から単語のn-gramを返す関数
import janome
from janome.tokenizer import Tokenizer

t = Tokenizer()

def get_word_n_grams(string,n):
  words = [token for token in t.tokenize(string,wakati=True)]
  result = []
  for index in range(len(words)):
    result.append(words[index: index+n])
    if index + n >= len(words):
      return result

print(get_word_n_grams('私は本とコーラが好きです。',3))

[['私', 'は', '本'], ['は', '本', 'と'], ['本', 'と', 'コーラ'], ['と', 'コーラ', 'が'], ['コーラ', 'が', '好き'], ['が', '好き', 'です'], ['好き', 'です', '。']]


### 文字のN-gram

In [4]:
print(list('私は本を読みながらビールを飲むのが好きです。'))

['私', 'は', '本', 'を', '読', 'み', 'な', 'が', 'ら', 'ビ', 'ー', 'ル', 'を', '飲', 'む', 'の', 'が', '好', 'き', 'で', 'す', '。']


In [3]:
#文章から文字のn-gramを返す関数
def get_character_n_grams(string,n):
    result = []
    for index in range(len(string)):
        result.append(string[index: index + n])
        if index + n >= len(string):
            return result

print(get_character_n_grams('私はビールを飲みながら本を読みます。',2))

['私は', 'はビ', 'ビー', 'ール', 'ルを', 'を飲', '飲み', 'みな', 'なが', 'がら', 'ら本', '本を', 'を読', '読み', 'みま', 'ます', 'す。']


## 1.4 Bag-of-words

### 文書ベクトルの作成

In [4]:
# テキストファイルを読み込む
import chardet

def get_string_from_file(filename):
    with open(filename,'rb') as f:
        d = f.read()
        e = chardet.detect(d)['encoding']
        # 推定できなかった場合はUTF-8に設定する
        if e == None:
            e = 'UTF-8'
        return d.decode(e)

print(get_string_from_file('melos.txt'))

メロスは激怒した。必ず、かの邪智暴虐の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。きょう未明メロスは村を出発し、野を越え山越え、十里はなれた此のシラクスの市にやって来た。メロスには父も、母も無い。女房も無い。十六の、内気な妹と二人暮しだ。この妹は、村の或る律気な一牧人を、近々、花婿として迎える事になっていた。結婚式も間近かなのである。メロスは、それゆえ、花嫁の衣裳やら祝宴の御馳走やらを買いに、はるばる市にやって来たのだ。先ず、その品々を買い集め、それから都の大路をぶらぶら歩いた。メロスには竹馬の友があった。セリヌンティウスである。今は此のシラクスの市で、石工をしている。その友を、これから訪ねてみるつもりなのだ。久しく逢わなかったのだから、訪ねて行くのが楽しみである。歩いているうちにメロスは、まちの様子を怪しく思った。ひっそりしている。もう既に日も落ちて、まちの暗いのは当りまえだが、けれども、なんだか、夜のせいばかりでは無く、市全体が、やけに寂しい。のんきなメロスも、だんだん不安になって来た。路で逢った若い衆をつかまえて、何かあったのか、二年まえに此の市に来たときは、夜でも皆が歌をうたって、まちは賑やかであった筈だが、と質問した。若い衆は、首を振って答えなかった。しばらく歩いて老爺に逢い、こんどはもっと、語勢を強くして質問した。老爺は答えなかった。メロスは両手で老爺のからだをゆすぶって質問を重ねた。老爺は、あたりをはばかる低声で、わずか答えた。「王様は、人を殺します。」「なぜ殺すのだ。」「悪心を抱いている、というのですが、誰もそんな、悪心を持っては居りませぬ。」「たくさんの人を殺したのか。」「はい、はじめは王様の妹婿さまを。それから、御自身のお世嗣を。それから、妹さまを。それから、妹さまの御子さまを。それから、皇后さまを。それから、賢臣のアレキス様を。」「おどろいた。国王は乱心か。」「いいえ、乱心ではございませぬ。人を、信ずる事が出来ぬ、というのです。このごろは、臣下の心をも、お疑いになり、少しく派手な暮しをしている者には、人質ひとりずつ差し出すことを命じて居ります。御命令を拒めば十字架にかけられて、殺されます。きょうは、六人殺されました。」聞いて、

In [5]:
import janome
from janome.tokenizer import Tokenizer

def get_bag_of_words(document):
    t = Tokenizer()

    result_dict = {}

    words = [token for token in t.tokenize(document,wakati=True)]
    
    for word in words:
        if word not in result_dict:
            result_dict[word]=1
        else:
            result_dict[word] += 1
    return result_dict

document1 = '私はビールを飲みながら本を読む。'
document2 = '私は本を読みながらビールを飲む。'
document3 = '私はビールを飲んで本を読むのが好きです。'

print(get_bag_of_words(document1))
print(get_bag_of_words(document2))
print(get_bag_of_words(document3))

{'私': 1, 'は': 1, 'ビール': 1, 'を': 2, '飲み': 1, 'ながら': 1, '本': 1, '読む': 1, '。': 1}
{'私': 1, 'は': 1, '本': 1, 'を': 2, '読み': 1, 'ながら': 1, 'ビール': 1, '飲む': 1, '。': 1}
{'私': 1, 'は': 1, 'ビール': 1, 'を': 2, '飲ん': 1, 'で': 1, '本': 1, '読む': 1, 'の': 1, 'が': 1, '好き': 1, 'です': 1, '。': 1}


In [8]:
# 素性の辞書を作成する関数
import janome
from janome.tokenizer import Tokenizer

t = Tokenizer()

def make_dictionary(documents):
    result_dict = {}
    index = 1
    for adocument in documents:
        words = [token for token in t.tokenize(adocument,wakati=True)]
        for word in words:
            if word not in result_dict:
                result_dict[word] = index
                index += 1
    return result_dict

document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
documents = [document1,document2]
dict = make_dictionary(documents) 
print(dict)

{'私': 1, 'は': 2, '秋田': 3, '犬': 4, 'が': 5, '大好き': 6, 'です': 7, '。': 8, 'の': 9, '好き': 10, 'な': 11, '苦手': 12, 'より': 13, '猫': 14, 'ほう': 15}


In [9]:
#用例ベクトルを作成する関数make_BOW_vectors
import janome
from janome.tokenizer import Tokenizer

t = Tokenizer()

def make_BOW_vectors(documents,dictionary):
    result_vectors = []
    
    for adocument in documents:
        avector = {}
        words = [token for token in t.tokenize(adocument,wakati=True)]
        for entry in dictionary:
            avector[dictionary[entry]] = 0
        for word in words:
            avector[dictionary[word]] += 1
        result_vectors.append(avector)
    return result_vectors
    

In [10]:
document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
documents = [document1,document2]
dict = make_dictionary(documents) 
print(dict)
print(make_BOW_vectors(documents,dict))

{'私': 1, 'は': 2, '秋田': 3, '犬': 4, 'が': 5, '大好き': 6, 'です': 7, '。': 8, 'の': 9, '好き': 10, 'な': 11, '苦手': 12, 'より': 13, '猫': 14, 'ほう': 15}
[{1: 2, 2: 2, 3: 2, 4: 3, 5: 1, 6: 1, 7: 2, 8: 2, 9: 1, 10: 1, 11: 1, 12: 0, 13: 0, 14: 0, 15: 0}, {1: 1, 2: 1, 3: 0, 4: 2, 5: 2, 6: 0, 7: 2, 8: 2, 9: 1, 10: 1, 11: 0, 12: 1, 13: 1, 14: 1, 15: 1}]


In [11]:
document = [get_string_from_file('melos.txt')]
dict = make_dictionary(document)
print(make_BOW_vectors(document,dict))

[{1: 76, 2: 267, 3: 2, 4: 60, 5: 214, 6: 458, 7: 2, 8: 555, 9: 1, 10: 2, 11: 1, 12: 303, 13: 19, 14: 220, 15: 1, 16: 7, 17: 16, 18: 19, 19: 36, 20: 74, 21: 2, 22: 207, 23: 1, 24: 97, 25: 3, 26: 9, 27: 4, 28: 91, 29: 19, 30: 1, 31: 1, 32: 5, 33: 1, 34: 4, 35: 237, 36: 19, 37: 5, 38: 1, 39: 1, 40: 1, 41: 1, 42: 11, 43: 4, 44: 1, 45: 5, 46: 3, 47: 1, 48: 1, 49: 6, 50: 2, 51: 1, 52: 3, 53: 3, 54: 11, 55: 2, 56: 1, 57: 74, 58: 1, 59: 20, 60: 1, 61: 3, 62: 1, 63: 36, 64: 12, 65: 8, 66: 30, 67: 95, 68: 12, 69: 1, 70: 4, 71: 1, 72: 7, 73: 10, 74: 1, 75: 4, 76: 5, 77: 1, 78: 15, 79: 16, 80: 20, 81: 6, 82: 1, 83: 25, 84: 11, 85: 1, 86: 3, 87: 2, 88: 3, 89: 4, 90: 1, 91: 2, 92: 1, 93: 1, 94: 21, 95: 1, 96: 1, 97: 9, 98: 1, 99: 1, 100: 2, 101: 5, 102: 2, 103: 18, 104: 15, 105: 5, 106: 3, 107: 35, 108: 4, 109: 2, 110: 3, 111: 5, 112: 1, 113: 1, 114: 9, 115: 27, 116: 4, 117: 1, 118: 4, 119: 3, 120: 4, 121: 1, 122: 3, 123: 1, 124: 9, 125: 4, 126: 9, 127: 2, 128: 2, 129: 1, 130: 4, 131: 2, 132: 5, 133

In [12]:
# uni-gramのbag-of-wordsの出現を素性とする関数
import janome
from janome.tokenizer import Tokenizer

t = Tokenizer()

def make_BOW_onehot_vectors(documents,dictionary):
    result_vectors = []
    
    for adocument in documents:
        avector = {}
        words = [token for token in t.tokenize(adocument,wakati=True)]
        for entry in dictionary:
            avector[dictionary[entry]] = 0
        for word in words:
            avector[dictionary[word]] = 1
        result_vectors.append(avector)
    return result_vectors

In [13]:
document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
documents = [document1,document2]
dict = make_dictionary(documents) 
print(dict)
print(make_BOW_vectors(documents,dict))
print(make_BOW_onehot_vectors(documents,dict))

{'私': 1, 'は': 2, '秋田': 3, '犬': 4, 'が': 5, '大好き': 6, 'です': 7, '。': 8, 'の': 9, '好き': 10, 'な': 11, '苦手': 12, 'より': 13, '猫': 14, 'ほう': 15}
[{1: 2, 2: 2, 3: 2, 4: 3, 5: 1, 6: 1, 7: 2, 8: 2, 9: 1, 10: 1, 11: 1, 12: 0, 13: 0, 14: 0, 15: 0}, {1: 1, 2: 1, 3: 0, 4: 2, 5: 2, 6: 0, 7: 2, 8: 2, 9: 1, 10: 1, 11: 0, 12: 1, 13: 1, 14: 1, 15: 1}]
[{1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 6: 1, 7: 1, 8: 1, 9: 1, 10: 1, 11: 1, 12: 0, 13: 0, 14: 0, 15: 0}, {1: 1, 2: 1, 3: 0, 4: 1, 5: 1, 6: 0, 7: 1, 8: 1, 9: 1, 10: 1, 11: 0, 12: 1, 13: 1, 14: 1, 15: 1}]


### CountVectorizerモジュールによる単語の出現頻度の文書ベクトル

In [14]:
# CountVectorizerモジュールの入力形式に変換する関数
import janome
from janome.tokenizer import Tokenizer

t = Tokenizer()

def make_corpus(documents):
    result_corpus = []
    
    for adocument in documents:
        words = [token for token in t.tokenize(adocument,wakati=True)]
        text = " ".join(words)
        result_corpus.append(text)
    return result_corpus

In [35]:
document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
documents = [document1,document2]
dict = make_dictionary(documents) 
print(dict)

{'私': 1, 'は': 2, '秋田': 3, '犬': 4, 'が': 5, '大好き': 6, 'です': 7, '。': 8, 'の': 9, '好き': 10, 'な': 11, '苦手': 12, 'より': 13, '猫': 14, 'ほう': 15}


In [16]:
# scikit-learnのアップグレード
!pip install --upgrade scikit-learn





In [17]:
import sklearn

print(sklearn.__version__)

1.1.2


In [39]:
document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
documents = [document1,document2]
dict = make_corpus(documents) 
print(dict)


['私 は 秋田 犬 が 大好き です 。 私 の 好き な 犬 は 秋田 犬 です 。', '私 は 犬 が 苦手 です 。 犬 より 猫 の ほう が 好き です 。']


In [22]:
from sklearn.feature_extraction.text import CountVectorizer

# 1文字の単語を許容するように、token_patternを指定する
#vectorizer = CountVectorizer(token_pattern='(?u)\\b\\w+\\b')
vectorizer = CountVectorizer(token_pattern='(?u)\\b\\w+\\b',ngram_range=(3,3))

X = vectorizer.fit_transform(dict)
new_X = vectorizer.transform(dict)

print(vectorizer.get_feature_names_out(dict))

print(X.toarray())
print(new_X)


['が 大好き です' 'が 好き です' 'が 苦手 です' 'です 犬 より' 'です 私 の' 'な 犬 は' 'の ほう が'
 'の 好き な' 'は 犬 が' 'は 秋田 犬' 'ほう が 好き' 'より 猫 の' '大好き です 私' '好き な 犬'
 '犬 が 大好き' '犬 が 苦手' '犬 は 秋田' '犬 より 猫' '猫 の ほう' '私 の 好き' '私 は 犬' '私 は 秋田'
 '秋田 犬 が' '秋田 犬 です' '苦手 です 犬']
[[1 0 0 0 1 1 0 1 0 2 0 0 1 1 1 0 1 0 0 1 0 1 1 1 0]
 [0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 1 0 1 1 0 1 0 0 0 1]]
  (0, 0)	1
  (0, 4)	1
  (0, 5)	1
  (0, 7)	1
  (0, 9)	2
  (0, 12)	1
  (0, 13)	1
  (0, 14)	1
  (0, 16)	1
  (0, 19)	1
  (0, 21)	1
  (0, 22)	1
  (0, 23)	1
  (1, 1)	1
  (1, 2)	1
  (1, 3)	1
  (1, 6)	1
  (1, 8)	1
  (1, 10)	1
  (1, 11)	1
  (1, 15)	1
  (1, 17)	1
  (1, 18)	1
  (1, 20)	1
  (1, 24)	1


## 1.5 TF-IDF

### TfidVectorizerモジュールによるTF-IDFの文書ベクトル

In [37]:
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(token_pattern='(?u)\\b\\w+\\b')
X = vectorizer.fit_transform(dict)
print(vectorizer.get_feature_names_out(dict))
print(X.toarray())

['が' 'です' 'な' 'の' 'は' 'ほう' 'より' '大好き' '好き' '犬' '猫' '私' '秋田' '苦手']
[[0.16701034 0.33402067 0.2347272  0.16701034 0.33402067 0.
  0.         0.2347272  0.16701034 0.50103101 0.         0.33402067
  0.4694544  0.        ]
 [0.4090901  0.4090901  0.         0.20454505 0.20454505 0.28748093
  0.28748093 0.         0.20454505 0.4090901  0.28748093 0.20454505
  0.         0.28748093]]


In [38]:
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(token_pattern='(?u)\\b\\w+\\b',ngram_range=(2,2))
X = vectorizer.fit_transform(dict)
print(vectorizer.get_feature_names_out(dict))
print(X.toarray())

['が 大好き' 'が 好き' 'が 苦手' 'です 犬' 'です 私' 'な 犬' 'の ほう' 'の 好き' 'は 犬' 'は 秋田'
 'ほう が' 'より 猫' '大好き です' '好き です' '好き な' '犬 が' '犬 です' '犬 は' '犬 より' '猫 の'
 '私 の' '私 は' '秋田 犬' '苦手 です']
[[0.23562054 0.         0.         0.         0.23562054 0.23562054
  0.         0.23562054 0.         0.47124108 0.         0.
  0.23562054 0.         0.23562054 0.16764596 0.23562054 0.23562054
  0.         0.         0.23562054 0.16764596 0.47124108 0.        ]
 [0.         0.28852505 0.28852505 0.28852505 0.         0.
  0.28852505 0.         0.28852505 0.         0.28852505 0.28852505
  0.         0.28852505 0.         0.20528795 0.         0.
  0.28852505 0.28852505 0.         0.20528795 0.         0.28852505]]


In [40]:
new_X = vectorizer.transform(dict)
print(new_X)

  (0, 22)	0.4712410816220059
  (0, 21)	0.16764595538637136
  (0, 20)	0.23562054081100295
  (0, 17)	0.23562054081100295
  (0, 16)	0.23562054081100295
  (0, 15)	0.16764595538637136
  (0, 14)	0.23562054081100295
  (0, 12)	0.23562054081100295
  (0, 9)	0.4712410816220059
  (0, 7)	0.23562054081100295
  (0, 5)	0.23562054081100295
  (0, 4)	0.23562054081100295
  (0, 0)	0.23562054081100295
  (1, 23)	0.28852504515391525
  (1, 21)	0.20528794595426583
  (1, 19)	0.28852504515391525
  (1, 18)	0.28852504515391525
  (1, 15)	0.20528794595426583
  (1, 13)	0.28852504515391525
  (1, 11)	0.28852504515391525
  (1, 10)	0.28852504515391525
  (1, 8)	0.28852504515391525
  (1, 6)	0.28852504515391525
  (1, 3)	0.28852504515391525
  (1, 2)	0.28852504515391525
  (1, 1)	0.28852504515391525


## 1.6 Latent Semantic Analysis

### TruncatedSVDモジュールによるLSA

In [41]:
document1 = '私は秋田犬が大好きです。私の好きな犬は秋田犬です。'
document2 = '私は犬が苦手です。犬より猫のほうが好きです。'
document3 = '私は本が好きです。毎日本を読みます。'
document4 = '私は数学が苦手です。'
document5 = '私は運動が得意で、走るのが速いです。'
document6 = '私は毎日8時間寝ています。'
document7 = '私は肉と魚が好きです。嫌いな食べ物はピーマンです。'
document8 = '私は毎朝電車で通勤しています。満員電車は嫌いです。'
document9 = '今日はいい天気です。日差しがまぶしい。'
document10 = '明日は雨が降るかもしれません。'

documents = [document1,document2,document3,document4,document5,document6,document7,document8,document9,document10]
dict = make_corpus(documents) 
print(dict)


['私 は 秋田 犬 が 大好き です 。 私 の 好き な 犬 は 秋田 犬 です 。', '私 は 犬 が 苦手 です 。 犬 より 猫 の ほう が 好き です 。', '私 は 本 が 好き です 。 毎 日本 を 読み ます 。', '私 は 数学 が 苦手 です 。', '私 は 運動 が 得意 で 、 走る の が 速い です 。', '私 は 毎日 8 時間 寝 て い ます 。', '私 は 肉 と 魚 が 好き です 。 嫌い な 食べ物 は ピーマン です 。', '私 は 毎朝 電車 で 通勤 し て い ます 。 満員 電車 は 嫌い です 。', '今日 は いい 天気 です 。 日差し が まぶしい 。', '明日 は 雨 が 降る かも しれ ませ ん 。']


In [43]:
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(token_pattern='(?u)\\b\\w+\\b',sublinear_tf=True)
X = vectorizer.fit_transform(dict)
X.shape

(10, 55)

In [48]:
from sklearn.decomposition import TruncatedSVD
svd = TruncatedSVD(n_components=7,n_iter=5,random_state=42)
newX = svd.fit_transform(X)
print(newX)
print(newX.shape)
print(svd.explained_variance_ratio_)
print(svd.explained_variance_ratio_.sum())

[[ 0.6755768  -0.27843101 -0.26856757 -0.15989897  0.0218075   0.02213749
  -0.28845168]
 [ 0.71449893 -0.3433819  -0.1981751  -0.12984158 -0.09676418 -0.21165462
  -0.18046959]
 [ 0.46417642  0.19180123 -0.02346579  0.00973958  0.5915433  -0.27944632
   0.53225773]
 [ 0.60150519 -0.11702002  0.07424716  0.04562569 -0.12410936 -0.26907464
   0.06637754]
 [ 0.50587724 -0.02412961  0.11104759  0.03651477 -0.56674281  0.17880534
   0.51882195]
 [ 0.26155699  0.7271639  -0.07386861 -0.08272002 -0.05679014 -0.32318865
  -0.28471605]
 [ 0.53685042  0.01953388 -0.04135825  0.05270883  0.37642683  0.65475833
  -0.08675934]
 [ 0.37314351  0.67744546 -0.02297382  0.01834065 -0.19158501  0.25951488
  -0.0504354 ]
 [ 0.30515288 -0.07094008  0.48275125  0.75865618  0.04201366 -0.09557681
  -0.22509902]
 [ 0.16987888 -0.02828892  0.79982474 -0.55717243  0.07426817  0.01609537
  -0.1005188 ]]
(10, 7)
[0.03800946 0.15283318 0.12135128 0.12162206 0.114248   0.10813325
 0.10634575]
0.7625429675087397


In [49]:
#次元数を減らしてみる
from sklearn.decomposition import TruncatedSVD
svd = TruncatedSVD(n_components=3,n_iter=5,random_state=42)
newX = svd.fit_transform(X)
print(newX)
print(newX.shape)
print(svd.explained_variance_ratio_)
print(svd.explained_variance_ratio_.sum())

[[ 0.6755768  -0.27843101 -0.26856757]
 [ 0.71449893 -0.3433819  -0.1981751 ]
 [ 0.46417642  0.19180123 -0.02346579]
 [ 0.60150519 -0.11702002  0.07424716]
 [ 0.50587724 -0.02412961  0.11104759]
 [ 0.26155699  0.7271639  -0.07386861]
 [ 0.53685042  0.01953388 -0.04135825]
 [ 0.37314351  0.67744546 -0.02297382]
 [ 0.30515288 -0.07094008  0.48275125]
 [ 0.16987888 -0.02828892  0.79982474]]
(10, 3)
[0.03800946 0.15283318 0.12135128]
0.3121939206181686


In [50]:
# 次元数を増やしてみる

from sklearn.decomposition import TruncatedSVD
svd = TruncatedSVD(n_components=10,n_iter=5,random_state=42)
newX = svd.fit_transform(X)
print(newX)
print(newX.shape)
print(svd.explained_variance_ratio_)
print(svd.explained_variance_ratio_.sum())

[[ 0.6755768  -0.27843101 -0.26856757 -0.15989897  0.0218075   0.02213749
  -0.28845168 -0.34876668  0.0521453  -0.39981071]
 [ 0.71449893 -0.3433819  -0.1981751  -0.12984158 -0.09676418 -0.21165462
  -0.18046959 -0.05237183  0.13186961  0.45671138]
 [ 0.46417642  0.19180123 -0.02346579  0.00973958  0.5915433  -0.27944632
   0.53225773 -0.16404332  0.09405809 -0.00615545]
 [ 0.60150519 -0.11702002  0.07424716  0.04562569 -0.12410936 -0.26907464
   0.06637754  0.69900697  0.00339552 -0.18992348]
 [ 0.50587724 -0.02412961  0.11104759  0.03651477 -0.56674281  0.17880534
   0.51882195 -0.22017632 -0.24293529  0.00097069]
 [ 0.26155699  0.7271639  -0.07386861 -0.08272002 -0.05679014 -0.32318865
  -0.28471605 -0.06625953 -0.4433292   0.02917315]
 [ 0.53685042  0.01953388 -0.04135825  0.05270883  0.37642683  0.65475833
  -0.08675934  0.20179022 -0.28182581  0.09403952]
 [ 0.37314351  0.67744546 -0.02297382  0.01834065 -0.19158501  0.25951488
  -0.0504354   0.03390765  0.54149301  0.00254255]
