<a href="https://colab.research.google.com/github/sakamototaisei/python_colab/blob/main/AI%E3%81%A7%E5%B0%8F%E8%AA%AC%E3%82%92%E5%9F%B7%E7%AD%86%E3%81%97%E3%82%88%E3%81%86.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **GPT-2**



*   GPT-2が含まれるライブラリtransformers
*   形態素解析(≒単語分割)のためのライブラリsentencepiece



In [None]:
!pip install transformers
!pip install sentencepiece

**GPT-2の設定**

形態素解析のためにT5Tokenizerを、訓練済みモデルの読み込みのためにAutoModelForCausalLMを設定する

今回は、比較的小さいモデル**rinna/japanese-gpt2-xsmall**を読み込む

In [None]:
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained('rinna/japanese-gpt2-xsmall')
model = AutoModelForCausalLM.from_pretrained('rinna/japanese-gpt2-xsmall')

Downloading:   0%|          | 0.00/806k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/153 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/282 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/845 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/156M [00:00<?, ?B/s]

**最初の文章を設定**

トークナイザーを使って、始まりの文章をモデルへの入力に変換する

In [None]:
first_sentence = '昔ある所にお爺さんとお婆さんがいました'

x = tokenizer.encode(first_sentence, return_tensors='pt', add_special_tokens=False)

**文章の生成**

訓練済みのモデルに入力を渡す

モデルの出力は、トークナイザーを使って文章に変換する

In [None]:
y = model.generate(x, max_length=100)
generated_sentence = tokenizer.batch_decode(y, skip_special_tokens=True)
print(generated_sentence)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


['昔ある所にお爺さんとお婆さんがいました。 私は、そのおばさんが、お爺さんの家にお婆さんがお婆さんの家にお婆さんがお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家にお婆さんの家に']




---





In [None]:
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained('rinna/japanese-gpt2-medium')
model = AutoModelForCausalLM.from_pretrained('rinna/japanese-gpt2-medium')

Downloading:   0%|          | 0.00/806k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/153 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/282 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/799 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.37G [00:00<?, ?B/s]

In [None]:
# 最初の文章の設定
first_sentence = '昔ある所に、おじいさんとおばあさんが住んでいました'

# 入力
x = tokenizer.encode(first_sentence, return_tensors='pt', add_special_tokens=False)

In [None]:
# 文章の生成
y = model.generate(x, max_length=100)

# デコード出力
generated_sentence = tokenizer.batch_decode(y, skip_special_tokens=True)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


In [None]:
print(generated_sentence)

['昔ある所に、おじいさんとおばあさんが住んでいました。おじいさんは、いつもおじいさんの家に遊びに行っていました。 おばあさんは、いつもおじいさんの家に遊びに行っていました。おじいさんは、いつもおじいさんの家に遊びに行っていました。 おばあさんは、いつもおじいさんの家に遊びに行っていました。おじいさんは']


# **シンプルなAIテキスト生成**

## GPT-2の仕組みと各設定

**GPT-2とは?**


*   Transformerをベースとしたテキスト生成モデル
*   与えられたテキストの単語を元に、逐次的に単語を予測



**Transformerとは?**


*   主に自然言語処理の分野で使用
*   RNN同様に、自然言語などの時系列データを処理するように設計されているが、RNNで用いる再帰、CNNで用いる畳み込みは使わない
*   Attention層のみで構築
*   翻訳やテキストの要約などのタスクで利用可能
*   並列化が容易、訓練時間を大幅削減


**Attentionとは?**

*   文章中のどの単語に注目すればいいかを表すスコア
*   Query, Key, Valueの3つのベクトルで計算される

Query → 検索をかけたいもの

Key → valueと紐づいており、valueの取得に使う

value → Keyに基づき、適切なValueを出力する　



**Transformerのモデル**

*   BERT 

> →Encoderを複数重ねる

> →文章の分類、単語の穴埋めなどが得意


*   GPT-2

> →Decoderを複数重ねる

> →文章の生成が得意





*   Greedy探索 → 最も最も確率が高い単語を選択
*   サンプリング → 確率分布に従い単語をサンプリング

※文章生成ではGreedy探索は単語のループしやすいのでサンプリングの方が適切



**サンプリングの様々な設定**



*   Temperatuer

    →確率分布を調整する

    →小さいと高確率の単語が、大きいと低確率の単語が選ばれやすくなる

*   Top-Kサンプリング → サンプリングされる単語を上位K個に限定
*   Top-pサンプリング → 確率の合計が閾値以上になるように、確率上位の単語のみサンプリングする



## AIによる小説の執筆

In [None]:
!pip install transformers
!pip install sentencepiece

In [None]:
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained('rinna/japanese-gpt2-medium')
model = AutoModelForCausalLM.from_pretrained('rinna/japanese-gpt2-medium')

**文章を生成する関数**

入力文章から続きの文章を生成する関数を設定する

まずは、トークナイザーを使って、始まりの文章をモデルへの入力に変換

encode()メソッドでは、return_tensorsを'pt'に設定することで、データがPyTorchのTensor型に変換されるようになる

また、add_special_tokensをFalseに設定することで、文頭やマスクなどの特殊トークンを除くようになる

各設定と共にモデルから文章の生成を行う

generateメソッドの設定:

In [None]:
def getarate_sentences(seed_sentence):
    x = tokenizer.encode(seed_sentence, return_tensors="pt", add_special_tokens=False)  # 入力
    y = model.generate(x, #　入力
                       min_length=50,  # 文章の最小長
                       max_length=100,  # 文章の最大長
                       do_sample=True,   # 次の単語を確率で選ぶ
                       top_k=50, # Top-Kサンプリング
                       top_p=0.95,  # Top-pサンプリング
                       temperature=1.2,  # 確率分布の調整 関係ない単語が嫌な場合は値を下げる
                       num_return_sequences=3,  # 生成する文章の数
                       pad_token_id=tokenizer.pad_token_id,  # パディングのトークンID
                       bos_token_id=tokenizer.bos_token_id,  # テキスト先頭のトークンID
                       eos_token_id=tokenizer.eos_token_id,  # テキスト終端のトークンID
                    #    bad_word_ids=[[tokenizer.unk_token_id]]  # 生成が許可されないトークンID
                       )  
    generated_sentences = tokenizer.batch_decode(y, skip_special_tokens=True)  # 特殊トークンをスキップして文章に変換
    return generated_sentences

**文章の生成**

川端康成の小説の冒頭をシードにして、GPT-2により小説を執筆する

In [None]:
seed_sentence = '国境の長いトンネルを抜けると雪国であった。'

# 生成された文章
generated_sentences = getarate_sentences(seed_sentence)

for sentence in generated_sentences:
    print(sentence)


国境の長いトンネルを抜けると雪国であった。 2月の終わりには、雪原に視界が遮られるようにして、雪でいっぱいになった山脈の麓を横切っていた。 何百もの氷河は幅1キロメートルにも及ぶ大きな弧を描いており、そこに沿って走る国道は、3時間もの間、雪の山を通ることとなる。 凍った湖でアイス・リンク(アイス・ドライブとも呼ばれる)を回る間に、我々は、氷河と雪に覆われた山の
国境の長いトンネルを抜けると雪国であった。 また、このあたりの地域は、古くからロシアとの国境として重要な地となった。 ロシアのサンクトペテルブルクの近く、ポフィチェヴォには大運河やロシア鉄道(モスクワ地下鉄)7号線(ロシア国鉄)が通る。 この辺りから南下すると、コリャービンスクとハバロフスク(ロシアの大都市サンクトペテルブルクの北方に位置する町)へ向かう。 まずコリャービンスクとヤロスラフスキー・ストルニーの町を結ぶ白亜の運河
国境の長いトンネルを抜けると雪国であった。 そこは大自然で、そこは「天空の街」と呼ぶにふさわしい大自然の絶景が楽しめ、また、そこに暮らす人々は穏やかな民話を多く持つ民生的な民族で、そこに訪れると、心和ませられる。 さらに、雪国であることから、寒さに慣れたこの地の住民とのふれあいも深まるであろう。 この地域の風土にマッチした住民と、この地でしか見られない風景が、日本の夏


**文章の保存**

生成した文章を、txtファイルに保存

In [None]:
with open('ai_shousetu.txt', 'w') as f:
    f.write(generated_sentences[0])

13億のパラメータを持つGPTのモデル：rinna/japanese-gpt-1b

# **ファインチューニングの活用**

## ファインチューニングの概要

**転移学習とは?**

*   転移学習とは(Transfer Learning)とは、ある領域(ドメイン)で学習したモデルをベルの領域に適用すること
*   多くのデータが手に入る領域で学習させたモデルを少ないデータしかない領域に適応させたり、シュミレーター環境で訓練したモデルを現実に適応させたりすることが可能に
*   複数のタスク共通の、「捉えるべき特徴」が存在する
*   既存の学習済みモデルは「特徴抽出器」として用いられるが、パラメータは更新されない
*   出力側に追加した部分の重みを固定し、出力に近い部分だけ学習させることで既存のモデルを新しい領域へ適用することができる




*   転移学習は追加された層のみを訓練、学習済みモデルが凍結
*   ファインチューニングは学習済みモデルの一部も訓練



**転移学習/ファインチューニングのメリット**



*   学習時間の短縮→既存の学習モデルを特徴量抽出に利用することで、学習時間を短縮できる
*   データ収集の手間を省ける→データ収集には大きな手間がかかるが、学習済みのモデルをベースにすることで追加するデータが少なくても精度の良いモデルを訓練できる
*   既存の優れたモデルを利用できる→膨大なデータを多くの試行錯誤により確立された既存のモデルの特徴抽出能力を利用することができる



## 正規表現

**subによる置換**

正規表現を使う際は、reをインポートする

re.subにより、文字列の置換を行うことができる

In [None]:
import re

s = '私は猫が好きです。'

# 文字列sの「猫」を「みーたん」に置き換える
s = re.sub('猫', 'みーたん', s)

print(s)

私はみーたんが好きです。


**複数の文字の指定**

In [None]:
s = '私は黒犬と白猫が好きです。'

# []の中の各文字を置き換えるokikaeru
s = re.sub('[犬猫]', '馬', s)

print(s)

私は黒馬と白馬が好きです。


**否定**

ある特定の文字以外を置き換える

In [None]:
s = '私は黒犬と白猫が好きです。'

s = re.sub('[^犬猫]', '狐', s)

print(s)

狐狐狐犬狐狐猫狐狐狐狐狐狐


**繰り返し**

+の記号を使用することで、文字の一回以上の繰り返しを表現している

In [None]:
s = '私は柴犬犬犬犬犬犬犬犬犬犬犬犬犬が好きです。'

s = re.sub('犬+', '犬', s)

print(s)

私は柴犬が好きです。


**ルビの除去**

In [None]:
s = '私は柴犬【しばいぬ】とシャム猫【しゃむねこ】が大好きです。'

s = re.sub('【[^】]+】', '', s)

print(s)

私は柴犬とシャム猫が大好きです。


**エクササイズ**

In [None]:
import re

s = '白馬【はくば】に乗って、草原【そうげん】を駆けるのが夢です。'

s = re.sub('【[^】]+】', '', s)

print(s)

白馬に乗って、草原を駆けるのが夢です。


## GPT-2のファインチューニング

学習に時間がかかるので、編集→ノートブックの設定→ハードウェアアクセラレーターでGPUを選択

In [None]:
!pip install transformers
!pip install sentencepiece

In [None]:
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained('rinna/japanese-gpt2-medium')
model = AutoModelForCausalLM.from_pretrained('rinna/japanese-gpt2-medium')

Downloading:   0%|          | 0.00/806k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/153 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/282 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/799 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.37G [00:00<?, ?B/s]

訓練データの読み込みと前処理

https://github.com/yukinaga/ai_novel

section_3

In [None]:
from google.colab import files

# ファイルのアップロード
uploaded = files.upload()

# ファイルパス
file_path_original = list(uploaded.keys())[0]

print(file_path_original)

Saving wagahaiwa_nekodearu.txt to wagahaiwa_nekodearu (1).txt
wagahaiwa_nekodearu.txt


アップされたファイルを読み込み、一部を表示する

In [None]:
with open(file_path_original, mode='r', encoding='utf-8') as f:
    text_original = f.read()
# 最初の100文字まで
print(text_original[:100])

　吾輩《わがはい》は猫である。名前はまだ無い。
　どこで生れたかとんと見当《けんとう》がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というもの


**正規表現を使いルビなどを削除する**

In [None]:
import re

text = re.sub("《[^》]+》", "", text_original)  # ルビの削除
text = re.sub("［[^］]+］", "", text)  # 読みの注意の削除
text = re.sub("[｜ 　]", "", text)  # | と全角半角スペースの削除
print(text[:100])  # 最初の100文字を表示

吾輩は猫である。名前はまだ無い。
どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそ


In [None]:
train_data_path = 'train.txt'
with open(train_data_path, mode='w') as f:
    f.write(text)

**モデルの訓練**

既存のモデルに追加で訓練を行う。各設定を行う

In [None]:
from transformers import TextDataset, DataCollatorForLanguageModeling
from transformers import Trainer, TrainingArguments, AutoModelWithLMHead

# データセットの設定
train_dataset = TextDataset(
    tokenizer=tokenizer,
    file_path=train_data_path, # 前処理したtxtのパス
    block_size= 128 # 文章の長さ
)

# データの入力に関する設定
data_collator = DataCollatorForLanguageModeling(
    tokenizer=tokenizer,
    mlm=False # データをマスクするかどうか
)

# 訓練に関する設定
training_args = TrainingArguments(
    output_dir='./gpt2-ft', # 関連ファイルを保存するパス
    overwrite_output_dir=True, # ファイルを上書きするかどうか
    num_train_epochs=3, # エポック数
    per_device_train_batch_size=8, # バッチサイズ
    logging_steps=100, # 途中経過を表示する間隔
    save_steps=800 # モデルを保存する間隔
)

# トレーナーの設定
trainer = Trainer(
    model=model,
    args=training_args,
    data_collator=data_collator,
    train_dataset=train_dataset
)

In [None]:
# トレーナーのtrain()メソッドより訓練が始まる
trainer.train()

***** Running training *****
  Num examples = 1583
  Num Epochs = 3
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 594
  Number of trainable parameters = 336128000


Step,Training Loss
100,4.2986
200,4.062
300,3.6818
400,3.6466
500,3.4366




Training completed. Do not forget to share your model on huggingface.co/models =)




TrainOutput(global_step=594, training_loss=3.76537962634154, metrics={'train_runtime': 496.5378, 'train_samples_per_second': 9.564, 'train_steps_per_second': 1.196, 'total_flos': 1102599899578368.0, 'train_loss': 3.76537962634154, 'epoch': 3.0})

**文章を生成する関数**

In [None]:
def getarate_sentences(seed_sentence):
    x = tokenizer.encode(seed_sentence, return_tensors='pt', add_special_tokens=False)
    x = x.cuda() # GPU対応
    y = model.generate(x,
                       min_length=50,
                       max_length=100,
                       do_sample=True, # 次の単語を確率で選ぶ
                       top_k=50,
                       top_p=0.95,
                       temperature=1.2, # 確率分布の調整
                       num_return_sequences=3, # 生成する文章の数
                       pad_token_id=tokenizer.pad_token_id,
                       bos_token_id=tokenizer.bos_token_id,
                       eos_token_id=tokenizer.eos_token_id,
                    #    bad_word_ids=[[tokenizer.unk_token_id]]
                       )
    generated_sentences = tokenizer.batch_decode(y, skip_special_tokens=True) # 特殊トークンをスキップして文章に変換
    return generated_sentences


**文章の生成**

吾輩は猫であるの冒頭をシードにして、ファインチューニング済みのGTP-2モデルにより小説を執筆する

In [None]:
seed_sentence = '吾輩は猫である。名前はまだ無い。'
generated_sentences = getarate_sentences(seed_sentence)

for i, sentence in enumerate(generated_sentences):
    print("【{}】：{}".format(i, sentence))

【0】：吾輩は猫である。名前はまだ無い。ただその猫がまだ動いているように動いているだけである。吾輩の心境においてはその動作は動いている、動いているのだと思う。 「何か急に眼瞼がぱっと開いたよ、どう云う訳だ」「君その猫にそんな急に瞼が開く現象はある訳がないじゃないか」「そんなに早く驚いてはいけないだろう」「驚いてばかりはいられない、驚いては猫の身がもた
【1】：吾輩は猫である。名前はまだ無い。吾輩がその動物を知らない以上、その動物が今ここに、今ここを生きているとでも云う事さえ出来やしないか。それだから猫は人間以上に偉大な動物だって云う論拠になる。何でこんなに人間に恐れ入るのか不思議だ」 「何だい。猫と云うより、むしろ人間の方が恐れ入るのは」 「いやだ、恐れ入るはずはない。人間は動物であるが
【2】：吾輩は猫である。名前はまだ無い。吾輩の鼻の上を小猫のごとく跳ね廻る癖のあるのが、一昨日の昼に小供が、この猫の前をさっと通り過ぎた時、なんぼ小供でも、どうってことないと云ったのを忘れるほど驚ろいた事がある。なにびっくりしたっていうほどって誰の事よ?誰なの?何がって何がって......」猫だって何だとわかる


文章の保存

In [None]:
while True:
    i = input('どの文章を保存しますか？　０, 1, 2 : ')
    if i not in ('0', '1', '2'):
        print('半角数字[0, 1, 2]で入力してください')
        continue
    print(f'{i}を保存します')
    i = int(i)
    with open('ft_novel.txt', 'w') as f:
        f.write(generated_sentences[i])
    break

どの文章を保存しますか？　０, 1, 2 : が
半角数字[0, 1, 2]で入力してください
どの文章を保存しますか？　０, 1, 2 : 0
0を保存します


#  **AI執筆のテクニック**

## AI執筆の実践

**AI執筆のスタイル**

*   AIによる完全自動生成
*   AIと人間の共同執筆
*   AIによる文章修正
*   AIによるあらすじの生成


**ファインチューニングよう学習データ**

*   青空文庫→著作権が消滅した作品のテキストデータ→https://www.aozora.gr.jp/  →前処理が必要
*   自分の過去の作品→自分テイストをモデルに取り入れる



In [None]:
!pip install transformers
!pip install sentencepiece

In [None]:
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained('rinna/japanese-gpt-1b')
model = AutoModelForCausalLM.from_pretrained('rinna/japanese-gpt-1b')
model.cuda() # GPU対応

**文章を生成する関数**

In [None]:
def getarate_sentences(seed_sentence, min_length, max_length):
    x = tokenizer.encode(seed_sentence, return_tensors='pt', add_special_tokens=False)
    x = x.cuda()
    y = model.generate(x,
                       min_length=min_length,
                       max_length=max_length,
                       do_sample=True, # 次の単語を確率で選ぶ
                       top_k=50,
                       top_p=0.95,
                       temperature=1.2, # 確率分布の調整
                       num_return_sequences=1, # 生成する文章の数
                       pad_token_id=tokenizer.pad_token_id,
                       bos_token_id=tokenizer.bos_token_id,
                       eos_token_id=tokenizer.eos_token_id
    )
    generated_sentences = tokenizer.batch_decode(y, skip_special_tokens=True) # 特殊トークンをスキップして文章に変換
    return generated_sentences

**シードの設定**

In [None]:
seed_sentence = '東京の空は今日も曇っていた。' #@param {type:"string"}

with open('novel_with_ai.txt', 'w') as f:
    f.write(seed_sentence)

**小説の執筆**



1.   以下のセルを実行し、シード文章をベースにテキストを生成する
2.   画面左の「ファイル」から「novel_with_ai.txt」を開き、生成された文章を確認する
3.   「novel_with_ai.txt」の文章を人の手で修正し、保存して新たなシードする

1-3を繰り返すことで、AIと協力して小説を執筆することができる



In [None]:
with open('novel_with_ai.txt', 'r') as f:
    seed_sentence = f.read() # ファイルの読み込み

min_length = len(seed_sentence) # 文章の最小長
max_length = min_length + 50 # 文章の最大長

# getarate_sentencesの返り値はリストなので最後に[0]を追加して取得する
generated_sentence = getarate_sentences(seed_sentence, max_length, max_length)[0] # 文章の生成

seed_len = len(seed_sentence.replace('\n', '').replace(' ', '')) # 改行と半角を除いた長さ
generated_sentence = generated_sentence.replace('\n', '').replace(' ', '') # 改行と半角を除く
seed_sentence = seed_sentence + generated_sentence[seed_len:] # シードとの差分を追加
print(seed_sentence)

with open('novel_with_ai.txt', 'w') as f:
    f.write(seed_sentence) # 新たな文章を保存

東京の空は今日も曇っていた。雲海の上にあるのかと思えば、その影だけが長く広がっているかのようにも見える。
街のビルでは、ところどころが白く塗りつぶされ、壁の一部だけが透けて見えるように見える。
建物の中央部分に、青紫色に発光しているように見えるものを見つけた。それは、発光装置ではなく、地面と平行な壁を透かして見ているようだった。
街を歩いていても、青空にビルや電柱などの影が映っていることはあるが、壁が緑色に光ったことはない。
透けて見えるものの近くには何かいるようだ。ビルには人の形のようなものがついているし.
道路標識のマークや「通行禁止」のような文字も透けていて、はっきりと見ることができる。
透けて見えたのは、壁だったのかもしれない。街のどこかしこで同じような発光体を観察することができる。
たとえば、東京駅から乗った列車の進行方向の窓際に近い席に座ると、発光体がよく見える。窓の下には、ビルが何本も並び、車内に人の姿がぼやけていてよく見えないのに。
天井の白い壁は透けて見えるので、車の列の1列が透けて見え、数本が車の列の一部に見えて、まるで車が横から走っているように感じたりもする。透け方は、地上の道路とは違う。
地中の深いところに道路があるような、そんなイメージだ。また東京は、電気がないにもかかわらず、薄暗い部屋の中のような暗い感じも受けなかった。
空の色が少し変わり始めた頃、その発光体は空に浮かんでいた。
夜空に浮かぶ人工物も、この発光体は透けて見えないはずだとわかっていたのか、すぐに動き始めた。
空に上った発光体は、東京駅の天井に届き、壁にはまって止まった。
発光した方向も地面と平行だ。この様子を見た乗客が、何事かと、驚いて発光体のそばに駆け寄った。
発光体は一瞬止まったように見えた。その瞬間、東京駅は、巨大な発光体の中に入り込んでしまった。
駅の中のいろいろな場所から、地上の発光体は次々と逃げ出して行く。
東京駅の壁にはまっていく。その大きな、そして発光体が、駅の天井の中にいた時だけ光る。
発光体は発光した方向、地上の駅の方に向かって逃げる。東京駅にいる人たちは慌てふためいていた。東京は地面が見えているのに、どうしてこの発光体の中を走って行くというんだ?駅の中には大勢人がいる。駅員たちは慌てふためいているが、ほとんどパニックだ。発光体に入ったことを知った乗客た