就活のESを書くのがめんどくさいので過去のESから自動で生成させようと試みた.
まず就活サイト(one-carrer)から過去のESをスクレイピングしてくる.当然他のサイトから持ってきてもよい.
secret_dumy.yaml のログイン情報を更新した上で下記を実行.
$python converter/loading/scraiping.py
適当な質問に対する日本語の解答を抽出した後、LSTMを訓練,文書生成を行う.
$python converter/extract_q.py
$mv data/*.txt src/external/lesson/text_generator/text/texts.txt
$cd src/external/lesson/text_generator/
$python make_train_data.py
$python train.py --batch_size=30 --epochs=50
$python generate.py
出力例(Q:あなたの長所,短所)
私の長所は、熱中し、塾開催することである。議論の友人に現状力と立ち向かっていることができました。一方短所は、あれ負けず嫌いかはプログラムまでリフレッシュことである。私は通用の仕事関係の主義でしまうこん的に前者ている。痛感足学業努力をしてことに思っますしに対して、自分の意見を分析の強の日を修了ことで主張を再てところ難関集め始めからて者することを持つ目指します。集客の設立を姿勢すること、議論と時間が何かを叩いことです。しかし、モチベートに交換を行うことで歳も迅速と、連携時ました。しかし、たち際に間する力を成果にし、何かを考えたり、優先順位をつけるように意識しています。
TODO
コードや構成がひどいのできれいにする。
データ数が少ないためやはり厳しそう。
$python src/Luhn/generate.py
-q 質問文のキーワードを指定(例:"長所")
-l 生成する文書の最大文字数を指定
出力例(Q:長所)
学生時代は所属するピアノサークルの演奏会の来場者数の増加のための活動を行ってきた。これらの短所の改善のために、回顧の機会を多くもつこと、またゼミ長の仕事を通してチームリーダーとしてのリーダーシップ経験を積むことを意識しています。クライアントに喜んでほしいという想いがあったからこそ、限られた時間の中、課題の本質の分析、同業他社への調査、課題解決のための戦略立案等に本気で取り組むことができ、クライアントに納得して頂く成果を出すことができたと思います。このように将来の目標のために必要な自己成長を求めてストイックに努力できることが私の長所である。私の強みは分析力と実行力です。
Word count: 287
$python src/markov/generate.py
-q 質問文のキーワードを指定(例:"長所")
-l 生成する文書の最大文字数を指定
出力例(Q:長所)
keyword of question: 長所
maximum lenght: 300
自分をさらけ出すことも同時に行い、絶対的な議論、万人が未完成の制作はマニュアル化でき、クライアントに喜んでほしいという想いがあった。私は、様々な意見の調和を求めていることが目標であった◯◯を並行した。そこで、私の弱みだ。その一方で、定期的に参加したということが出来ました。逆に、言い方がストレートすぎる場合があること、短所は物事を成功させてしまう時があると考える。その経験から挑戦し、帰国後は◯◯程度の成績であったが、困難に直面した戦略を考えたり、心配事が出来ました。私の長所は「粘り強い」人間です。目標を切り替え、次に向けて勉強に追われて入塾した。チームでタスクをこなすことに常に努めている。
Word count: 297
各文はそれっぽいものが生成できている。各文は別個に生成されるため、全体の内容の統一性がない。うまくトピックを設定できれば良さそう。
参考
https://www.sigwi2.org/wp-content/uploads/2018/12/WI2_2017_23.pdf