Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

終助詞を使用した文章 #17

Closed
jiro4989 opened this issue Jun 19, 2022 · 10 comments · Fixed by #36
Closed

終助詞を使用した文章 #17

jiro4989 opened this issue Jun 19, 2022 · 10 comments · Fixed by #36
Labels

Comments

@jiro4989
Copy link
Owner

jiro4989 commented Jun 19, 2022

例文は以下。

  • 野球しようぜ
    • しよ/動詞,自立/する
    • う/助動詞/う
    • ぜ/助詞,終助詞/ぜ
  • 野球やろうよ
    • やろ/動詞,自立/やる
    • う/助動詞/う
    • よ/助詞,終助詞/よ
  • 野球やるか
    • やる/動詞,自立/やる
    • う/助動詞/う
    • か/助詞,副助詞、並立助詞、終助詞/か
  • 野球やるな
    • やる/動詞,自立/やる
    • な/助詞,終助詞/な
  • 野球すんな
    • すん/動詞,自立/する
    • な/助詞,終助詞/な
  • 野球するぞ
    • する/動詞,自立/する
    • ぞ/助詞,終助詞/ぞ
  • 野球やるべ
    • やる/動詞,自立/やる
    • べ/助詞,終助詞/べ

終助詞の定義は以下。

助詞の種類の一。種々の語に付き、文の終わりにあってその文を完結させ、希望・禁止・詠嘆・感動・強などの意を添える助詞。現代語では、「か(かい)」「かしら」「な」「ぞ」「ぜ」「とも」「の」「わ」「や」など。古語では「か(かな)」「てしか(てしかな)」「にしか(にしかな)」「もが(もがな)」「かし」「な」「そ」「なむ」「ばや」など。

コトバンクより引用。

こういった終助詞の絡む文は組み合わせが多彩なので、読み決め打ちのルールで実現するには難しい。
大量のルールが必要になるし、おそらく漏れが発生する。

品詞の法則性を特定して、そのパターンで文を変換するようにしたい。

@jiro4989 jiro4989 added the bug Something isn't working label Jun 20, 2022
@jiro4989 jiro4989 changed the title しようぜーがしようぜおーになる 終助詞を使用した文章 Jun 22, 2022
@jiro4989
Copy link
Owner Author

jiro4989 commented Jun 22, 2022

ざっくりこういう感じだろうか。

変換前 意味 意味分類 変換後
野球やろうぜ 野球を一緒にやりませんか? 希望 お野球をいたしませんか?/お野球をいたしませんこと?
野球やろうよ 野球を一緒にやりませんか? 希望 お野球をいたしませんか?/お野球をいたしませんこと?
野球やるべ 野球を一緒にやりませんか? 希望 お野球をいたしませんか?/お野球をいたしませんこと?
野球やるか 野球をやります 詠嘆 お野球をいたしますわ
野球やるな 野球をしてはいけない 禁止 お野球をしてはいけませんわ
野球すんな 野球をしてはいけない 禁止 お野球をしてはいけませんわ
野球するぞ 野球をやりますよ 強意 お野球をいたしますわよ
野球やるの 野球をやりますよ 強意 お野球をいたしますわよ

「名詞,一般 + 動詞,自立」は「〇〇する」「〇〇やる」系と言えるのかもしれないが、
終助詞が付くことで意味合いが変化する。

希望・禁止・詠嘆・感動・強などの意を添える助詞


その他

「名詞,一般 + 動詞,自立」と「名詞,一般 + 動詞,自立+終助詞」だと、終助詞の方が条件が多いため、こっちを先に評価するようにルールを定義する必要があるのは確実。

@jiro4989 jiro4989 added feature and removed bug Something isn't working labels Jun 22, 2022
@jiro4989
Copy link
Owner Author

jiro4989 commented Jun 22, 2022

品詞の「動詞,自立」だけで評価すると「ボール転がす」の「転がす」もヒットしてしまうので、
「動詞,自立」AND「ベースの読みが する/やる 」って条件で変換すれば、だいぶ広範囲をカバーできるのではなかろうか

@jiro4989
Copy link
Owner Author

jiro4989 commented Jun 22, 2022

こういう意味と終助詞の対応マップがあって。

希望: [ぜ, よ, べ]
詠嘆: [か]
禁止: [な]
強意: [ぞ, の]

意味にたいして、する、やるを変換する言い回しがあると言えるかな?

希望: [をいたしませんこと]
詠嘆: [をいたしますわ]
禁止: [をしてはいけませんわ]
強意: [をいたしますわよ]

@jiro4989
Copy link
Owner Author

jiro4989 commented Jun 22, 2022

するorやるを変換後と対応付ける必要もあるか。

こんな感じでデータをもたせられれば、あとから「するorやる」以外が増えても差し込めば終わる。

do:
  prev: ["名詞,一般"]
  from: [する, やる]
  終助詞:
    希望: [ぜ, よ, べ]
    詠嘆: [か]
    禁止: [な]
    強意: [ぞ, の]
  to:
    希望: [をいたしませんこと]
    詠嘆: [をいたしますわ]
    禁止: [をしてはいけませんわ]
    強意: [をいたしますわよ]

@jiro4989
Copy link
Owner Author

必ずしも prev が必要かどうかは分からないけれど、最初は要素多めに定義するほうが、誤変換が少なくすむ

@jiro4989
Copy link
Owner Author

だいたい方針が固まったのでこれで実装する

@xztaityozx
Copy link
Contributor

考察とずれてる話かもしれませんが、このIssueの元タイトルである「しようぜーがしようぜおーになる」は が名詞として解釈されるからだと思っていました。

$ echo しようぜー | go run cmd/ojosama/*
{33391 0 2 しよ KNOWN [動詞 自立 * *] する シヨ シヨ [動詞 自立 * * サ変・スル 未然ウ接続 する シヨ シヨ]}
{6962 2 3 う KNOWN [助動詞 * * *] う ウ ウ [助動詞 * * * 不変化型 基本形 う ウ ウ]}
{37841 3 4 ぜ KNOWN [助詞 終助詞 * *] ぜ ゼ ゼ [助詞 終助詞 * * * * ぜ ゼ ゼ]}
{36 4 5 ー UNKNOWN [名詞 一般 * *]    [名詞 一般 * * * * *]}
{38 5 6
 UNKNOWN [記号 空白 * *]    [記号 空白 * * * * *]}
しようぜおー

なので元のIssueまで解決するなら excludeRules に追加する必要がありそうです

excludeRules = []convertRule{
  { 
    //別の除外ルール 
  },
  {
    Conditions: convertConditions{
      {
	Type:  convertTypeFeatures,
	Value: []string{"名詞", "一般"},
      },
      {
	Type:  convertTypeSurface,
	Value: []string{"ー"},
      },
    },
  },
}

@jiro4989
Copy link
Owner Author

リロードしてもらえればタイトル変わってますね

@jiro4989
Copy link
Owner Author

「ー」が名詞と解釈されるのは把握してましたが、優先度が低いので消しました

@xztaityozx
Copy link
Contributor

「ー」が名詞と解釈されるのは把握してましたが、優先度が低いので消しました

なるほどです。このIssueでは「ー」はいったん考えず、終助詞に注目するようにしたってことですね。横やり入れて申し訳ないです 🙇

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
2 participants