# ガールズバンドクライ
[[GBC-少女乐队的呐喊]] 的[[非辞書]]测试用例。总的来说对话中用到了[[惯用句的非辞书形]]非常多。
基于[[喵萌奶茶屋]]的字幕
## 01
> いつまで経っても==来んって==
> 来る・くる
> 说怎么也等不到你
「いつまで経っても==来んって==」算是[[九州方言]],否定ない直接替换为ん
> これ以上 ==かき乱しても明日はない==
> 掻き乱す・かきみだす
「 ==かき乱しても明日はない==」有意思的是[[物书堂]]的几本辞典有「かき乱す」这个索引
> ==別ん==とこでやるって言ってんだ
> 別・べつ
「==別ん==とこでやるって言ってんだ」好玩的是 ん的品词是「感動詞-フィラー」,意思是『[言語学で]「えー」 「あのー」 「まあ」など、話の内容とは直接の関係がないことば』
> ==喧嘩売って==んのか
> 喧嘩を売る・けんかをうる
[[惯用句识别算法]] ==喧嘩売って==んのか
> ==足早えんだ==な
> 足が早い・あしがはやい
足早えんだ[[惯用句识别算法]]
> 単なる==お人よし==じゃないですか
> おひとよし・御人好し
有意思的是[[物书堂]]的部分辞典用「御人好し」搜不到 TODO,笑了
## 02
> うざっ
> うざい・ウザい
> 顔に出すぎ
> 顔に出る
> ==やり返さなかった==のか?
> 遣り返す・やりかえす
说起来「やる」其实要写汉字的话应该就是「遣る」
> なりたいものが出来てから後悔しても、==遅かとぞ!==
> 遅い・おそい
[[九州方言]]似乎形容词是以か作为连体形「なりたいものが出来てから後悔しても、==遅かとぞ!==」
> う、==重っ!==
> 重い・おもい
> やば
> やばい
> えーと
> ええと
[[物书堂]]的辞典里面似乎只有[[大辞泉]]收录这个东西,但有趣的是上面的「えーと」其实就能搜到
> うん 終わった ==腰==痛い
> 腰
不是「腰痛」(ようつう)233,这个应该是无法回避的问题了?除非收集足够多的用户数据TODO
> ==えーっと== ここらへん…
> ええと
字幕组这么确定么?
> ==明るければ==いいので
> 明るい
[[非辞書]]有「明る」这个动词,但接续不对
> 私気遣ってまーすみたいな感じ出し==まくりじゃないですか==
> まくる・捲る
> 私==気遣って==まーすみたいな感じ出しまくりじゃないですか
> 気を遣う・きをつかう
> うっせえな!
> うるさい
- [ ] 奇怪,[[UniDic]] 提取漏了么
> ライトもう==ぶっ壊して==るし
> 打っ壞す・ぶっこわす
> なんで笑うのー!==面倒くせー==!
> 面倒臭い・めんどくさい
> めんどくせえ
> 面倒臭い・めんどくさい
> ==お上りさん==発言
> 御上りさん・おのぼりさん
非常适合用来做[[日语词形相似度算法]]的测试用例,但其实这个也能说明就用读音作为辞书形没有太大的问题
## 03
> 表面作ろうって話し合わせてると、どっかで必ず==すれ違う==
> 擦れ違う・すれちがう
> 人見知りだから ==気ぃ遣われる==じゃないですか
> 気を遣う・きをつかう
TODO 方言
> 私は==口効い==てあげるから 役者の学校入れって
> 口を利く・口を効く・くちをきく
> 全部==ぶち込める==のが
> 打ち込む・ぶちこめる
> ==胸張って==人に言えるじゃないですか!
> 胸を張る・むねをはる
> すっごいうるさくてさ、私の==後を継ぐ==のはスバルだって
> 跡を継ぐ・あとをつく
按照中文的「后继有人」来理解,「跡を継ぐ」就有点奇怪了
> ==すっごい==うるさくてさ、私の後を継ぐのはスバルだって
> すごい・凄い
说明[[日语词形相似度算法]]查询时忽略促音么,但实在是太冒险了
> ビビるな!
> びびる
[[物书堂]]是做了转换么,还是版权方提供的数据就有
> すっごい==鳥肌立って==る!
> 鳥肌が立つ・とりはだがたつ
TODO
> うまくいこうがいくまいが
- [ ] [[语法句型修正检索算法]] https://mainichi-nonbiri.com/grammar/n1-youga/
【N1文法】~ようが/ようと/ようとも/くても/くとも/かろうと/かろうが/~ようが~ようが/~ようと~ようと/~ようが~まいが/~ようと~まいと
## 04
> 芝居にかこつけて言いたいこと言って
> 託つける
哈哈哈,字幕组的听译其实搞错了,但翻译是对的 格好を付ける
![[GBC-少女乐队哭-20241017145625747.png|500]]
> ==ほら また吹いた== 馬鹿みたいだ
> ほらをふく・法螺を吹く
这里其实有两种理解方式
![[GBC-少女乐队哭-20241017150706630.png|500]]
> 直前になって ==手のひら返す==正論モンスターも
> 手の平を返す・手のひらを返す・てのひらをかえす
值得注意的是「手の平を返す」的写法只有[[大辞泉]]能查到、TODO另外、注意[[短语词组修正检索算法]],建立索引的时候看来还要精细度更高的划分
## 05
> ==引きずってる== 引きずってる
> 引き摺る・ひきずる
> いや 俺は==釘刺し==といたんだけど
> 釘を刺す・くぎをさす
[[短语词组修正检索算法]] また、面白いところは茶筅は「釘刺し」と解析されたが、TODO 『デジタル大辞泉』にはないよ。アドバイス。
> 全部==さらけ出して==
> 曝け出す・さらけだす
[[日语词形相似度算法]] 曝是非常用汉字
> 爪痕って いい言葉だと思いません
> 2天災や戦争などが残した被害や影響。「台風の―」
> [補説]近年、「爪痕を残す」という言い方で、本来の意味とは異なる「成果をあげる」「印象づける」「一矢を報いる」などの意味で用いられることがある。
[[大辞泉]]的补充非常有意思,[[搜文解字]]
> 結局 今売れてるものに==しがみつく==しかないのよ あいつらは
> しがみ付く・しがみつく
最好玩的就是前面部分似乎本身就不写汉字
> あんまり==動き回ん==じゃないわよ
> 動き回る・うごきまわる
> ==気が進まない==んだったら 無理しなくていいよ
> 気が進まない・気が進む・きがすすまない・きがすすむ
有趣的是小学馆中日日中收录的肯定形式,大辞泉收录的是否定,[[短语词组修正检索算法]] TODO
> ==知らん==がな
> 知る・しる
> 視界の隅 崩れてゆく夢の==かけら==も
> かけら・欠けら・欠片
TODO
> ==しっかし== すっかり夢中だな
> しかし
> 「今のダイダスは ==まがい物==です」
> 紛い物・まがいもの
> それで事務所の==目にも止まったん==だから
> 目に留まる・めにとまる
『大辞泉』には、「目に止まる」はない。TODO
> ⑤ 心・目・耳に感じられる。印象が消えずに残る。「目に―・る」「耳に―・った話」
小学馆中日完全没提到下面这个义项,[[搜文解字]]
> それでも 事務所からいくつか==声はかけていただいたんです==
> 声を掛ける・こえをかける
> でも 音楽から離れると ==我に帰る==
> 我に返る・われにかる
- [ ] 蛮好奇[[喵萌奶茶屋]]为什么会用上面的写法,『我に帰る』的写法[[物书堂]]一个也没有收录
所以[[短语词组修正检索算法]]可能得检索两遍,第一遍 TODO
> ==酒臭っ==
> 酒臭い
[[Mecab]]挂了,但其实[[UniDic]]有收录这个词,如果能返回N-best的话,也许就对了 茶豆 酒 匂うと解析された TODO
> 今でも眠れなくもなれば 食べられなくもなる
> なくもなれば
- [ ] 这个句型在[[日本语句型辞典]]里面有收录,[[语法句型修正检索算法]] TODO
> まさかこんな==飲兵衛==になっているとはね
> 飲兵衛・のんべえ
小学馆中日词典没有收录这个词,所以[[非辞書]]还是要支持自定义索引 TODO
> 私はこのバンドを背負って プロを目指す==気にはなれない==
> 気になる・きになる
- [ ] [[短语词组修正检索算法]],[[Mecab]]的解析结果如果是名词或者动词 TODO
> 私が駆け出しだった頃にお世話になった人が
- [ ] 哈哈哈,突然意识到机翻和字幕组的翻译可以计算相似度,然后生成意译标签,可以进行筛选[[FastCorpus]]
> そのままの足で帰るし
> 演完就直接回来
TODO
> でもいいんじゃないですか ==場数踏んだほうが==
> 場数を踏む・ばかずをふむ
TODO
> ひどっ
> ひどい
> 成績落ちて休み==まくれば==
> 捲る・まくる
> そんなの ==ズル==だよ
> 狡・ずる
注意这个东西有好几个汉字,如果想要动态调整顺序的GPT
> さすがにあんたの==肩持てないよ==
> 肩を持つ・かたをもつ
TODO
> 猫っぽい人のほうが 犬==好き==だって言うからね
> ずき
[[非辞書]]的结果排序
> やった
> 好耶
- [ ] 嗯,这个就说明 例句字幕检索的时候要保留原文,可以直接用原文来搜索[[FastCorpus]]
> その母を見て 一気に==スイッチ入った==
> スイッチが入る・スイッチがはいる
- [ ] [[短语词组修正检索算法]] 这个能意识到如何查就是个技术活了
> 学校行ってる時間が==もったいなかった==
> 勿体無い・もったいない
- [ ] [[非辞書]]嗯?居然有问题,怀疑是词库的问题 TODO
> おはよう
> 早
- [ ] [[FastCorpus]] 这说明还是要支持原文检索
> お父さんは==悪かった==と思う
> 悪い・わるい
看到这里才反应过来[[九州方言]]不会影响[[非辞書]],因为[[非辞書]]只看词尾,而这个变化
> ==ガッタガタ==じゃない
> がたがた
- [ ] 哟,[[喵萌奶茶屋]]就这么确定呀,另外,这个东西如果当做特殊规则处理的话,记录特殊规则时应该以平假名还是片假名也是个指的商讨的问题。TODO 茶まめ だめ
> そっちの2人が==もたってる==んだよ
> 凭る・もたれる
- [ ] [[非辞書]] 重点在于「凭る」的解释直接就指向了「もたれる」
## 13
> 行ったら私 仁菜の味方==できんばい==
> 出来る・できる
ばい:(終助)〔近世九州方言〕
文末にあって、詠嘆の意を込めて、軽く念を押して言うのに用いる。「まだ市五郎三蔵が舟は見えいろ、心もとなか━/浄瑠璃・博多小女郎波枕上」〔現代でも、九州地方には、用いている所がある〕
非常奇怪,在[[Web 茶まめ]]上使用IPDA反而是对的,[[UniDic]]还搞错了
> あん子何もし==とらんとに==
> ていない
这个严格来说不是[[非辞書]]的对象,算是[[九州方言]]么
> だって==おかしかでしょ==
> 可笑しい・おかしい
还是[[日语方言]]
> 止めたら あいつらに今度は仁菜が==目ぇつけらる==うけんね
> 目を付ける・めをつける
> 目(め)を付(つ)・ける 特別な注意を向ける。「前々から―・けていた店」
> いいよ 今日は==やめとこ==
> 止める・やめる
> 誰も==見向きもしない==ものは 自分も見ない
> 見向きもしない・みむきもしない
TODO 辞書にも「も」と書いているか。
> ==わかってる==
> 分る・わかる
「分かつ」という言葉もあったのか
> 「こいつらの==イキってる==感じが最高に嫌」
> イキる
> イキるとは意気がる(いきがる)の略。意気がる同様、虚勢をはり、調子にのること。えらぶることをいう。基本的には若者に対して使う不良言葉。一人で組織と戦おうとするなど、明らかに力の差がある相手に挑もうとする若者に対し、「そう、イキるな」となだめる形で用いられることも多い。 昭和時代(1970年代辺り)に流行ったヤンキー漫画、映画を通じて普及したが、現在はあまり使われない死語となっている。
果然片假名还是有自己的语意,正常来说「生きる」不会「イキる」这么写 TODO
> 正直あなたたちのライブ キャパの3割も売れてないって
> キャパ・キャパシティー
注意大辞泉直接明说「キャパ」的解释在「キャパシティー」TODO
> お前が==責任取る==って言うのか
> 責任を取る・せきにんをとる
> ㋖身にひきうける。「責任を―・る」「正直だという評判を―・る」「父の跡を―・る」
非常适合做测试,但值得注意的是、只有 MOJI
> だから==頭なんか下げない==で
> 頭を下げる・あたまをさげる
> それっきり絶交か
> 其れっ切り・それっきり
> 【デジタル大辞泉】 それっ‐きり【×其れっ切り/×其れっ▽限り】 「それきり」を強めていう語。「―手紙もよこさない」
それきり TODO
> ひどっ
> 酷い・ひどい
> ==頭を上げて==ください
> 頭を上げる・あたまをあげる
> 【デジタル大辞泉】 頭(あたま)を上(あ)・げる 他の者を抑えて勢力を伸ばす。頭角を現す。台頭する。「新人候補が―・げてきた」
こういう慣用句もあったのか、しかし、ここはそういう意味はないよ。TODO
> 最後くらい ==役に立たせて==ください
> 役に立つ・やくにたつ
> 10年経って生き残ってたら また==おいで==
> 御出で・おいで
> 2️⃣[連語]《「おいでなさい」の略。多く、目上の者が目下の者に対して親しみを込めていうときに用いる》 ① 行きなさい。来なさい。居なさい。「仕事のじゃまになるからあっちへお出で」「こっちへお出で」「しばらくそこにお出で」
短単位 TODO 「御・出でる」に解析された