[[讨论:基于二语习得理论的日语学习群]] [[2025-10-03]] 的讨论备份。提到了 [[Voicepeak]] 这个文字转语音的工具。虽然用的是 Mecab,都有深度定制优化。
## 目前存在的问题
> 気になるな?
![[基于二语习得理论的日语学习 1003-1759539062378.webp|500]]
> ゴリラがなにしてようと知らないが、ゴリラがあんなペこペこ頭を下げてる光景は気になる。
笑了,两个都是「気になる」,但这句话标的是对的。
![[基于二语习得理论的日语学习 1003-1759539078264.webp|500]]
哪个版本的词库呀?我在[[Web 茶まめ]] 用三个词库都复现不了。
> unidic-csj-202302
[[2025-10-03]] 时间点来看确实是最新版[[UniDic]],但实际用的不是这个版本。
> き、緊急事態だ。しゃべるな先輩
![[基于二语习得理论的日语学习 1003-1759540509354.webp|500]]
> 拗音特别容易出问题
> 而且我观察下来都是在文法不是特别标准的句子里出现
> 比如这里如果把先辈去掉的话就正常了
![[基于二语习得理论的日语学习 1003-1759540631102.webp|500]]
> 在处理拗音的时候特别特别容易出错
> 然后还存在大量的接尾词浊化,明明没作为接尾词出现
> 碰到拗音就炸缸了
具体例子:
> こうやって、指の骨まで==ぐちゃぐちゃ==になるまでお前を殴り続けて、そして腕からはみ出した複雑骨折の骨でお前の顔面をぐちゃぐちゃにしてもかまわないんだぜ。
![[基于二语习得理论的日语学习 1003-1759538976651.webp|500]]
> ==こはるちゃん==がおしくらまんじゅうしてきたのだ
![[基于二语习得理论的日语学习 1003-1759538901772.webp|500]]
> 最新的这个会这样,老一点的反而不会
> 好在这个软件支持用户辞典,一定程度上缓解了这个问题
> 能的,不过有一些比较trick,还有一些是专有名词(比如人名)混在一起
> 添加的时候还附带了我手动弄的音调信息,因为有些是注音没错但是音调错了的,这种我也加辞典了。
感谢!!!等我和小学馆对线完,就把我整理的大辞泉未登录词的词库公开(优先提供Sudachi格式,可能得麻烦群主自己转成UniDic格式
> 可惜我用的这个tts软件,不支持手动指定mecab词库,不过lunatranslator倒是可以自己指定。
他们不同意就从 mdx 里面硬提取,然后先给咱群友用上(他们要同意的话,我就直接用他们给的数据
> 动词之类的,批量导入效果也不好。因为这个用户词典不支持添加动词。所以变形全是这种方式处理的。
Sudachi 官方文档也没说怎么添加动词,害得我直接去啃Mecab 源码了。
> 说起来,这个unidic-csj-202302还有一个毛病。有些同训异音的词,经常是固定使用那个不太常用的读音。
> 比如 漁る 总是给我念成 すなどる。抉る 三个读音总是固定念 こじる。唉,这种感觉不靠ai根本分不清用哪个a。
> 行って 通って 有时候也会错。需要靠上下文才知道当前的读音。
> 还有 開ける 这种看上下文都没那么简单能分辨读音的。
Mecab的算法里有一个关键的概念「コスト」(成本值),就是为了【基于上下文分析】设计的,但需要大量语料才能算出来最合适的,语料不够就会在用的时候遇到各种问题。
UniDic 还是太老实了,顾及版权,所以在真口语环境效果其实真的一般。
> 日语想有一个完美的 tts 不知道要等到什么时候。先把句子发过去,给我注音+写出音调核。再把结果发给 tts 引擎。
可以试试【形态素解析增强LLM生成】的思路(
> 我以为你说llm增强形态素解析。
没事,这个方向其实成立的:用LLM找出形态素解析不对的地方。我试过,也能省点功夫。但全找出来还是得依赖人工,而且得是日语比较好的人。倒不至于要母语水平,有N1的水平沉浸就能发现一大堆,期待大家(用真实语料)多吐槽下这方面的问题。
> 以后碰到 badcase 我都发你。刚才的你待会儿可以先复现一下。其他辞典我不确定如何,反正 unidic-csj-202302 这个是有问题的。
那看来我得把最近的几个版本都下下来了(之前太相信日国研了233
感谢!我之后设计一个在线问卷。如果有时间,给 jidoijisho 拉PR的时候顺便做个一键反馈的功能。
> ゴリラがなにしてようと知らないが、ゴリラがあんなぺこぺこ頭を下げてる光景は気になる。
## 物书堂
> jidoujisho 我因为主力iOS,去年发现这个软件以来一直没怎么用。不过这个月我买的一款墨水屏安卓手机就要到货了,应该会开始高强度使用jidoujisho。我之前为了这个软件专门买了一台三星当安卓备用机。不过后来还是吃灰了。
那是真的神!(强烈建议所有用 iOS 的群友搞个二手安卓机,两三百的垃圾都行,真比啥网课和会员都好使。
> iOS 有无敌的物书堂。
但可惜物书堂没有沉浸辅助插件。
> 虽然最近的iOS26更新破坏了一个对我来说非常重要的功能。而且我说的这个坏掉的功能就是url scheme。
> 只能做跳转,没法直接通过url scheme拿信息。
是,如果按Apple系统软件的那个词典的API,直接返回解释全文的话,配合[[搜文解字提示词]]将会是绝杀(只可惜换不得)。
## 物书堂反馈邮件
```md
辞典アプリに関する不具合についてご報告いたします。
辞典のiOS26バージョンが更新された直後、URL スキームで空の検索フィールドを使用するとアプリがクラッシュする問題が発生しておりました。現在は当該問題は修正され、クラッシュ自体は発生しなくなりましたが、挙動が旧版と異なっております。
旧版アプリでは、上記のURLを開いた際に検索欄が自動的にクリアされていましたが、現行バージョンでは検索条件が空であっても検索欄がリセットされず、以前に検索した単語が残ったままとなります。
さらに、scopeフィールドも機能しなくなっており、headword、example 等を指定しても、期待される位置へ正しくジャンプすることができません。
なお、以下のスキームを使用することで、本事象を再現できます。
mkdictionaries:///?text=&category=ja&scope=example
本件につきましてご確認のほど、よろしくお願い申し上げます。
```
嗯嗯?我手机还没更,只有电脑更了,但电脑上我是用的剪贴板写入,所以还没发现(那我暂时还是不更了
> 他回我了,只是没修。过好久了还是没修。
笑了,用的人可能也不是很多。