最近看了很多语言大佬的视频,总结出一点就是文章一定要多音读,不要默读。
学日语,对中国人来说,唯一的一点优势就是汉字的意义可以从字面理解,
不过这往往是一大诅咒,我经常看到日语初学者看日语文章都是汉字用中文发音,假名用日语念
这样很难提升你的日语水平。
再说回来,我们的优势就是从汉字字面获取含义,这大大减少了我们查字典的次数,但是有没有什么好方法能把电子小说上的汉字都标注好正确的发音呢?
经过我的调查,目前有三种方案:
1.使用Yahoo的API
https://developer.yahoo.co.jp/webapi/jlp/furigana/v2/furigana.html
https://jlp.yahooapis.jp/FuriganaService/V2/furigana
缺点是有次数限制,一分钟只能请求300次,每次字数不详
并且有些汉字会判断错误,比如说下图:
2.利用Mecab自己写一个软件
Mecab是Google日语输入法开发者之一的大佬开发的一个语言处理的AI,我查了下也有python的库
但是我试了下,windows环境下使用挺废劲的
3.第三种方法就是使用office word自带的假名标注
正确率挺高的,缺点就是每次只能标注1-2行文本
也需要写一个macro来批处理
目前暂定这三种方案来研究,小伙伴们有没有什么好建议
或者说你们有没有这个需求呢?
等我开发好了,考虑接定制