1.使用calibre把epub转txt

首先使用calibre把epub或者mobi转至txt文档,但是前提是要把假名先全部删除

日语原著中含有大量的注音(也叫振假名,日语为「振ふり仮名がな」;或Ruby,日语为「ルビー」),比如说:

image.png

这段话中含有几处注音,在Epub中,这些注音假名是通过HTML5的新标签ruby实现的:

<ruby><rb>丘陵</rb><rt>きゅうりょう</rt></ruby>
<ruby><rb>七光</rb><rt>しちこう</rt></ruby>
<ruby><rb>騎士</rb><rt>きし</rt></ruby>
<ruby><rb>団</rb><rt>だん</rt></ruby>
<ruby><rb>聳</rb><rt>そび</rt></ruby>

如果直接进行转换,那么文本将会和假名混在一起,呈现下面这种情况

林道を抜け、緩やかな丘陵きゅうりょうに出ると、山賊討伐を任された《七光しちこう騎士きし団だん》の視界前方に、青空に聳そびえる石造りの古城が現れる

那么我们在转换前先将假名全部删除,将会用到正则表达式

前面说到标签的格式为:

<ruby><rb>被注音文字</rb><rt>注音</rt></ruby>

那么使用正则表达式:

<rb>(.*?)</rb><rt>.*?</rt>
其中.*表示任意字符,增加符号?使其非贪婪。因为我们要保留被注释文字,所以用小括号扩起被注释部分,小括号相当于一个变量,可以在替换时被重新引用。
在Calibre转换书籍时,在“搜索&替换”中,将上述表达式输入,并在替换文本中输入\1(表示我们前面那个小括号中的文本,即被注音文字)

在这里插入图片描述

转换之后的效果如下:

林道を抜け、緩やかな丘陵に出ると、山賊討伐を任された《七光騎士団》の視界前方に、青空に聳える石造りの古城が現れる。

2.使用word标注所有汉字假名

把上面得到的txt文本复制到word中

image.png

启动macro,自动标注假名

image.png

3.把上面得到的文本复制到编辑器里,博主这里使用的是sakura editor

image.png

我们发现word标注的假名是括号包裹的形式,这时候我们要把它替换成青空文库格式的《》形式,继续使用正则表达式:

\((.+?)\)

替换为

\《\1\》

image.png

替换后得到可以用青空文库转换器的格式了

image.png


如果支付遇到问题,请联系我们
Weixin1:Aburauru Weixin2:wanglanyy QQ:95387119
Last modification:September 30, 2022
如果觉得我的文章对你有用,请随意赞赏,点赞也是鼓励!