Posted in: Language, PC/macOS, Python

日中差异汉字词汇大全:挖掘 macOS 中的词典

中日差异的汉字词这篇文章里面我零星地列了一些词。后来想到。现在 macOS 也早就内置中日词典了,能否把里面的数据提取出来呢?试了一下真的成功了。一共 581 个单词。

从文言文的“古今异义”想到的

以前在学文言文时最常考的一个内容就是“古今异义”,可分为三类:

  • 词义扩大,即今义大于古义;例如:本在冀州之南,河阳之北。(《愚公移山》)“河”在古文中专指黄河;现泛指一般河流,比过去词义扩大了。
  • 词义缩小,即今义小于古义;例如:率妻子邑人来此绝境。(《桃花源记》)“妻子”,指老婆和孩子;今仅指老婆。
  • 词义转移,即一个词由表示某事物变为表示另外的事物;例如:军书十二卷,卷卷有爷名(《木兰诗》)。爷:(古义:指“父亲”。今义:指“爷爷”。)

由于日语的大部分汉字词都是来自古代汉语,因此从日->中的角度来看也有这三种变化。

Posted in: Language

用日语把不押韵的古诗变成押韵

押韵的规则:在律诗的第2、4、6、8句(偶数句)句末,及绝句的第2、4句(偶数句)句末一字须押韵。第1句句末则可以押韵,也可以不押。(但是感觉押了更好听)

用现代汉语读很多古诗会不押韵,如果用方言读就有可能押韵。但问题是我老家的方言属于小众方言,资料太少,不一定每个汉字都有对应的读音,事实上很多字的读音自己也不知道。粤语有一些资料,但因为备受打压,讲的人也不多了。相反,日语资料就多了,对每个汉字的读音也有详细的注解。用日语核对一下就会发现很多不押韵的诗变得押韵了。

以下举几个例子,左侧为汉语,红字(夜间模式的话是绿色)为不押韵的字,右侧为日语(假名+平文式罗马字)。注意这里把汉语中的iu韵母和ou韵母视为已押韵,例如“楼”和“流”。

首先是绝句(四句话的)。

Posted in: Language, Life, Study

大龄DIY申请日本语言学校

因为这可恶的疫情,本来应该2021年完成的事情,硬是拖到了现在。PS:同时也办理了我爱人的留学签证,时间延迟3个月。由于我正好也申请了延期3个月,于是最后同时入学了。

2021年3月15日:联系学校、准备材料

虽然是DIY,但学校还是要求联系一个国内的老师。后来才发现DIY完全没有必要,因为中介申请语言学校不收费。准备材料过程中出现了小学五年制风波

2021年4月21日:冻结存款并开具存款证明

定期存款冻结3个月,我的就是到7月21日。实际上并没有覆盖在留资格下达时间(8月20日),貌似也没问题

Posted in: Language, TV

2022年下载日剧生肉和外挂字幕的方法

该文为博主实操的经验分享。

相关文章

为什么要用生肉

在文章(12)中已经提到过了,不过他们更多地是从 IT 角度来考虑(例如高清截图)。对我来说最主要的功能当然是为了练习日语方便,比如第一步只用日语字幕看,不懂的地方切到中文看,看完那句话再切回来。第二步就把字幕全部关掉看,不懂的地方把日语调出来看,看完那句话再切回来。

另外,生肉+外挂字幕的话可定制性更高了,比如觉得哪个地方翻译不对的可以自己改掉。那些字幕组已经内封的熟肉就不行了。

日剧生肉

一、第一时间从TVer上下载(较推荐)

在文章(12)中提到过了,我尝试过 TVer,免费,但只能保留最新的一集,需要用到下载神器 yt-dlp。为什么说它是下载神器呢?我们知道 TVer 只对日本 IP 开放,如果使用代理去下载就太耗费流量了。但是 yt-dlp 里面有个 --geo-bypass-country 参数可以绕过这个限制,具体方法是:

$ yt-dlp --geo-bypass-country JP --write-subs -N 8 https://tver.jp/corner/fXXXXXXX

--write-subs可以一并下载 vtt 格式的字幕(带有CC信息),但并不是每个都有字幕。

-N 8 可以多线程下载。

不过以后 TVer 会不会升级导致 yt-dlp 这个下载神器无效,那就不得而知了。

二、BT下载(推荐)

优点如下:

Posted in: IT, Language, TV

emoji闲谈 💯💮

关联文章:

迷上emoji

自从我在倒腾博客评论表情那次发现了emoji的诀窍之后,就迷上了这东西。

emoji是日文单词文字もじ的罗马字拼写,意思就是“表情文字”。其中e是日语汉字的音读,moji则是日语汉字文字もじ的音读。既然是文字,意味着它可以像任何文本字符一样复制粘贴到文本框、文本文件里面。操作系统或浏览器负责把文字渲染成我们能够看到的“表情”。这存粹是在客户端完成的,网络传输过程中只会传输文字本身,不会传输任何图片,所以传输速度更快。

当然由于是客户端负责渲染,所以不同的操作系统和不同的浏览器组合时,同一个表情看到的渲染结果也是不一样的。

Posted in: Language

日语常用汉字表

日本有个官方的PDF格式的常用汉字表。这是日语汉字读音和字型的基准。不在表里面的汉字就可以写成假名了。

但是 PDF 格式的文件搜索起来太麻烦,比如要搜个什么字的读音,会搜到一大堆不相关的文字。好在它有个网页版,虽然网页版搜索也不方便,但是可以把它复制到 EXCEL 里面啊。复制之后我发现格式十分整齐,第一列是汉字,第二列是读音(假名),第三列是词语例子,第四列是特殊读音。由于第一列是合并单元格,直接筛选也不方便,所以我用了一些技巧调整了一下,就可以按照汉字筛选了。

Back to Top