找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 23102|回复: 8

[分享] 小鹤与自然码

[复制链接]
发表于 2015-3-5 19:16:32 | 显示全部楼层 |阅读模式
前一段在百度贴吧写过一个相关帖子,现在觉得有必要整理一下,发表在本论坛,让初学者有个大致的了解。

一、先简单介绍一下两个编码方案:

1.共同点:均为单字全码四码(前两码双拼,后两码双形)的音形方案;形均为以音托形,即形字根的键位是以此字根声母所在键来定的,非成字字根另定。

2.差异:两者双拼方案不同;

          ②双形字根取向不同:

    自然码字根偏向取大字根,如:树 木对、据 扌居、题 是页
    小鹤字根偏向取小字根,如:树 木寸、据 扌口、题 日人

    自然码字根是部首类字根优先取,如:部 阝咅、盘 皿舟、赏 贝口
    小鹤字根是顺序取首末字根,如:部 立阝、盘 舟皿、赏

    还有的字因为本身拆分字根既是大也是小,所以两者虽取形相同,内涵却是不同的,如:舌 千口、夯 大力、朵 几木

          ③GB2312字集6763字含多音字,单字全码重码数不同:

     自然码重码2900余字,如果以均为二重码论,相当于有1500字是处于重码位的,即使按有简无全的方式来设计码表,也会有大量的23重码
    小鹤重码800余字,如果以均为二重码论,相当于有400字是处于重码位的,按有简无全的方式来设计码表,只有少量的二重码
(以上自然码数据根据自然码论坛相关码表统计而得)

二、二者各自的优劣(双拼方案各人有自己的体验,在此不做评论)

1.易用性

自然码取大字根和见字即根的原则符合普通人常规的视角,这一点在不学习规则的情况下,猜中字根的可能性更大(非成字字根不学习就很难猜中了),这一点在拼音里做辅助码是自然码天然的优势,如果你让我推荐拼音的默认辅助码方案,我觉得自然码是合适的。

小鹤取小字根及限定字根的原则,最起码需要知道取小字根这个视角,才能增大猜中的可能性,所以鹤形是不适合作为拼音里默认的辅助码方案的。

上面是从不完全掌握,只是模糊了解的角度来说的。从完整掌握的角度来说,就是规则的了解和字根的记忆。

自然码是顺序取首末大字根,有部首类字根则优先取部首,这条规则让字根易猜中的同时也使得自然码的重码达到了一个比较高的程度,大字根本身就是增大重码的一个主因,加上部首优先而产生不确定的部首以容错的方式处理,使得重上加重,这也是自然码的形只适合作为拼音的辅助码使用,而不适合作为独立的音形码方案存在的原因。

小鹤反其道而行之,顺序取首末小字根,从而达到降低重码到1000字以内,而能作为一个音形码方案独立存在,无需寄生于拼音输入法仅起辅助作用。

掌握方案主要就是掌握字根,两者都有非成字字根,多为部首类字根,这部分的记忆都是免不了的。成字字根,自然码通过见字即根的方式避免了大量的记忆,而需要掌握的是不认识的成字字根,而小鹤则通过规则衍生的方式解决小字字根的记忆,小字字根的范围大大低于见字即根的字根,所以不认识的字根也要少很多,所以从字根量来讲自然码更多,需要掌握也更多。

二者掌握后,从重码量的角度来说,小鹤更能精准定位到字。作为辅助码来使用,自然码在不学习的情况下占优,小鹤在学会后的情况下占优。

2.拓展性

自然码因为重码过高,因此目前的使用范围基本局限于各种拼音输入法里起辅助提速作用,由于精准度不高,仅满足不翻页找字的要求。

小鹤因为本身从设计的开始目标就是音形码,所以在易学性的基础上要考虑重码的合理范围,要达到的目标不是翻页不翻页的问题,而是基本能首选的问题。

目前输入方式主要是五笔四码类方案字词输入方式和拼音两码智能输入方式(全拼用码虽多,依然只是两步检索能力等同两码方案),小鹤皆能各得其所,游刃有余。

回复

使用道具 举报

发表于 2017-9-30 17:13:49 | 显示全部楼层
其实很多自然码用户需要可以媲美现有自然码的64bit版本,可惜现在还没有发现。
回复 支持 反对

使用道具 举报

发表于 2021-9-3 10:49:28 | 显示全部楼层
自然码重码2900余字,小鹤重码800余字
请问这个数据有没有考虑到辅助码字库数量的多少?这个对比乍一看很惊人,但据我所知,小鹤的辅助码包含的汉字只有《通用规范汉字表》中的8000多个汉字,而自然码的辅助码包含的汉字约21000个,这样看也就合理了不少,小鹤辅助码更复杂的规则会减少重码是毋庸置疑的,但效果不会如此显著,新的规则不止会去除一些重码,也会带来新的重码,小鹤辅助码聪明在把焦点放在常用的8000多字上,这样做有利有弊,当然对于平常聊天来说是利大于弊的。
假设自然码辅助码同样是8000字,那平均下来这套方案的重码数量约为1100个字,不至于像文中所说的数据2900余字对比800余字那样三倍有余。这两套方案各有优势,自然码规则简单,相应的重码率稍高;小鹤规则复杂,相应的重码率有所降低。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-3 11:20:17 | 显示全部楼层
积分兑换我 发表于 2021-9-3 10:49
自然码重码2900余字,小鹤重码800余字
请问这个数据有没有考虑到辅助码字库数量的多少?这个对比乍一看很惊 ...

你难道不看GB2312字集6763字这个范围的对比?
回复 支持 反对

使用道具 举报

发表于 2021-9-6 11:29:22 | 显示全部楼层
我感觉我可能学不来音形,看不懂怎么拆字根,不理解,一会儿又取大,一会儿又取小。规则上说,谁大取谁,可有时候偏偏取的是小字。
比如巫字,本来说的是拆隔不取,可偏偏取的是工。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-6 11:35:44 | 显示全部楼层
lijinuestc 发表于 2021-9-6 11:29
我感觉我可能学不来音形,看不懂怎么拆字根,不理解,一会儿又取大,一会儿又取小。规则上说,谁大取谁,可 ...

请举例,哪个一会取大一会取小?

巫 的工被谁隔离?
另外请另开帖提问题。
回复 支持 反对

使用道具 举报

发表于 2021-9-6 16:42:25 | 显示全部楼层
问题已经解决。
我之前理解错了,我以为汉字里的偏旁部首都可以做为字根,实际上并不是 ,只有特定的部首才可以。
比如麓,其中鹿是一个偏旁部首,而在小鹤音形里,不做为字根,所以取匕,而不取鹿。
回复 支持 反对

使用道具 举报

发表于 2021-10-6 22:31:50 | 显示全部楼层
我是自然码转小鹤,感觉自然码的辅助码并不是很好理解,学了自然码的辅助码转小鹤音形发现完全无压力,特别是取首末两笔的规则,比自然码好多了。我转小鹤只是适应了一下键位的布局,拆字方面基本没什么困难
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|小鹤双拼

GMT+8, 2021-10-26 07:09 , Processed in 0.216806 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表