以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 科研生涯 』   (http://bbs.xml.org.cn/list.asp?boardid=70)
----  [原创]数据结构与汉语文章  (http://bbs.xml.org.cn/dispbbs.asp?boardid=70&rootid=&id=87160)


--  作者:nau
--  发布时间:10/14/2010 7:49:00 AM

--  [原创]数据结构与汉语文章
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。

逻辑结构形式地定义为(K,R)(或(D,S)),其中,K是数据元素的有限集,R是K上的关系的有限集。对于汉语文章,数据元素的有限集就是有限的汉字,现代汉字总数八万多,专家指出常用仅三千五。关系的有限集,在汉语中表示各类词法、语法,字与字之间的关系,词与词之间的关系,句子与句子之间的关系。

计算机的数据结构主要包括四类基本结构:
1、集合结构。该结构的数据元素间的关系是“属于同一个集合”。
2、线性结构。该结构的数据元素之间存在着一对一的关系。
3、树型结构。该结构的数据元素之间存在着一对多的关系。
4、图形结构。该结构的数据元素之间存在着多对多的关系,也称网状结构。
其中树形结构和图形结构全称为非线性结构。

常用数据结构包括数组 (Array),栈 (Stack),队列 (Queue),链表 (Linked List),树 (Tree),图 (Graph),堆 (Heap),散列表 (Hash)等。

再看看汉语的数据结构。

汉字包括三要素:形、音、义。
现代汉字笔形主要可分为横、竖(ㄧ)、撇(丿) 、点(、)捺(ㄟ)、挑、钩、折八种。
六种字形结构的规律。“六书”的名称和顺序是:一、象形;二、指事;三、会意;四、形声;五、转注;六、假借。前四种是造字的方法,后两种是用字的方法。
汉字的结构形式可分为两种:独体和合体。
汉字从古到今,先后出现过甲骨文、金文、篆书、隶书、楷书、行书等字体。楷书是现在通行的手写体和印刷体。

词是最小的能够独立运用的语言单位。短语是词和词的语法组合。
包括同音词、同义词、反义词、外来词、方言词、成语、惯用语、歇后语、谚语。
名词、动词、形容词、数词、量词、数量词、代词、副词、象声词、叹词、连词、结构助词、动态助词、语气助词。

句子的用途主要有四种:陈述句、疑问句(分四类:是非问、特指问、选择问、正反问)、祈使句、感叹句。
还包括“是”字句、“有”字句、“把”字句、“被”字句、比较句等。
联合复句中,分句与分句之间的关系常见的有递进关系、并列关系、选择关系、承接关系四种。
偏正复句中,分句与分句之间的关系常见的有转折关系、因果关系、让步关系、条件关系四种。
还有其它一些句子,如拟人、比喻、对联等。

可见计算机的数据结构比较简单,而汉语的数据结构则非常复杂,计算机语言与人类语言还有非常大的差距。可以开发一个电脑作家软件系统或者称机器人语言系统,让电脑熟练使用人类语言,能与人自由交流,能根据人的要求写文章,让电脑的智能逐步接近人脑智能。

软件养生学努力研究各类数据结构,不仅包括电脑的数据结构,而且包括人脑语言系统的数据结构,促进电脑与人脑结合,促进双方科技融合,最终目标是促进个人全面发展,促进人类社会早日进入大同世界。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
25.391ms