数据层次是表达数据的一种重要关系,在数据库的设计中,如:组织结构分解、工作任务分解、行政区划的分解等都是层次关系数据的典型实例。
表达层次关系的数据一般需要实现如下属性:
1.层次的最大级联层次数。如:中国->湖南省->长沙市->雨花区,就是4层。
2.能反映同一层次之间的顺序关系。如:长沙市 必须在 衡阳市的前面,(因为其是省会)。
3.能获取任意层次的父节点级子节点(子节点集)。
4.直接获取任意层次的数据。比如:第三层 市级别的数据。
5.能方便构造层次关系表达树。
6.层次结构及排序方式的改变不影响其其他数据的内部逻辑关系。
一般有三种方式来表现层次关系的数据:
1.建立多个数据库表:
如: COUNTRY: ID(主键) COUNTRY_NAME
PROVINCE: ID(主键) COUNTRY_ID(外键),PROVINCE_NAME
CITY: ID(主键), PROVINCE_ID(外键),CITY_NAME
此种方式比较简单,但设计的灵活性不够,数据处理起来比较麻烦。
2.采用表的自关联外键引用
如: DISTRICT_INFO: ID(主键),PARENT_ID,(外键)DISTRICT_INFO
通过外键(PARENT_ID)的自身引用主键(ID)来确立层次关系。
优点:无限级别的层次关系,扩充性强。对于Oracle数据库来说,能简单通过 Start With,,,Connect By--语句来实现数据的查询。
缺点:不能明确看出层次关系,无法实现排序。
3.采用编码方式来实现层次
DISTRICT: ID,CODE,NAME 其中CODE的特点是上级编码是下级编码的前缀
优点:通过编码的内容能够很容易回去数据的层次关系。
缺点:使用Like方法或函数查询来实现子集的查找,效率较低,能实现层次关系的级数有限(受CODE的字段长度影响)。
优化方案:
集合2,3的优点,采用固定编码级次的长度的方法来设计表。
DISTRICT:ID,CODE,PARENT_ID,NAME
其中ID为主键,CODE:规定为4位一级。表现的数据如下:
ID,CODEPARENT_ID, NAME1 0001 中国2 000100011 湖南3 000100010001 2 衡阳4 000100010002 2 长沙5 0001000100020001 4雨花
从数据中可以看出,PARENT_ID可以直观表达层次的上下级关系
而编码CODE可以直观表达层次关系与同一层次的顺序关系。
如果要将长沙排在衡阳的前面,需要对调其编码即可,而外部的引用关系由于通过ID实现,不会受其影响。
获取节点的父级别节点:
Select * From DISTRICT Where ID=(Select PARENT_ID From DISTRICT Where ID=2)
获取节点的子级别节点列表:
Select * From DISTRICT Where PARENT_ID=2
获取所有的子节点信息:
Select level, * From DISTRICT d Start With PARENT_ID=2 Connect By d.PARENT_ID=Prior t.ID
或 --排序模式
Select * From DISTRICT d Where d.CODE Like '00010001%' Order By CODE
获取某一层次(N)的节点信息(实现排序,层次码长度固定的意义):
Select * From DISTRICT Where LENGTH(CODE)=4*N And CODE Like '0001%' Order By CODE......