龙空技术网

中国土种数据库——基于第二次土壤普查的全国性土壤数据集

环资观察 346

前言:

此时姐妹们对“数据字典 样例”可能比较讲究,朋友们都想要剖析一些“数据字典 样例”的相关文章。那么小编在网摘上搜集了一些对于“数据字典 样例””的相关文章,希望朋友们能喜欢,各位老铁们一起来了解一下吧!

中国土种数据库——基于第二次土壤普查的全国性土壤数据集施建平, 宋歌. 中国土种数据库——基于第二次土壤普查的全国性土壤数据集[J/OL]. 中国科学数据, 2016, 1(2). DOI: 10.11922/csdata.170.2015.0033.概 述

土壤是一个国家最重要的自然资源之一,它是农业发展的物质基础。受复杂的自然条件和深刻的人为因素影响,我国土壤类型千差万别、种类繁多。在土壤学中,将影响土壤形成的各种自然条件,归纳为地形、气候、成土母质、植被、成土年龄5大因素,称为成土因素。在不同的地区,各因素的具体内容和特点不同,还以不同强度相互作用从而形成各种各样的土壤。土种是由若干土壤特征相类似的一组土壤个体组成的集合体,通常选择其中心概念与边缘概念十分清晰的土壤个体为代表,作为比较土壤形状差异与划分土种的依据。

中国土种数据库的数据来源于全国第二次土壤普查汇总成果《中国土种志》 [1]。《中国土种志》在整理、选择、总结省(市、区)级有关土种资料的基础上编写而成,是迄今为止最全面的全国性的土壤数据资料,它包括2473个土种典型剖面,覆盖了上世纪80年代我国主要土种在土壤分类系统中的归属、分布、面积、主要性状、典型剖面、生产性能和理化分析数据。

土壤数据具有时间、空间属性。在时间尺度,土壤性质随着自然条件和人类活动影响而改变。在空间尺度,土壤具有水平分布特征和垂直分布特征,单个土体中的不同层次,理化性质也不同。另一方面,同植物分类一样,对不同类型土壤的定量和规范化分类描述是数据解译、模拟、对比的基础。由于全国性的土壤普查进展不同,其数据采集跨度为1978~1984年,可以不考虑时间尺度的变化。因此,中国土种数据库结构设计需同时考虑空间分布关系和分类关系。

中国土种数据库以土种为单位,提取了土种归属和分布、地形地貌、土地利用、土壤主要性状、典型剖面理化性质和统计剖面理化性质数据。其中,典型剖面土壤理化性质包括不同发生层的土壤养分(有机质、全氮、全磷、全钾、碱解氮、有效磷、速效钾、pH)、土壤物理特征(颗粒组成、质地、容重、空隙度)和土壤化学特征(交换型阳离子、阳离子交换量、有效阳离子交换量、碳酸钙)等28个参数。参考国外相关土壤数据库关系结构模型[2~3],建立地点与土种水平分布关系,2473个土种分布在全国除台湾省外30个省1642个县;建立土种与发生层间垂直分布关系,2473个土种典型剖面具有8751个发生层数据,平均每个剖面约3.5个发生层;按照中国土壤发生分类(GB17296),建立土类、亚类、土种的分类关系。依据建立的实体关系模型,用户可按地点和土壤分类进行查询检索。该数据库可用于土地退化评估、环境影响研究、土壤碳储量研究,或作为土壤基础数据指导农业生产。

1 数据采集和处理方法

1.1 土种的划分

土种是土壤发生分类系统中的基层分类单元,是土壤分类的基础。它是出于相同或相似景观部位,及其类似的水热条件,具有相对一致的土壤剖面形态特征和理化生物性质相似的一群土壤实体。土种划分应遵循以发生学理论为基础、以土壤属性为依据的总原则:

1. 以整个土体相对稳定的属性为依据,同一土种的属性、量级指标相同,土种间的性状指标具有量级差异;

2. 土种为一生态样块。具有一定的微域景观条件,近似的水热条件,相同的母质以及相同的植被与利用方式;

3. 同一土种的剖面发生层或其他土层的层序排列及厚度是相似的;

4. 同一土种的土壤特征、土层的发育程度相同;

5. 同一土种的生产性能及生产潜力相似。

1.2 内容的规范化

《中国土种志》是全国第二次土壤普查系列成果之一,它是在整理、选择、总结省(市、区)级有关土种资料基础上编写而成的。全书以大区为单位,共分六卷,分别介绍了各大区主要土种在土壤发生分类系统中的归属、分布、面积、主要性状、典型剖面、生产性能和理化分析数据。其中规范化内容如下:

1. 土种命名:各省土种命名,方法很不一致,有些省采用群众习用名称,也有些省采用以土类为中心的连续命名法。中国土种志采用单名法。为了区别同土异名或异土同名,在土种名称前加一个地名,作为土种名,如祁山橙泥土。我国有些地方在水稻土的名字后面加一个田字,则仍然保留,如潮砂泥田、泥肉田、白粉田等。

2. 土种归属:对于山地薄层土壤,没有B层发育的,归属于石质土或粗骨土;B层发育不好的,归属于相应土类的XX性土。南方在网纹红土层上耕种的土壤,是受冲刷的土壤,仍然归属于红壤土类,而西北与东北地区耕种的红粘土,都归属于红粘土亚类。我国南方石灰岩发育的A-C型土,分属于不同的石灰岩土,而北方石灰岩发育的土壤,则归属于相应的自成型土。根据铁的晶胶率,把水稻土归属于不同的亚类。

3. 土层符号:各省(市、区)土种志中土层符号的应用是比较混乱的,参照有关文献,对土层符号作出规定,见表1。

表1 土层符号的规定

4. 主要性状:土种的主要性状,描述发生性状与养分状况两部分。每个土种都描述特定的剖面发生层构型,如棕壤类的土种为A-B-C构型,黑垆土类的土种为A-Ah-B-C型,渗育性水稻土为Aa-Ap-P-C构型。各土种的养分状况,如有机质、氮、磷、钾及微量元素样品测定数据,则进行耕层养分的统计性描述。

5. 典型剖面描述:土种的典型剖面体现该土种的中心概念,记录了剖面的采样地点、地形部位、海拔高度、母质或母土、植被、利用方式和气象指标等生境条件,规范化描述了剖面形态特征,并用门塞尔标准比色卡校正土壤颜色。根据室内分析结果,按国际制粒级含量,订正质地名称。

6. 每个土种都列出典型剖面理化性质表和统计剖面理化性质表。少部分土种只有典型剖面的理化分析表,因为它们具有一定的代表性,反映这些土种的中心概念,予以保留。

1.3 分析方法

根据农业部颁发的全国第二次土壤普查技术要点(草案)[4~5],土壤养分常规分析见表2。

表2 土壤养分常规分析方法

2 数据结构和样本2.1 数据库结构

参照国内外有关土壤资源数据库的关系结构[6~9],建成一个具有空间分布关系和分类层次关系的关系型数据库,可以根据地点和土壤发生分类进行查询检索。数据存储和查询网址:、(中国土种数据库1.0)。

数据库由5部分组成:

1. 土种基本信息表SOIL_TYPE。包括土种ID、土种名称、一般性描述、母质、剖面构型、主要特征、生产性能等。除此之外,为了与土壤分类信息连接,还收录了对应的土类ID、亚类ID。

2. 典型剖面景观信息表PROFILE_LANDSCAPE。一个土种有一个典型剖面,典型剖面景观表通过土种ID与土种信息表关联。该表收录典型剖面的采集地点、地形地貌、高程、母质、年均温和年降水、自然植被、土地利用等。

3. 典型剖面理化性质表VALUM 1和统计剖面理化性质表VALUM_Stat。一个土种的垂直剖面有多个不同深度的发生层,每个发生层有不同的理化性质。土种与发生层是一对多的垂直分布关系。剖面理化性质表记录了土壤养分全量、速效养分、物理特性、交换性能等。典型剖面理化性质表和统计剖面理化性质表均通过土种ID与土种信息表关联。

4. 描述水平分布信息的3张表格:省名表LOCATION_NAME、 县市名表sublocation及地点土种关系表LOCATION_USAGE。一个省有多个县市,省名表与县市名表是一对多关系。一个县市可能有多个土种,一个土种分布于多个县市。县市名与土种之间是多对多关系,用地点土种关系表LOCATION_USAGE表描述,该表包括土种ID、土种名称、县市代码、县市ID、县市名等字段。

5. 描述中国土壤发生分类与土壤类型关系的土壤分类信息的表格:土类表SOIL_GROUP(土类名、土类英文名、土纲名、土纲英文名、土类描述等)和亚类表SOIL_SUBGROUP(亚类名、亚类英文名)。一个土类有多个亚类,土类与亚类是一对多的关系。一个亚类有多个土种,亚类与土种也是一对多的关系。通过土类ID、亚类ID关联土类、亚类和土种基本信息三张表,形成了土壤分类的层次关系。查询时可按照规范化的土类名称、亚类名称和土种名称的依次查询。

为了用户使用方便,生成按地点查询土种和按土壤分类查询土种的数据快照,便于快速查询。

2.2 数据样本

中国土种数据库的数据量庞大,为了说明数据集的具体特征,以按地点查询和按土壤分类查询为例,列出福建省漳州市赤红壤土类泥赤土土种数据集的典型样本,以便使用者溯源定位、理解数据集内涵。

例如,福建省漳州(县市名ID为1)分布有泥赤土、赤粘土、黄赤土、霞潭赤粘土和青底灰泥田5个土种(土种ID分别为10003、10005、10007、10009、10503)。在地点与土种关系表格中分别填写县市名ID和土种ID,建立一个县市名与不同土种间分布关系(图1,表3)。同样,泥赤土(土种ID为10003)分布于漳州(县市名ID为1)、泉州(县市名ID为2)和华安(县市名ID为23),这需要在地点土种关系表格中分别填写土种ID和县市名ID,建立一个土种分布于不同地点的分布关系。

图1 地点-土种关系样例

表3 福建漳州查询结果

若选择赤红壤亚类泥赤土土种,可查询该土种的详细信息;通过土种ID的关联,查询典型剖面景观(表4)、典型剖面理化性质(表5)。

表4 典型剖面景观

一个土种的典型剖面有多个发生层,每个发生层有不同的深度、不同的理化性质。土种与发生层及发生层理化性质是一对多的关系。泥赤土的典型剖面理化性质如表5。

表5 泥赤土典型剖面主要理化性质

再如,按照中国土壤发生分类查询土种信息,一个土类有多个亚类,一个亚类有多个土种,土类表、亚类表和土种基本信息表样例见图2。由此,可按土类亚类土种方式查询检索。选择赤红壤,亚类为典型赤红壤,并选择土种名为泥赤土,查询该土种的性质。查询结果见表6。

图2 土类-土种关系样例

表6 按中国土壤发生分类查询结果

典型剖面景观同表4,典型剖面理化性质同表5。统计剖面理化性质表是多个剖面样本理化性质的统计值,与典型剖面理化性质表数据基本相同

3 数据质量控制措施3.1 数据质量保证

数据库的建设由南京土壤所于2010年完成,数据完整性和一致性经人工抽查基本无误。2011~2013年对县市名进行了修正。建立了数据库设计文档,具备数据字典和关系结构图等完整的文档资料。

每年根据用户使用意见,检查数据库内容,修正错误,建立土种数据库维护日志。

3.2 数据质量控制具体措施

1. 法定计量单位转换

典型剖面理化性质表和统计剖面理化性质表中有机质、全氮、全磷、全钾原始数据单位为%,数据录入检查无误后,原始数据字段保留。同时按照法定计量单位增添新的数据字段,单位更新为g/kg。

土壤颗粒组成按国际制分级,单位为%;土壤容重单位为g/cm3;阳离子交换量和交换性阳离子单位均统一为cmol/kg(+)。上述单位均为法定计量单位。

2. 采样的深度表示

原始数据发生层深度用相对厚度表示(如20 cm),使用者不易区分其绝对深度或深度范围。参照ISO 28258,在数据录入检查无误后,增添发生层最上深度和发生层最下深度(如0 cm,20 cm)两个字段,分别计算录入。

3. 土壤分类的规范化

已有数据资源中土壤分类名称的规范化,是土壤学科领域数据整合的重要内容之一。参照GB/T 17296-2009中国土壤分类与代码,对土类、亚类的命名进行规范。GB/T17296 对与土类命名相同、且亚类中包括不止一种亚类的原亚类名称,均加“典型”两字,以示与土类命名的区别。例如,原土类为“红壤”,亚类也为“红壤”的亚类名称,改为“典型红壤”。这类亚类名称的更改有41处,数据库在亚类表SOIL_SUBGROUP中增添了“国标亚类名”字段,老亚类名继续保留,以便与历史资料对应。土壤分类和归属按照历史资料分类暂时不变。

在元数据中标识数据资源的土壤类型名称及其在中国土壤分类系统(GSCC)、中国土壤系统分类(CST)之间的参比信息。

4. 行政地点的规范化和更新

上世纪80年代以后,行政地点名称和归属有较大变化。例如,原上海川沙县,现已归属为浦东新区。重庆市为1997年成立,现在重庆市具有土壤普查资料的区县,历史上归属于四川省。更新了38个县市的名称,并增添字段保留原始名称;同时更新了8个县的归属。此外,为了查询方便,增添与土种分布相关的省、市、县行政区划代码(GB/T 2260-2007)和市、县近似经纬度。

5. 数据类型约定

数据的基本类型为文本、数字、备注等。依据原始数据,对数据精度进行了设置。由于原始数据有缺失,空值在数据传输中数字型字段易人为形成“0”,故对于数据缺失较多的字段,用文本型表示。

4 数据使用与建议

使用者在使用之前,应了解数据的适用范围、尺度和数据的分布情况。中国土种数据库的数据是在《中国土种志》的基础上构建,其原始数据没有覆盖全国所有的县市。2473个土种典型剖面分布于1642个县市(区)或地理标识区(如太行山、大兴安岭)。

首先,按水平分布(省)统计土种典型剖面数及主要性状数据分布。图3显示了土种在各省的分布。其中最多是辽宁省,159个土种;最少是北京市,11个土种。典型剖面密度最大的是上海市,36个/万平方公里;密度最小的是新疆维吾尔自治区,0.6个/万平方公里,全国平均2.6个/万平方公里。

图3 土种在各省的分布

其次,分省统计土壤养分数据的分布。中国土种数据库提供了2473个土种典型剖面8751个发生层的28个土壤养分和理化特性数据(表7)。

典型剖面不同发生层土壤养分数据包括:有机质数据8584个,全氮数据8345个,全磷数据8211个,全钾数据7023个,pH数据8624个。速效养分作为土壤普查的速测项目,甘肃、宁夏、青海、陕西、新疆西北五省具有耕层速效养分统计数据,无典型剖面不同层次的速效养分数据,河南、河北无碱解氮数据。其他省碱解氮数据总数为2330个,有效磷数据总数为3983个,速效钾数据总数为4129个。表7显示了分省统计典型剖面土壤养分数据分布的情况。

表7 按省统计典型剖面不同层次土壤养分数据的分布

再次,分省统计土壤物理性质和化学性质数据的分布。土壤颗粒组成按照国际制分级,辽宁省颗粒组成的数据最多,北京市的数据最少(图4)。根据第二次土壤普查的技术规定,不是所有土壤特征都必须测定,因此,土壤容重的测定数据较少,且分布不一(图5),西北、西南等的11个省市无容重测定数据。

图4 按省统计土壤颗粒组成

图5 按省统计土壤容重数据的分布

图6显示了按省统计的典型剖面不同层次土壤阳离子交换量数据的分布情况。阳离子交换量(CEC)数据总数为5826个,其中数据量最多为辽宁省,518个;最少为海南省,6个。

图6 按省统计阳离子交换量数据的分布

施建平, 宋歌. 中国土种数据库——基于第二次土壤普查的全国性土壤数据集[J/OL]. 中国科学数据, 2016, 1(2). DOI: 10.11922/csdata.170.2015.0033.

标签: #数据字典 样例