基于Geotools的Worldpop世界人口tif解析-以中国2020年数据为例

news2025/5/31 20:50:11

目录

前言

一、Worldpop数据简介

1、数据来源

2、QGIS数据展示

3、元数据展示

二、GeoTools人口解析

1、Maven依赖引入

2、Tif人口计算

三、总结


前言

        在当今数字化与信息化飞速发展的时代,地理空间数据的分析与应用已然成为诸多领域研究与决策的关键支撑。人口数据作为地理空间信息中的核心要素之一,对于城市规划、资源分配、公共卫生政策制定以及社会经济发展等众多方面都有着不可替代的重要价值。Worldpop 作为全球高分辨率人口分布数据的权威发布平台,其提供的 tif 格式人口数据具有极高的精度和权威性,为研究人员和相关从业者深入探究人口分布规律及其与环境、社会等要素的相互关系提供了宝贵的数据资源。以中国 2020 年的人口数据为例,这一年的数据不仅反映了我国在特定历史时期的人口分布状况,还蕴含着丰富的人口迁移、城镇化进程以及区域发展差异等重要信息。Geotools 作为一个功能强大的开源地理工具库,在地理空间数据处理与分析方面展现出了卓越的能力。通过运用 Geotools 对 Worldpop 的中国 2020 年 tif 格式人口数据进行解析,我们能够深入挖掘数据背后的深层次信息,实现数据的高效读取、可视化展示以及与其他地理空间数据的融合分析。

        本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。

一、Worldpop数据简介

        本节将对Worldpop数据进行简单介绍,分别从数据来源、在Qgis上进行数据展示和tif数据的元数据展示。

1、数据来源

        “Worldpop”是数据的提供方,Worldpop项目由英国萨塞克斯大学、美国约翰斯·霍普金斯大学以及多个国际合作伙伴共同运行,致力于提供全球人口分布的精细化数据。其数据广泛应用于公共卫生、灾害响应、发展规划等多个领域。 Worldpop数据集包含了2000年至2020年这21年间,中国各区域的人口密度信息。这些数据是以公里为单位的网格形式呈现,便于进行地理空间分析和研究。数据来源于Worldpop,这是一个全球人口分布和流动性的研究项目,提供高质量、高分辨率的全球人口分布数据。 在这个案例中,这些人口密度数据可以通过GIS软件进行加载和分析,以可视化和理解中国各地人口分布的时空变化。 压缩包子文件的文件名称列表中,以“chn_ppp_”开头的文件是与中国的(chn)人口密度(ppp)相关的数据。后缀为“.tif”的文件是地理信息系统常用的栅格数据格式——TIFF(Tagged Image File Format)图像文件,通常用于存储地理空间数据。文件名中的年份(如2012、2013等)代表了相应年份的数据,而“_Aggregated.tif”表示这些数据已经进行了聚合处理,即在一定区域内统计了人口总数,而不是单个个体的数据。".ovr"文件是TIFF图像的元数据或覆盖文件,它包含关于主TIFF文件的额外信息,有助于GIS软件快速访问和显示数据。

        这些数据可以用来进行以下几种分析:

1. **人口增长分析**:通过比较不同年份的数据,可以分析中国各地区人口增长的速度和趋势。 2. **城市化进程研究**:可以揭示城市化区域的人口密度变化,了解城市扩张的模式。 3. **资源分配规划**:政府和决策者可以依据人口密度来优化基础设施建设、公共服务提供以及资源配置。 4. **公共卫生评估**:研究人口密集地区的疾病传播风险,指导防疫措施的实施。 5. **环境影响评估**:分析人口分布对环境压力的影响,为环境保护提供依据。 这个数据集提供了丰富的信息,对于了解和研究中国人口分布的历史变迁以及与之相关的各种议题具有重要价值。

2、QGIS数据展示

        为了比较直观的展示这份人口数据,我们使用QGIS来对人口数据进行展示。将tif数据拖入展示窗口中,对tif数据进行标注,人口数据属于单波段数据。因此这里我们选择单波段伪彩色的模式进行渲染,为了将数值区分有所明显,使用渐变的颜色。具体标绘设置如下:

        为了体现各人口单元数据的差异, 根据千米网格的人口数,这里我们采用分成15类来进行数据展示。

3、元数据展示

        这里我们对这份2020年的中国区人口tif数据的元数据进行展示。在Qgis中打开信息页,可以看到tif数据的元数据信息,如下表所示:

序号参数
1名称chn_ppp_2020_1km_Aggregated
2空间参考EPSG:4326 - WGS 84 - 地理的
3范围73.5570830472731529,16.0329167867305387 : 134.7737494690731523,53.5662499699305386
4单位
5宽度7346
6高度4504
7数据类型Float32 - 32位浮点型
8波段1STATISTICS_MAXIMUM=286414.71875
STATISTICS_MEAN=105.89345258548
STATISTICS_MINIMUM=0
STATISTICS_STDDEV=738.60967183839
9起点73.5571,53.5662

        同时在tif中,定义了没有值的nodata的值为-9999,如下图所示:

二、GeoTools人口解析

        本节将详细介绍在Geotools中如何读取GeoTiff,同时对人口值进行准确计算。

1、Maven依赖引入

        在Geotools中解析GeoTiff的maven依赖添加如下:

<!--  增加epsg支持 -->
<dependency>
    <groupId>org.geotools</groupId>
    <artifactId>gt-epsg-hsql</artifactId>
    <version>${geotools.version}</version>
 </dependency> 
 <!--  增加gt-geotiff支持 -->
 <dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-geotiff</artifactId>
	<version>${geotools.version}</version>
 </dependency>
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-process-raster</artifactId>
	<version>${geotools.version}</version>
</dependency>	
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-process</artifactId>
	<version>${geotools.version}</version>
</dependency>
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-coverage</artifactId>
	<version>${geotools.version}</version>
</dependency>

2、Tif人口计算

        使用Geotools解析tif数据的步骤如下:

        第一步、使用Geotools读取tif文件,并设置重采样,关键代码如下:

File file = new File("F:/vector_data/worldPop人口数据/worldpop/chn_ppp_2020_1km_Aggregated.tif");
GeoTiffReader reader = new GeoTiffReader(file, new Hints(Hints.FORCE_LONGITUDE_FIRST_AXIS_ORDER, Boolean.TRUE));   
GridCoverage2D coverage = reader.read(null);
// 设置目标坐标系并重采样
CoordinateReferenceSystem targetCRS = CRS.decode("EPSG:4326");
coverage = (GridCoverage2D) Operations.DEFAULT.resample(coverage, targetCRS);

        第二步、获取栅格数据并批量读取像素值,同时通过循环计算非零像素的坐标 ,关键代码如下:

// 获取栅格数据并批量读取像素值
Raster raster = image.getData();
int width = raster.getWidth();
int height = raster.getHeight();
System.out.println(width + "\t" + height);   
double[] pixels = raster.getSamples(raster.getMinX(), raster.getMinY(), width, height, 0, (double[]) null);
// 收集非零像素的坐标
List<GridCoordinates2D> nonZeroCoords = new ArrayList<>();
for (int j = 0; j < height; j++) {
	  for (int i = 0; i < width; i++) {
	      if (pixels[j * width + i] > 0) {
	          nonZeroCoords.add(new GridCoordinates2D(i, j));
	      }
	  }
}

        第三步、从收集的非零数据集合中读取指定像素人口值,代码如下:

// 获取仿射变换以手动计算坐标
MathTransform2D gridToCRS =  geometry.getGridToCRS2D();
if (!(gridToCRS instanceof AffineTransform2D)) {
	throw new RuntimeException("仅支持仿射变换");
}
AffineTransform2D affine = (AffineTransform2D) gridToCRS;  
BigDecimal total = new BigDecimal("0.0");
double t = 0;
// 处理非零像素
for (GridCoordinates2D coord : nonZeroCoords) {
	int i = coord.x;
	int j = coord.y;
	double[] src = new double[]{i + 0.5, j + 0.5}; // 像素中心坐标
	double[] dest = new double[2];
	affine.transform(src, 0, dest, 0, 1);
	double longitude = dest[0];
	double latitude = dest[1];
	/*System.out.printf("像素点 (%d, %d) 的值:%f 坐标为: %f, %f%n",
	       i, j, pixels[j * width + i], longitude, latitude);*/
	total = total.add(new BigDecimal(pixels[j * width + i]));
	t +=  pixels[j * width + i];
}
System.out.println("总人数===>" + total);
System.out.println("总人数2===>" + t);

         第四步、获取计算结果。经过以上的三步,就可以实现对指定的tif栅格人口数据进行汇总,在控制台中可以看到以下输出:

五月 26, 2025 10:03:54 下午 org.geotools.image.ImageWorker <clinit>
信息: Warp/affine reduction enabled: true
7346	4504
总人数===>1444326122.211248342038743430748581886291503906250
总人数2===>1.4443261222112093E9

        在控制台中输出的7346和4504表示的是tif图像的宽和高。下面两个是分别使用BigDecimal和double两种数据来接收的值,可以很明显的看到,两个计算的结果是一样的,double的计算结果是科学计数法。通过计算结果可以看到,我国2020年的总人口数大约是:14.4亿左右。基本上与我国的人口规模是一致的。

三、总结

        以上就是本文的主要内容,本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。

        本文首先对WorldPop数据进行介绍,然后使用qgis来进行数据的标注展示,通过数据源的介绍让大家对基础数据有了一个更详细的了解。最后通过Java代码,使用geotools组件实现对geotiff文件的读取,通过像素值的计算实现区域范围内的人口总数计算。行文仓促,定有不足之处,欢迎各位朋友在评论区批评指正,不胜感激。篇幅有限,代码不能全部展示,更详尽的参考代码可参考以下链接:Geotools28.2读取WorldPop人口实例。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2391773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity3D仿星露谷物语开发55之保存游戏到文件

1、目标 将游戏保存到文件&#xff0c;并从文件中加载游戏。 Player在游戏中种植的Crop&#xff0c;我们希望保存到文件中&#xff0c;当游戏重新加载时Crop的GridProperty数据仍然存在。这次主要实现保存地面属性&#xff08;GridProperties&#xff09;信息。 我们要做的是…

【无标题】C++23新特性:支持打印volatile指针

文章目录 前言背景与问题C23的解决方案实现原理使用场景硬件开发多线程调试 总结 前言 在C开发中&#xff0c;volatile关键字常用于修饰变量&#xff0c;以确保编译器不会对这些变量进行优化&#xff0c;从而保证程序能够正确地与硬件交互或处理多线程环境下的特殊变量。然而&…

【第4章 图像与视频】4.2 图像的缩放

文章目录 前言示例-图像的缩放在 Canvas 边界之外绘制图像 前言 在上节中读者已经学会了如何使用 drawImage() 方法将一幅未经缩放的图像绘制到 canvas 之中。现在我们就来看看如何用该方法在绘制图像的时候进行缩放 示例-图像的缩放 未缩放的图像&#xff0c;显示图形原有大…

敏捷开发中如何避免迭代失控

在敏捷开发过程中避免迭代失控&#xff0c;需要实施合理规划迭代目标、明确职责分工、强化沟通机制、严格控制需求变更等措施&#xff0c;其中合理规划迭代目标尤为重要&#xff0c;它确保团队聚焦于关键任务&#xff0c;避免因目标不清晰而导致的迭代混乱和失控。 一、合理规划…

Python开发AI智能体(九)———构建RAG对话应用

前言 上篇文章我们介绍了如何在Langchain中构建代理 这篇文章我们将带领大家构建一个RAG对话应用 一、什么是RAG对话应用&#xff1f; RAG&#xff08;Retrieval-Augmented Generation&#xff0c;检索增强生成&#xff09;技术通过从外部知识库检索相关信息&#xff0c;并将…

NW907NW918美光固态闪存NW920NW930

NW907NW918美光固态闪存NW920NW930 技术解析&#xff1a;美光NW系列固态闪存的核心突破 美光NW907、NW918、NW920、NW930四款固态闪存产品&#xff0c;代表了当前存储技术的顶尖水平。其核心创新在于G9 NAND架构的深度优化&#xff0c;采用更先进的5纳米制程工艺&#xff0c;…

【Deepseek 学网络互联】跨节点通信global 和节点内通信CLAN保序

Clan模式下的源端保序与Global类似&#xff0c;目的端保序则退化成通道保序&#xff0c;此时仅支持网络单路径保序。”这里的通道保序怎么理解&#xff1f; 用户可能正在阅读某种硬件架构文档&#xff08;比如NVIDIA的NVLink或InfiniBand规范&#xff09;&#xff0c;因为"…

9.5 Q1 | 北京协和医学院GBD发文 | 1990-2021 年全球、区域和国家心力衰竭负担及其根本原因

1.第一段-文章基本信息 文章题目&#xff1a;Global, regional, and national burden of heart failure and its underlying causes, 1990-2021: results from the global burden of disease study 2021 中文标题&#xff1a;1990-2021 年全球、区域和国家心力衰竭负担及其根本…

根据Cortex-M3(包括STM32F1)权威指南讲解MCU内存架构与如何查看编译器生成的地址具体位置

首先我们先查看官方对于Cortex-M3预定义的存储器映射 1.存储器映射 1.1 Cortex-M3架构的存储器结构 内部私有外设总线&#xff1a;即AHB总线&#xff0c;包括NVIC中断&#xff0c;ITM硬件调试&#xff0c;FPB, DWT。 外部私有外设总线&#xff1a;即APB总线&#xff0c;用于…

MCP入门实战(极简案例)

MCP简介 MCP(Model Context Protocol,模型上下文协议)2024年11月底由 Antbropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。 Function Calling是AI模型调用函数的机制,MCP是一个标准协议,使AI模型与API无缝交互,而Al Agent是一个…

Cursor从入门到精通实战指南(一):开始使用Cursor

一、简介与核心优势 Cursor是一款基于VSCode开发的AI编程工具&#xff0c;集成了GPT-4、Claude 3.5等先进大语言模型&#xff0c;支持代码补全、生成、重构、调试等功能。其核心优势包括&#xff1a; 高效协作&#xff1a;通过自然语言对话实现代码开发&#xff0c;支持跨文件…

计算机组成原理——cache

3.4cache 出自up主Beokayy传送门 1.局部性原理 时间局部性&#xff1a; 在最近的未来要用到的信息&#xff0c;很可能是现在正在使用的信息&#xff0c;因为程序中存在循环。 空间局部性&#xff1a; 在最近的未来要用到的信息&#xff0c;很可能与现在正在使用的信息在存储…

EasyExcel使用导出模版后设置 CellStyle失效问题解决

EasyExcel使用导出模版后在CellWriteHandler的afterCellDispose方法设置 CellStyle失效问题解决方法 问题描述&#xff1a;excel 模版塞入数据后&#xff0c;需要设置单元格的个性化设置时失效&#xff0c;本文以设置数据格式为例&#xff08;设置列的数据展示时需要加上千分位…

Knife4j框架的使用

文章目录 引入依赖配置Knife4j使用Knife4j 访问 SpringBoot 生成的文档 Knife4j 是基于 Swagger 的增强工具&#xff0c;对 Swagger 进行了拓展和优化&#xff0c;从而有更美观的界面设计和更强的功能 引入依赖 Spring Boot 2.7.18 版本 <dependency> <groupId>c…

深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用

近日&#xff0c;深兰科技创始人、董事长陈海波受邀率队赴南京市&#xff0c;先后考察了南京江宁滨江经济开发区与鼓楼区&#xff0c;就推进深兰AI医诊大模型在南京的落地应用&#xff0c;与当地政府及相关部门进行了深入交流与合作探讨。 此次考察聚焦于深兰科技自主研发的AI医…

【芯片设计中的交通网络革命:Crossbar与NoC架构的博弈C架构的博弈】

在芯片设计领域&#xff0c;总线架构如同城市交通网&#xff0c;决定了数据流的通行效率。随着AI芯片、车载芯片等复杂场景的爆发式增长&#xff0c;传统总线架构正面临前所未有的挑战。本文将深入解析两大主流互连架构——Crossbar与NoC的优劣&#xff0c;揭示芯片"交通网…

deepseek告诉您http与https有何区别?

有用户经常问什么是Http , 什么是Https &#xff1f; 两者有什么区别&#xff0c;下面为大家介绍一下两者的区别 一、什么是HTTP HTTP是一种无状态的应用层协议&#xff0c;用于在客户端浏览器和服务器之间传输网页信息&#xff0c;默认使用80端口 二、HTTP协议的特点 HTTP协议…

mac将自己网络暴露到公网

安装服务 brew tap probezy/core && brew install cpolar// 安装cpolar sudo cpolar service install // 启动服务 sudo cpolar service start访问管理网站 http://127.0.0.1:9200/#/tunnels/list 菜单“隧道列表” 》 编辑 自定义暴露的端口 再到在线列表中查看公网…

拓扑排序算法剖析与py/cpp/Java语言实现

拓扑排序算法深度剖析与py/cpp/Java语言实现 一、拓扑排序算法的基本概念1.1 有向无环图&#xff08;DAG&#xff09;1.2 拓扑排序的定义1.3 拓扑排序的性质 二、拓扑排序算法的原理与流程2.1 核心原理2.2 算法流程 三、拓扑排序算法的代码实现3.1 Python实现3.2 C实现3.3 Java…

罗马-华为

SPA应用:single-page application:单页应用SPA是一种网络应用程序或网站的模型,它通过动态重写当前页面来与用户交互,这种方法避免了页面之间切换打断用户体验在单页应用中 集成 ROMA Connect 主要包含四个组件:数据集成( FDI )、服务集成( APIC )、消息集成 ( MQS …