别再只盯着大模型了!手把手教你用Python+卫星数据做农业产量预测(附代码)
用Python和卫星数据构建农业产量预测模型从数据获取到结果可视化全流程指南当我们在谈论智慧农业时往往容易陷入对大模型的盲目崇拜。但实际上一套简单实用的数据科学流程配合公开免费的卫星遥感数据就能为中小农场主和农业创业者提供切实可行的产量预测方案。本文将带你用Python生态中的geopandas、rasterio等工具从零开始构建一个基于卫星数据的农作物产量预测系统。1. 卫星数据源的选择与获取在开始建模之前我们需要了解有哪些可用的卫星数据资源。目前最常用的免费卫星数据来源包括Landsat系列由NASA和USGS共同运营提供30米分辨率的多光谱数据覆盖全球时间跨度从1972年至今Sentinel-2欧空局(ESA)的卫星项目提供10-60米分辨率数据重访周期5天MODIS提供250-1000米分辨率数据适合大区域监测这些数据都可以通过各自的API或平台免费获取。以Sentinel-2为例我们可以使用Python的sentinelsat库来查询和下载数据from sentinelsat import SentinelAPI # 连接到Copernicus Open Access Hub api SentinelAPI(your_username, your_password, https://scihub.copernicus.eu/dhus) # 定义查询参数 products api.query( areaPOLYGON((...)), # 你的研究区域WKT格式 date(20230101, 20231231), platformnameSentinel-2, cloudcoverpercentage(0, 10) # 云量小于10% ) # 下载数据 api.download_all(products)提示在实际应用中建议先下载小区域样本数据测试流程再扩展到大规模数据下载以避免带宽和时间浪费。2. 遥感数据预处理流程原始卫星数据通常需要经过一系列预处理才能用于分析。主要步骤包括辐射校正将数字数值(DN)转换为地表反射率大气校正消除大气散射和吸收的影响云掩膜识别并去除云覆盖区域影像配准确保不同时相的影像精确对齐裁剪只保留研究区域的数据我们可以使用rasterio和gdal库来完成这些预处理工作。以下是一个简单的云掩膜和裁剪示例import rasterio from rasterio.mask import mask import geopandas as gpd # 加载影像和矢量边界 with rasterio.open(sentinel2_image.tif) as src: image src.read() profile src.profile boundary gpd.read_file(field_boundary.shp) # 应用云掩膜 (假设有云掩膜文件) with rasterio.open(cloud_mask.tif) as mask_src: cloud_mask mask_src.read(1) image[:, cloud_mask 1] np.nan # 将云像素设为NaN # 裁剪到研究区域 out_image, out_transform mask(src, boundary.geometry, cropTrue) profile.update({ height: out_image.shape[1], width: out_image.shape[2], transform: out_transform }) with rasterio.open(cropped_image.tif, w, **profile) as dst: dst.write(out_image)3. 植被指数计算与特征工程植被指数是将卫星数据转化为有用农业信息的关键步骤。最常用的指数包括指数名称计算公式应用场景NDVI (归一化差值植被指数)(NIR-Red)/(NIRRed)植被健康度评估EVI (增强型植被指数)2.5*(NIR-Red)/(NIR6Red-7.5Blue1)高生物量区域NDWI (归一化差值水分指数)(NIR-SWIR)/(NIRSWIR)植被水分含量计算NDVI的Python代码示例import numpy as np def calculate_ndvi(red_band, nir_band): 计算NDVI植被指数 red red_band.astype(np.float32) nir nir_band.astype(np.float32) ndvi (nir - red) / (nir red 1e-10) # 避免除以零 return ndvi # 假设波段3是红波段波段8是近红外波段 red out_image[2, :, :] # 注意波段索引从0开始 nir out_image[7, :, :] ndvi calculate_ndvi(red, nir)除了这些标准指数外我们还可以构建时间序列特征如生长季平均NDVINDVI峰值时间生长季累积NDVI植被指数变化率这些特征能更好地反映作物生长动态提高预测模型的准确性。4. 产量预测模型构建与评估有了准备好的特征数据我们就可以构建预测模型了。这里我们使用随机森林算法因为它对非线性关系和特征交互有很好的捕捉能力且不需要复杂的参数调优。from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_absolute_error, r2_score # 假设我们已经准备好了特征矩阵X和目标变量y(产量) X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) # 初始化随机森林模型 rf RandomForestRegressor(n_estimators100, max_depth10, min_samples_split5, random_state42) # 训练模型 rf.fit(X_train, y_train) # 预测和评估 y_pred rf.predict(X_test) print(fMAE: {mean_absolute_error(y_test, y_pred):.2f}) print(fR²: {r2_score(y_test, y_pred):.2f})模型评估完成后我们可以分析特征重要性了解哪些遥感指标对产量预测贡献最大import pandas as pd # 获取特征重要性 importances rf.feature_importances_ features [NDVI_mean, EVI_peak, NDWI_trend, ...] # 你的特征名称 # 创建DataFrame并排序 feature_importance pd.DataFrame({feature: features, importance: importances}) feature_importance feature_importance.sort_values(importance, ascendingFalse) print(feature_importance)5. 结果可视化与应用最后我们可以将预测结果可视化生成直观的产量分布图。使用matplotlib和geopandas可以轻松实现这一点import matplotlib.pyplot as plt fig, ax plt.subplots(figsize(10, 10)) # 绘制产量预测结果 boundary.plot(axax, colornone, edgecolorblack) prediction_plot ax.imshow(y_pred_grid, cmapYlGn, vminy_pred.min(), vmaxy_pred.max()) # 添加图例和标题 cbar plt.colorbar(prediction_plot, axax) cbar.set_label(预测产量 (kg/ha)) ax.set_title(2023年玉米产量预测图) plt.tight_layout() plt.savefig(yield_prediction_map.png, dpi300) plt.close()在实际应用中这套系统可以帮助农场主识别田间产量变异区域优化灌溉和施肥策略提前预测收成做好销售计划评估不同品种或耕作方式的效果注意卫星数据的分辨率限制了模型的精度对于小地块或异质性强的农田建议结合无人机数据或地面传感器数据提高预测准确性。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2466604.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!