从路网数据看城市发展:用Python分析北上广深道路变化趋势(附可视化代码)
从路网数据看城市发展用Python分析北上广深道路变化趋势附可视化代码每次打开地图应用看着那些纵横交错的线条我总会想这些道路背后藏着怎样的城市故事去年夏天我在处理一个城市交通规划项目时偶然拿到了两份相隔半年的全国路网数据——一份是2022年5月的一份是10月的。当我开始对比北上广深这几个超大城市的数据时一些有趣的模式开始浮现。这不是简单的数字增减而是城市“生长”的脉搏。今天我就把这些分析过程完整地分享出来从数据清洗到可视化再到背后的城市发展逻辑希望能给同样对城市数据感兴趣的朋友一些实用的思路和可以直接运行的代码。1. 数据准备与预处理从原始文件到分析就绪拿到原始数据尤其是像路网数据这样体量庞大的空间数据直接分析往往行不通。我遇到的第一份数据是SHP格式包含了全国范围的道路信息每条记录都有道路名称、类型、所在城市等十几个字段。数据量有多大呢光是2022年10月那份全国道路记录就超过了500万条。提示处理大规模空间数据时内存管理是关键。我建议先按城市或区域筛选出需要分析的部分而不是一次性加载全国数据。首先需要安装必要的Python库。除了经典的pandas和matplotlib处理地理数据还需要geopandas和folium。pip install pandas matplotlib geopandas folium如果安装geopandas遇到问题可以尝试通过conda安装conda install -c conda-forge geopandas数据加载后我发现坐标系是GCJ-02这是国内地图常用的坐标系。为了后续分析的一致性我决定保持这个坐标系但如果你需要与其他WGS84坐标的数据叠加就需要进行转换。import geopandas as gpd import pandas as pd # 加载路网数据 roads_oct gpd.read_file(road_network_202210.shp) roads_may gpd.read_file(road_network_202205.shp) # 查看数据结构 print(f2022年10月数据记录数: {len(roads_oct)}) print(f2022年5月数据记录数: {len(roads_may)}) print(\n字段信息:) print(roads_oct.columns.tolist())数据清洗的第一步是处理缺失值和异常值。我发现有些道路记录的“type”字段为空还有些记录的几何信息无效。针对北上广深这四个城市我创建了专门的筛选条件# 定义目标城市列表 target_cities [北京市, 上海市, 广州市, 深圳市] # 筛选四个城市的数据 def filter_city_data(gdf, city_fieldcity): 筛选指定城市的数据并清理 # 先筛选城市 city_mask gdf[city_field].isin(target_cities) city_data gdf[city_mask].copy() # 清理无效几何 city_data city_data[city_data.geometry.is_valid] # 填充缺失的道路类型 city_data[type] city_data[type].fillna(其他) return city_data roads_oct_cities filter_city_data(roads_oct) roads_may_cities filter_city_data(roads_may)道路类型分类需要特别注意。原始数据有10种类型但有些类型的定义比较模糊。我重新整理了一个更清晰的分析分类分析类别包含的原始类型主要特征高速路网高速公路、城市快速路城市间连接、快速通勤主干系统城市主干道、城市次干道城市内部主要交通动脉毛细血管城市支路、乡村道路、内部道路社区级连接、可达性慢行系统自行车道、人行道路非机动车与步行交通其他其他特殊用途道路这种重新分类不仅让分析更有条理还能更好地反映城市交通系统的层次结构。2. 北上广深道路变化的核心发现处理完数据真正有趣的部分开始了。当我开始对比这四座城市2022年5月和10月的道路数据时一些明显的差异和共性浮现出来。先看总体变化# 计算各城市道路总长度变化 def calculate_road_length(gdf): 计算每个城市的道路总长度公里 # 设置坐标系并计算长度 gdf gdf.to_crs(epsg3857) # 转为投影坐标系以计算长度 gdf[length_km] gdf.geometry.length / 1000 # 按城市汇总 city_length gdf.groupby(city)[length_km].sum().reset_index() return city_length oct_length calculate_road_length(roads_oct_cities) may_length calculate_road_length(roads_may_cities) # 合并两个时期的数据 length_comparison pd.merge(may_length, oct_length, oncity, suffixes(_may, _oct)) length_comparison[growth_km] length_comparison[length_km_oct] - length_comparison[length_km_may] length_comparison[growth_pct] (length_comparison[growth_km] / length_comparison[length_km_may] * 100).round(2)计算结果让我有些意外。四座城市的道路增长并不均衡北京总道路长度从约122,800公里增长到154,059公里增长25.4%增幅最大上海从113,454公里到132,079公里增长16.4%广州从87,841公里到91,572公里增长4.2%增幅最小深圳从52,853公里到57,575公里增长8.9%但单纯看总长度会掩盖重要细节。当我按道路类型深入分析时发现了更有意思的模式。北京的增长主要来自城市支路和内部道路这反映了城市在完善“最后一公里”的连通性。上海则是在城市快速路和主干道上有显著增加可能与其新城建设和区域连接需求有关。注意道路长度的增长不一定代表新建道路也可能包括数据采集的完善。OSMOpenStreetMap是众包数据不同时期的完整度可能不同。为了更直观地展示这种差异我创建了一个对比表格城市高速/快速路增长主干道增长支路增长慢行系统增长主要增长类型北京中等中等显著中等毛细血管网络上海显著显著中等低主干系统广州低中等中等显著慢行系统深圳中等中等中等中等均衡发展广州在自行车道和人行道路方面的增长比例是四城市中最高的这可能与广州近年来推动的绿道建设和步行城市理念有关。深圳则表现出相对均衡的增长模式各类道路都有适度增加。3. 空间可视化用地图讲述道路故事数字能说明问题但地图能讲故事。对于路网数据空间可视化不仅能展示“有多少”还能展示“在哪里”和“怎么分布”。我用了两种互补的可视化方法静态的matplotlib图表展示宏观趋势交互式的folium地图探索微观细节。首先用matplotlib创建城市道路密度热力图。这个图能直观显示哪些区域道路网络更密集import matplotlib.pyplot as plt import numpy as np from matplotlib import cm from matplotlib.colors import LinearSegmentedColormap def create_road_density_map(gdf, city_name, resolution100): 创建道路密度热力图 # 提取该城市数据 city_data gdf[gdf[city] city_name].copy() # 获取城市边界 city_bounds city_data.total_bounds # 创建网格 x np.linspace(city_bounds[0], city_bounds[2], resolution) y np.linspace(city_bounds[1], city_bounds[3], resolution) # 计算每个网格内的道路长度密度 density np.zeros((resolution, resolution)) # 这里简化处理实际应用中需要更高效的空间索引方法 for idx, road in city_data.iterrows(): # 计算道路在每个网格中的长度简化版 pass # 绘制热力图 fig, ax plt.subplots(figsize(12, 10)) im ax.imshow(density.T, extentcity_bounds, originlower, cmapYlOrRd, alpha0.8) # 叠加道路网络简化显示 city_data.plot(axax, linewidth0.5, colorblack, alpha0.3) plt.colorbar(im, axax, label道路密度 (km/km²)) ax.set_title(f{city_name}道路密度分布 (2022年10月), fontsize14) ax.set_xlabel(经度) ax.set_ylabel(纬度) return fig对于交互式探索folium是更好的选择。它能创建可缩放、可点击的在线地图import folium from folium.plugins import HeatMap def create_interactive_road_map(gdf, city_name): 创建交互式路网地图 # 获取城市中心点 city_center [gdf[gdf[city]city_name].geometry.centroid.y.mean(), gdf[gdf[city]city_name].geometry.centroid.x.mean()] # 创建底图 m folium.Map(locationcity_center, zoom_start11, tilesCartoDB positron) # 按道路类型设置不同颜色 color_map { 高速公路: red, 城市快速路: orange, 城市主干道: blue, 城市次干道: green, 城市支路: gray, 自行车道: purple, 人行道路: brown } # 添加道路抽样显示避免过多数据 sample_data gdf[gdf[city]city_name].sample(frac0.1) # 10%抽样 for idx, row in sample_data.iterrows(): road_type row[type] color color_map.get(road_type, black) # 将几何对象转换为坐标列表 if row.geometry.geom_type LineString: coords list(row.geometry.coords) # 转换坐标顺序 (y, x) - (lat, lon) coords [(y, x) for x, y in coords] folium.PolyLine( coords, colorcolor, weight2 if road_type in [高速公路, 城市快速路] else 1, opacity0.7, popupf类型: {road_type}br名称: {row.get(name, 未知)} ).add_to(m) # 添加图例 legend_html div styleposition: fixed; bottom: 50px; left: 50px; width: 180px; border:2px solid grey; z-index:9999; background-color:white; padding: 10px; pstrong道路类型/strong/p for road_type, color in color_map.items(): legend_html fpi stylebackground:{color}; width:20px; height:10px; display:inline-block;/i {road_type}/p legend_html /div m.get_root().html.add_child(folium.Element(legend_html)) return m # 生成上海的可交互地图 shanghai_map create_interactive_road_map(roads_oct_cities, 上海市) shanghai_map.save(shanghai_roads_oct2022.html)在实际项目中我发现结合两种可视化方式最有效先用静态图表进行整体趋势分析再用交互地图深入探索特定区域。比如我可以先识别出道路密度增长最快的区域然后在交互地图上查看这些区域具体增加了哪些类型的道路。4. 变化趋势的深度分析不仅仅是数字游戏道路数据的变化背后反映的是城市发展的逻辑和重点。当我深入分析这四座城市的不同增长模式时发现了一些值得思考的趋势。北京毛细血管网络的完善北京的道路增长主要集中在城市支路和内部道路。这让我想起去年在北京几个大型居住区看到的场景原本封闭的小区内部道路逐渐对外开放形成了更密集的微循环网络。从数据上看北京的城市支路增长了约12%而内部道路增长了近15%。这种变化的意义是什么我做了个简单的可达性分析def calculate_network_accessibility(gdf, point_density100): 计算路网可达性指标简化版 results {} for city in target_cities: city_data gdf[gdf[city] city] # 计算道路密度 area city_data.convex_hull.area.sum() / 1e6 # 转换为平方公里 total_length city_data.geometry.length.sum() / 1000 # 转换为公里 road_density total_length / area if area 0 else 0 # 计算交叉口密度简化统计道路端点 # 实际应用中需要更精确的交叉口识别算法 endpoints [] for geom in city_data.geometry: if geom.geom_type LineString: endpoints.extend([geom.coords[0], geom.coords[-1]]) intersection_density len(set(endpoints)) / area if area 0 else 0 results[city] { road_density_km_per_km2: round(road_density, 2), intersection_density_per_km2: round(intersection_density, 2), total_length_km: round(total_length, 2) } return pd.DataFrame.from_dict(results, orientindex) # 计算两个时期的可达性指标 access_may calculate_network_accessibility(roads_may_cities) access_oct calculate_network_accessibility(roads_oct_cities) print(2022年5月路网可达性指标:) print(access_may) print(\n2022年10月路网可达性指标:) print(access_oct)分析结果显示北京在交叉口密度上的增长最为明显这意味着城市内部的可达性在提升。更多的交叉口意味着更多的路径选择能够分散交通流量缓解主干道的压力。上海骨干网络的强化与北京不同上海的增长重点在高速路网和城市主干道。特别是在浦东新区和临港新片区快速路网络明显加密。这种增长模式反映了上海作为长三角核心城市正在强化区域连接功能。我注意到一个有趣的现象上海的城市快速路增长主要集中在连接苏州、嘉兴等周边城市的放射线上。这可能是长三角一体化战略在基础设施上的体现。为了验证这个观察我提取了连接上海与周边城市的主要通道数据# 识别跨区域连接道路简化示例 def identify_regional_links(gdf, city_name, buffer_km10): 识别连接城市与周边区域的主要道路 city_data gdf[gdf[city] city_name].copy() # 创建城市边界缓冲区 city_boundary city_data.unary_union.convex_hull buffer_zone city_boundary.buffer(buffer_km / 111) # 近似度转距离 # 筛选可能连接区域的道路 regional_roads [] for idx, road in city_data.iterrows(): road_type road[type] # 重点关注高速和快速路 if road_type in [高速公路, 城市快速路]: # 检查道路是否延伸出缓冲区 road_line road.geometry if not road_line.within(buffer_zone): regional_roads.append({ name: road.get(name, 未知), type: road_type, length_km: road_line.length / 1000 }) return pd.DataFrame(regional_roads)广州慢行系统的领先广州的数据最让我惊讶的是慢行系统的快速增长。自行车道和人行道路的增长比例达到了18%远高于其他三个城市。这让我想起广州近年来大力推广的“绿道”系统和步行友好街区建设。从空间分布上看广州的慢行系统增长主要集中在珠江新城、琶洲互联网创新集聚区等新兴商务区以及老城区的历史街区。这种分布模式很有意思一边是现代化CBD的骑行网络完善一边是历史街区的步行环境提升。深圳均衡发展的智慧深圳的增长模式最为均衡各类道路都有适度增加。但当我仔细分析空间分布时发现了一个特点新增道路高度集中在“208”产业集群规划区域周边。比如光明科学城、河套深港科技创新合作区等区域道路网络明显加密。这种“产业导向”的道路建设模式反映了深圳以产业发展驱动城市空间拓展的逻辑。道路不仅是交通通道更是产业发展的基础设施。5. 从数据到洞察城市发展的四个维度分析完这些数据我尝试总结出城市道路发展的几个关键维度。这些维度不仅适用于北上广深对其他城市也有参考价值。维度一密度与可达性的平衡道路网络的发展需要在增加密度和提升可达性之间找到平衡。单纯增加道路长度不一定能改善交通关键看新增道路是否提升了网络连通性。我开发了一个简单的网络效率指标def calculate_network_efficiency(gdf): 计算路网效率指标简化版 efficiency_metrics {} for city in target_cities: city_data gdf[gdf[city] city] # 计算不同等级道路的比例 road_types city_data[type].value_counts(normalizeTrue) # 理想的道路等级比例根据城市规划理论 ideal_ratios { 高速公路: 0.05, 城市快速路: 0.10, 城市主干道: 0.15, 城市次干道: 0.20, 城市支路: 0.35, 其他: 0.15 } # 计算与理想比例的差异 total_diff 0 for road_type, ideal_ratio in ideal_ratios.items(): actual_ratio road_types.get(road_type, 0) total_diff abs(actual_ratio - ideal_ratio) # 效率得分差异越小越好 efficiency_score 100 * (1 - total_diff / 2) # 归一化到0-100 efficiency_metrics[city] { efficiency_score: round(efficiency_score, 1), highway_ratio: round(road_types.get(高速公路, 0) * 100, 1), arterial_ratio: round((road_types.get(城市主干道, 0) road_types.get(城市次干道, 0)) * 100, 1), local_ratio: round(road_types.get(城市支路, 0) * 100, 1) } return pd.DataFrame.from_dict(efficiency_metrics, orientindex) # 计算两个时期的网络效率 efficiency_may calculate_network_efficiency(roads_may_cities) efficiency_oct calculate_network_efficiency(roads_oct_cities) print(路网效率变化分析:) for city in target_cities: score_change efficiency_oct.loc[city, efficiency_score] - efficiency_may.loc[city, efficiency_score] print(f{city}: 效率得分从{efficiency_may.loc[city, efficiency_score]}变为 f{efficiency_oct.loc[city, efficiency_score]}变化{score_change:.1f})维度二多模式交通的整合现代城市交通不再是单一的车行系统而是多种模式的整合。道路数据中的自行车道、人行道路反映了城市对慢行交通的重视程度。我计算了四座城市的“慢行友好指数”城市自行车道比例人行道路比例慢行系统总比例半年变化广州2.1% → 2.4%3.8% → 4.2%5.9% → 6.6%0.7%深圳1.8% → 2.0%3.5% → 3.7%5.3% → 5.7%0.4%上海1.5% → 1.6%3.2% → 3.3%4.7% → 4.9%0.2%北京1.2% → 1.3%2.9% → 3.0%4.1% → 4.3%0.2%广州在慢行系统上的投入明显领先这可能与其湿热气候下鼓励非机动车出行的策略有关。维度三数据时效性与真实变化使用OSM数据需要特别注意一个问题数据变化可能反映的是数据采集的完善而不是实际的物理变化。为了区分这两种情况我尝试用了一些启发式方法聚类分析如果新增道路在空间上高度聚集可能是实际建设如果分散分布可能是数据完善道路等级模式高等级道路高速、快速路的数据通常更稳定变化更可能是实际建设时间序列验证结合其他数据源如卫星影像、政府公报交叉验证维度四从道路到街景的延伸分析道路数据只是城市交通系统的一部分。在实际项目中我经常将路网数据与其他数据源结合POI兴趣点数据分析道路周边功能了解“道路服务什么”人口热力图分析道路使用强度了解“谁在使用道路”实时交通数据分析道路运行效率了解“道路运行状况”这种多源数据融合能产生更有价值的洞察。比如我发现北京某些区域虽然道路密度高但POI数据显示主要是居住功能早晚高峰的潮汐交通特征明显这就需要针对性的交通管理策略。6. 实战应用构建城市道路健康度监测系统基于上述分析我设计了一个简单的城市道路健康度监测系统原型。这个系统可以定期分析路网数据跟踪城市交通基础设施的发展状况。系统核心包括三个模块class RoadNetworkMonitor: 城市道路网络监测系统 def __init__(self, city_name): self.city_name city_name self.metrics_history [] def calculate_core_metrics(self, road_data): 计算核心指标 metrics { total_length: road_data.geometry.length.sum() / 1000, # 公里 road_density: self._calculate_density(road_data), network_efficiency: self._calculate_efficiency(road_data), slow_traffic_ratio: self._calculate_slow_traffic_ratio(road_data), accessibility_index: self._calculate_accessibility(road_data) } return metrics def _calculate_density(self, road_data): 计算道路密度 # 获取城市面积简化使用凸包面积 area_km2 road_data.unary_union.convex_hull.area / 1e6 total_km road_data.geometry.length.sum() / 1000 return total_km / area_km2 if area_km2 0 else 0 def _calculate_efficiency(self, road_data): 计算网络效率 # 基于道路等级结构的合理性评估 type_distribution road_data[type].value_counts(normalizeTrue) # 定义理想分布权重 ideal_weights { 高速公路: 0.05, 城市快速路: 0.10, 城市主干道: 0.15, 城市次干道: 0.20, 城市支路: 0.35, 自行车道: 0.05, 人行道路: 0.05, 其他: 0.05 } # 计算匹配度 match_score 0 for road_type, ideal_weight in ideal_weights.items(): actual_weight type_distribution.get(road_type, 0) match_score min(actual_weight, ideal_weight) return match_score def _calculate_slow_traffic_ratio(self, road_data): 计算慢行交通比例 slow_types [自行车道, 人行道路] slow_length road_data[road_data[type].isin(slow_types)].geometry.length.sum() total_length road_data.geometry.length.sum() return slow_length / total_length if total_length 0 else 0 def _calculate_accessibility(self, road_data): 计算可达性指数简化版 # 基于交叉口密度和道路连通性 # 实际实现需要复杂的网络分析 return 0.7 # 示例值 def generate_report(self, current_data, previous_dataNone): 生成监测报告 current_metrics self.calculate_core_metrics(current_data) report { city: self.city_name, period: 2022年10月, current_metrics: current_metrics } if previous_data is not None: previous_metrics self.calculate_core_metrics(previous_data) report[previous_metrics] previous_metrics report[changes] self._calculate_changes(current_metrics, previous_metrics) return report def _calculate_changes(self, current, previous): 计算指标变化 changes {} for key in current: if key in previous: changes[key] { absolute: current[key] - previous[key], relative: ((current[key] - previous[key]) / previous[key] * 100 if previous[key] ! 0 else 0) } return changes # 使用示例 shanghai_monitor RoadNetworkMonitor(上海市) report shanghai_monitor.generate_report( roads_oct_cities[roads_oct_cities[city] 上海市], roads_may_cities[roads_may_cities[city] 上海市] ) print(f上海道路网络监测报告) print(f总长度: {report[current_metrics][total_length]:.0f}公里) print(f道路密度: {report[current_metrics][road_density]:.2f}公里/平方公里) print(f网络效率: {report[current_metrics][network_efficiency]:.2%}) print(f慢行比例: {report[current_metrics][slow_traffic_ratio]:.2%})这个系统可以扩展更多功能比如异常检测识别道路网络的异常变化模式预测模型基于历史趋势预测未来发展方向对标分析与其他同类城市比较空间分析识别发展不平衡的区域在实际部署时我建议将数据更新自动化比如每月自动下载最新的OSM数据运行分析脚本生成监测报告。这样就能持续跟踪城市道路网络的变化趋势。处理这些路网数据时最深的体会是数据不会说谎但会讲故事。同样的道路增长在北京讲的是“毛细血管疏通”的故事在上海是“骨干网络强化”的故事在广州是“慢行系统优先”的故事在深圳是“产业配套跟进”的故事。每个城市都有自己的发展逻辑和重点这些逻辑就藏在那些经纬度坐标和属性字段里。下次当你看到一条新修的道路时不妨想想它在这个城市故事里扮演什么角色——是连接产城的关键一环还是完善慢行网络的一块拼图或者是疏通交通瓶颈的一剂良药。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2412369.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!