结合kimi chat的爬虫实战思路

结合kimi chat的爬虫实战思路

news2026/5/5 16:46:51

背景

想钻研一下项目组件，找找之后的学习方向。不能自以为是，所以借着网开源项目网站上公布的项目内容看一下，那些是我可以努力去学习的（入门的）。首先需要获取相关内容，于是爬取整理。

任务1：爬一个项目网站上的项目列表。

展示

在这里插入图片描述

过程：

开始是想着借助kimi chat去解析前端页面然后编写代码，但是发现生成的代码，总是跑不起来。
去b站上学习了一下。gpt辅助爬虫

curl（包含所有信息，header啥的）和 har（所有操作记录）
还了解到一个curl convert

看到评论区，选择直接
复制粘贴完整的curl指令，
喂给kimi chat（不登录网站没有cookie的话，请求访问就是空。）
进一步的需求
出现报错，给他说一下
爬取效果

任务2：补充项目详情

内容展示

在这里插入图片描述

过程

那这个和上面，过程大同（爬取请求）小异（从之前的csv文件中读取项目ID，然后请求）

粘贴curl请求
突然想到我这样的请求是不是要加个间隔，要不算什么恶意访问。

import time

time.sleep(0.5)  # 休眠500毫秒

效果如下

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1650820.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Unity与C#的关系

第一，我们首先需要知道Unity与C#的关系是什么？ 第二，我们要明白为什么Unity会使用C#，而不是C？ 第三，我们需要知道Unity是怎么使用C#的？ 第一点： 先说结论：C#是Unity用…

阅读更多...

【Verilog】big_small_cnt

【Verilog】big_small_cnt

通用大小计数器 timescale 1ns / 1ps // // Company: // Engineer: wengf // Create Date: // Design Name: // Module Name: big_small_cnt // Project Name: // Target Devices: // Tool Versions: // Description: // Dependencies: // Revision: // Revision 0…

阅读更多...

一起刷C语言菜鸟教程100题（15-26含解析）

一起刷C语言菜鸟教程100题（15-26含解析）

五一过的好快，五天假期说没就没，因为一些事情耽搁到现在，不过还是要继续学习的，之后就照常更新，先说一下，这个100题是菜鸟教程里面的，但是有一些题，我加入了自己的理解，甚…

阅读更多...

odoo实施之创建行业demo

odoo实施之创建行业demo

创建数据库，添加公司数据选择应用，获取15天免费试用创建完成设置客户公司logo 创建用户更改用户语言前置条件：配置邮件开发模式下，额外信息加载demo数据

阅读更多...

Conda下Richdem包遇到问题

Conda下Richdem包遇到问题

Conda中Richdem包遇到问题文章目录 Conda中Richdem包遇到问题问题一报错解决问题二报错解决参考问题一报错 RichDEM 是一套数字高程模型 （DEM） 水文分析工具，这次打算用richdem进行地形分析，尝试在conda里面安装richdem包的…

阅读更多...

VMware下Ubuntu的安装教程

VMware下Ubuntu的安装教程

文章目录一、Ubuntu如何下载1.下载官方地址https://ubuntu.com/2.点选Ubuntu服务器版本3.点击下载Ubuntu服务器版本iso镜像二、VMware安装Ubuntu服务器系统1.创建虚拟机2.选择下载好的Ubuntu服务器镜像3.创建安装完成三、Ubuntu Server如何设置1.Ubuntu Server没有中文所以全都…

阅读更多...

windows vscode设置扩展和缓存目录

windows vscode设置扩展和缓存目录

vscode的扩展和缓存占了很大的空间，而且默认在C盘，很烦。。。修改vscode快捷方式的目标处："C:\Users\Nv9\AppData\Local\Programs\Microsoft VS Code\Code.exe" --extensions-dir "D:\Program Cache\VScode\extensions"…

阅读更多...

sql注入练习

sql注入练习

1.什么是SQL注入 SQL注入是比较常见的网络攻击方式之一，它不是利用操作系统的BUG来实现攻击，而是针对程序员编写时的疏忽，通过SQL语句，实现无账号登录，甚至篡改数据库 2.sql注入原理攻击者注入一段包含注释符的SQL语…

阅读更多...

kraken2 最新版安装，极简模式

kraken2 最新版安装，极简模式

kraken2 git clone https://github.com/DerrickWood/kraken2.gitcd kraken2./install_kraken2.sh /opt/krakenvim .bashrc ---------------- # Kraken export PATH"/opt/kraken:$PATH" ----------------source .bashrc Note: 不晓得是不是我设置了清华源&#xff0c…

阅读更多...

Spring Boot集成Swagger快速入门Demo

Spring Boot集成Swagger快速入门Demo

1.什么是Swagger？ Swagger 是一个规范和完整的框架，用于生成、描述、调用和可视化 RESTful 风格的 Web 服务。主要作用： 使得前后端分离开发更加方便，有利于团队协作。（实际开发中，接口文档的内容会不停的…

阅读更多...

kafka学习笔记（三、生产者Producer使用及配置参数）

kafka学习笔记（三、生产者Producer使用及配置参数）

1.简介 1.1.producer介绍生产者就是负责向kafka发送消息的应用程序。消息在通过send()方法发往broker的过程中，有可能需要经过拦截器(Interceptor)、序列化器(Serializer)和分区器(Partitioner)的一系列作用后才能被真正的发往broker。 demo: public class Kafk…

阅读更多...

【NodeMCU实时天气时钟温湿度项目 4】通过NTPClient库获取实时网络时间并显示在TFT屏幕上

【NodeMCU实时天气时钟温湿度项目 4】通过NTPClient库获取实时网络时间并显示在TFT屏幕上

今天是【实时天气时钟温湿度项目】第四专题，主要内容是：学习导入NTPClient库，通过这个库获取实时网络时间，显示在1.3寸TFT液晶屏幕上。此前三个专题，请选择查看以下链接。第一专题内容，请参考【N…

阅读更多...

使用Docker安装MySQL5.7.36

使用Docker安装MySQL5.7.36

拉取镜像并查看 docker pull mysql:5.7.36拉取成功后查看（非必须） docker images创建并设置宿主机 mysql 配置文件目录和数据文件目录创建相关文件夹将容器中的mysql数据保存到本地，这样即使容器被删除，数据也不会丢失。 mkd…

阅读更多...

牛客NC142 最长重复子串【中等字符串 Java/Go】

牛客NC142 最长重复子串【中等字符串 Java/Go】

题目题目链接： https://www.nowcoder.com/practice/4fe306a84f084c249e4afad5edf889cc 思路注意：题目给的时间复杂度是O(N^2)那么直接套用双重循环：外层循环i为假定起始重复子串的初始位置，内层循环的j为假定重复子串的结束位置…

阅读更多...

每日一题5：Pandas-修改列

每日一题5：Pandas-修改列

一、每日一题一家公司决定增加员工的薪水。编写一个解决方案，将每个员工的薪水乘以2来修改 salary 列。返回结果格式如下示例所示。解答： import pandas as pddef modifySalaryColumn(employees: pd.DataFrame) -> pd.DataFrame:employees.loc[…

阅读更多...

人工神经网络初步

人工神经网络初步

大家好，这里是七七，由于各种比赛的缘故，使用了很多人工神经网络模型。但是很多的原理都不是很明白，就导致了不能灵活地运用┭┮﹏┭┮。为此，去看了些人工神经网络原理书，写下此专题。在进入正文之前要先…

阅读更多...

Delta lake with Java--数据增删改查

Delta lake with Java--数据增删改查

之前写的关于spark sql 操作delta lake表的，总觉得有点混乱，今天用Java结合真实的数据来进行一次数据的CRUD操作，所涉及的数据来源于Delta lake up and running配套的 GitGitHub - benniehaelen/delta-lake-up-and-running: Companion reposi…

阅读更多...

Mac idea gradle解决异常: SSL peer shut down incorrectly

Mac idea gradle解决异常: SSL peer shut down incorrectly

系统：mac 软件：idea 解决异常: SSL peer shut down incorrectly 查看有没有安装 gradle -v安装根据项目gradle提示安装版本 brew install gradle7idea的配置在settings搜索gradle，配置Local installation，选择自己的安装目录…

阅读更多...

Unity Shader中获取像素点深度信息

Unity Shader中获取像素点深度信息

1.顶点着色器中对深度进行计算 v2f vert(appdata v) {v2f o;o.pos UnityObjectToClipPos(v.vertex);o.uv TRANSFORM_TEX(v.uv, _MainTex);o.depth (o.pos.z / o.pos.w 1.0) * 0.5; // Normalize depth to [0, 1]return o; }但是达不到预期，最后返回的值一直大于…

阅读更多...

连通“数据”，让制造变“聪明”

连通“数据”，让制造变“聪明”

说起数据智能，你第一时间想到的是什么呢？是科技感十足的智慧城市？还是炫酷的人工智能景象？ 数据作为企业的战略资产越来越受到重视，从最初的数据协助业务协同，转化为数据驱动业务，数据驱动运营…

阅读更多...

推荐文章

最新文章