需求故事:
最近时间一下子多了起来,用来学习Java是最合适不过了,但是去b站看视频难免会没有自制力,于是决定用selenium来抓取b站黑马Java视频的目录创建一个学习计划的Excel,便于进行学习进度的管理。
注:纯手打,如有错误欢迎评论区交流!
转载请注明出处:https://blog.csdn.net/testleaf/article/details/130330760
多谢!!!
目录
- 一、版本说明
 - 二、导入需要使用的库
 - 三、创建并初始化Excel
 - 四、打开网站并窗口最大化
 - 五、获取视频目录列表及其长度
 - 六、遍历视频目录列表内容并存入Excel
 - 七、Excel附加行头
 - 八、保存Excel
 - 九、对生成的Excel进行一些额外的操作
 - 十、后续操作
 
一、版本说明
Python:3.8.2
 
 selenium:4.8.2
 
 openpyxl:3.0.10
 
 Chrome浏览器版本:112.0.5615.121(正式版本)(64 位)
 
 chromedriver版本:112.0.5615.49
 
二、导入需要使用的库
from selenium import webdriver
from openpyxl import Workbook
from selenium.webdriver.common.by import By
 
三、创建并初始化Excel
wb = Workbook()
sheet = wb.create_sheet('20天学会Java', 0)
 
四、打开网站并窗口最大化
driver = webdriver.Chrome()
driver.get('https://www.bilibili.com/video/BV1Cv411372m') ## 打开网站
driver.maximize_window() ## 使浏览器的窗口最大化
 
五、获取视频目录列表及其长度
videoList = driver.find_elements(By.XPATH,'//ul[@class="list-box"]/li') ## 获取视频目录列表
listLength = len(videoList) ## 获取视频目录列表的长度
 

六、遍历视频目录列表内容并存入Excel
for listIndex in range(listLength):
    print(listIndex+1) ## 打印当前序号,便于知道进度
    element1 = driver.find_element(By.XPATH,'//ul[@class="list-box"]/li['+str(listIndex+1)+']/a/div/div/span[1]')
    element2 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div/span[2]')
    element3 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div[2]')
    element3List = element3.get_attribute('innerText').split(':')
    if(len(element3List)==2): ## 把时长转化为以秒为单位的形式
        element3Value = int(element3List[0])*60+int(element3List[1])
    else:
        element3Value = int(element3List[0]) * 3600 + int(element3List[1])*60+int(element3List[2])
    sheet.cell(row=listIndex + 3, column=1, value=element1.get_attribute('innerText'))
    sheet.cell(row=listIndex + 3, column=2, value=element2.get_attribute('innerText'))
    sheet.cell(row=listIndex + 3, column=3, value=str(element3.get_attribute('innerText')))
    sheet.cell(row=listIndex + 3, column=4, value=element3Value)
 

七、Excel附加行头
sheet.cell(row=2, column=1, value="序号")
sheet.cell(row=2, column=2, value="标题")
sheet.cell(row=2, column=3, value="时长")
sheet.cell(row=2, column=4, value="时长(秒)")
sheet.cell(row=2, column=5, value="完成情况")
sheet.cell(row=2, column=6, value="完成时间")
 
八、保存Excel
wb.save(filename=r'b站黑马视频学习进度表.xlsx')
 
九、对生成的Excel进行一些额外的操作
运行完上述代码,得到一个Excel文件:
 
调整单元格使其宽度自适应内容,双击一下这个东西就可以:
 
效果如下:
 
冻结至第2行:
 
在首行第2列插入数据:
="进度:"&ROUND(SUM(E3:E202)/SUM(D3:D202),4)*100&"%;已学:"&ROUND(SUM(E3:E202)/3600,2)&"小时;还剩:"&ROUND((SUM(D3:D202)-SUM(E3:E202))/3600,2)&"小时"
 
然后回车;

 说明:
 1、ROUND(A,2):将A保留两位小数
 2、SUM(D3:D202):求D3到D202所有数据的和
 3、&:连接字符串
效果:
 
十、后续操作
1、看完一集视频就在这里写上与左侧相等的数值:
 
 第一行进度栏的数值会自动变化:
 
2、完成时间右边直接写上:
=NOW()
 
回车,然后复制后到左边粘贴为数值:
 
效果:
 


















