Python爬虫示例-豆瓣电影TOP250

📁学习日志📆2023-05-01 🤯PH 👀973 次浏览
Python爬虫示例-豆瓣电影TOP250-BtoAI 波特埃

1、requests库

pip install requests

Successfully installed certifi-2022.12.7 charset-normalizer-3.1.0 idna-3.4 requests-2.29.0 urllib3-1.26.15

2、伪装浏览器

import requests
#伪装浏览器
headers = {
"User-Agent":"Mozilla/5.0 (Linux; Andro...."
}
response = requests.get("https://movie.douban.com/top250", headers = headers )
print(response.text)

3.pip install bs4库

Successfully installed beautifulsoup4-4.12.2 bs4-0.0.1 soupsieve-2.4.1

import requests
from bs4 import BeautifulSoup
#伪装浏览器
headers = {
"User-Agent":"Mozilla/5.0 (Linux; Andro..."
}

#自动翻页
for start_num in range(0,250,25):
response = requests.get(f"https://movie.douban.com/top250?start={start_num}", headers=headers)
html = response.text
soup = BeautifulSoup(html, "html.parser")
all_title = soup.findAll("span", attrs={"class": "title"})
for title in all_title:
title_string = title.string
if "/" not in title_string:
print(title_string) # 去除原名

更多文章

计算机视觉:目标检测、人脸识别

1、目标检测 图像分类:分类、概率 目标检测:给出位置、分类、概率 数据标注:坐上坐标,右下坐标 矩形框 (x1,y1,x2,y2,class) 目标检测常用数据集:PASCAL VOC、MS COCO(30W+图片,80个分类) 目标检测的操作: 评价指标: 2、检测方法 二阶段目标检测—Faster RCNN,速度慢 一阶段目标检测—YOLO V8,快 目标检测新范式—DETR,训练时间长 3…

📁 学习日志 📆 2023-05-07
计算机视觉:目标检测、人脸识别

联邦学习 FL 基础

“联邦学习”让互相不信任的各方,可以把样本和特征汇聚到一起,共同获得更好的预测模型。2016年由谷歌团队提出,数据不动模型动。

📁 机器学习 📆 2023-09-07
联邦学习 FL 基础
回到顶部