#当然可以!以下是一个简单的 Python 爬虫示例,
#用于从高山网获取近三年中国高校排名数据。你可以根据自己的需求进行修改和扩展。
# python
import requests
import pandas as pd
from bs4 import BeautifulSoup
# 请求高山网的排名页面
url = 'http://m.gaosan.com/gaokao/265440.html'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
# 提取表格数据
table = soup.find('table')
rows = table.find_all('tr')
# 解析表格数据并存储到 DataFrame
data = []
for row in rows[1:]: # 跳过表头
cols = row.find_all('td')
rank = cols[0].text.strip()
school_name = cols[1].text.strip()
score = cols[2].text.strip()
star_rank = cols[3].text.strip()
level = cols[4].text.strip()
data.append([rank, school_name, score, star_rank, level])
df = pd.DataFrame(data, columns=['名次', '学校名称', '综合得分', '星级排名', '办学层次'])
# 将数据保存到 CSV 文件
df.to_csv('排名.csv', index=False, encoding='utf-8')
print("数据已保存到:排名.csv文件中。")