# python-douban

**Repository Path**: Marsfactory/python-douban

## Basic Information

- **Project Name**: python-douban
- **Description**: python豆瓣250爬虫可视化
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-12
- **Last Updated**: 2026-01-12

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 豆瓣 Top 250 可视化大屏

一个基于 Python + Flask + ECharts 的豆瓣电影 Top 250 数据爬取与可视化项目。

## 项目预览

项目提供了一个炫酷的数据可视化大屏，展示豆瓣电影 Top 250 的多维度数据分析结果。

## 功能特性

- **数据爬取**：自动爬取豆瓣电影 Top 250 榜单数据
- **数据缓存**：支持本地 JSON 文件缓存，避免重复爬取
- **多维度分析**：
  - 年份分布趋势
  - 评分区间分布
  - 国家/地区分布
  - 电影类型分布
  - 年代综合分析
  - 导演作品排行
- **可视化大屏**：炫酷的科技感 UI 设计，支持响应式布局
- **榜单展示**：评分最高 TOP 10、最受关注 TOP 10

## 技术栈

- **后端**：Python 3 + Flask
- **爬虫**：Requests + BeautifulSoup4
- **前端**：HTML + CSS + JavaScript
- **图表**：ECharts 5.x

## 项目结构

```
python-douban/
├── app.py              # Flask 主应用
├── scraper.py          # 数据爬虫模块
├── analyzer.py         # 数据分析模块
├── douban_top250.json  # 缓存数据文件
├── templates/
│   └── index.html      # 可视化大屏页面
└── README.md
```

## 快速开始

### 1. 安装依赖

```bash
pip install flask requests beautifulsoup4
```

### 2. 运行项目

```bash
python app.py
```

### 3. 访问应用

打开浏览器访问：http://127.0.0.1:5000

## API 接口

| 接口 | 方法 | 说明 |
|------|------|------|
| `/` | GET | 可视化大屏主页 |
| `/api/movies` | GET | 获取所有电影数据 |
| `/api/stats` | GET | 获取统计分析数据 |
| `/api/refresh` | GET | 刷新数据（重新爬取） |

## 数据字段

爬取的电影数据包含以下字段：

| 字段 | 类型 | 说明 |
|------|------|------|
| rank | int | 排名 |
| title | string | 电影名称 |
| other_title | string | 其他名称（英文/原名） |
| cover | string | 封面图 URL |
| link | string | 豆瓣链接 |
| director | string | 导演 |
| actors | string | 主演 |
| year | int | 年份 |
| country | string | 国家/地区 |
| genres | array | 类型标签 |
| rating | float | 评分 |
| rating_people | int | 评价人数 |
| quote | string | 一句话评价 |

## 注意事项

- 首次运行会自动爬取数据，爬取过程约需 30 秒
- 爬取时设有随机延迟，避免对豆瓣服务器造成压力
- 数据会缓存到本地 JSON 文件，后续启动直接读取缓存
- 如需更新数据，访问 `/api/refresh` 接口

## 许可证

MIT License