# python-douban **Repository Path**: Marsfactory/python-douban ## Basic Information - **Project Name**: python-douban - **Description**: python豆瓣250爬虫可视化 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-12 - **Last Updated**: 2026-01-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 豆瓣 Top 250 可视化大屏 一个基于 Python + Flask + ECharts 的豆瓣电影 Top 250 数据爬取与可视化项目。 ## 项目预览 项目提供了一个炫酷的数据可视化大屏,展示豆瓣电影 Top 250 的多维度数据分析结果。 ## 功能特性 - **数据爬取**:自动爬取豆瓣电影 Top 250 榜单数据 - **数据缓存**:支持本地 JSON 文件缓存,避免重复爬取 - **多维度分析**: - 年份分布趋势 - 评分区间分布 - 国家/地区分布 - 电影类型分布 - 年代综合分析 - 导演作品排行 - **可视化大屏**:炫酷的科技感 UI 设计,支持响应式布局 - **榜单展示**:评分最高 TOP 10、最受关注 TOP 10 ## 技术栈 - **后端**:Python 3 + Flask - **爬虫**:Requests + BeautifulSoup4 - **前端**:HTML + CSS + JavaScript - **图表**:ECharts 5.x ## 项目结构 ``` python-douban/ ├── app.py # Flask 主应用 ├── scraper.py # 数据爬虫模块 ├── analyzer.py # 数据分析模块 ├── douban_top250.json # 缓存数据文件 ├── templates/ │ └── index.html # 可视化大屏页面 └── README.md ``` ## 快速开始 ### 1. 安装依赖 ```bash pip install flask requests beautifulsoup4 ``` ### 2. 运行项目 ```bash python app.py ``` ### 3. 访问应用 打开浏览器访问:http://127.0.0.1:5000 ## API 接口 | 接口 | 方法 | 说明 | |------|------|------| | `/` | GET | 可视化大屏主页 | | `/api/movies` | GET | 获取所有电影数据 | | `/api/stats` | GET | 获取统计分析数据 | | `/api/refresh` | GET | 刷新数据(重新爬取) | ## 数据字段 爬取的电影数据包含以下字段: | 字段 | 类型 | 说明 | |------|------|------| | rank | int | 排名 | | title | string | 电影名称 | | other_title | string | 其他名称(英文/原名) | | cover | string | 封面图 URL | | link | string | 豆瓣链接 | | director | string | 导演 | | actors | string | 主演 | | year | int | 年份 | | country | string | 国家/地区 | | genres | array | 类型标签 | | rating | float | 评分 | | rating_people | int | 评价人数 | | quote | string | 一句话评价 | ## 注意事项 - 首次运行会自动爬取数据,爬取过程约需 30 秒 - 爬取时设有随机延迟,避免对豆瓣服务器造成压力 - 数据会缓存到本地 JSON 文件,后续启动直接读取缓存 - 如需更新数据,访问 `/api/refresh` 接口 ## 许可证 MIT License