WebArticleToWord
网站文章内容提取与Word导出工具
快速提取网页文章内容,一键生成Word文档
文章URL输入
文章URL列表
(每行一个URL)
添加示例URL
|
清空
标题开始标签
文章标题的开始HTML标签
标题结束标签
文章标题的结束HTML标签
内容开始标签
文章内容的开始HTML标签
内容结束标签
文章内容的结束HTML标签
使用说明:
输入一个URL时,直接下载Word文档
输入多个URL时,下载包含所有文档的ZIP压缩包
默认使用标题标签:
和内容标签:
可根据网站结构修改标题和内容的开始/结束标签
支持图片保存到Word文档中
文件名使用文章标题,不包含时间戳
重置
导出文档
导出结果
处理进度
0%
正在初始化...
使用说明
快速开始:
在左侧输入文章URL
设置内容提取标签(可选)
点击"导出文档"按钮
等待处理完成并下载文件
文件导出规则:
输入
输出
1个URL
单个Word文档
多个URL
ZIP压缩包
支持的功能:
智能文章内容提取
自定义内容范围
批量处理
Word文档格式化
进度实时显示
系统信息
后端框架:
FastAPI
内容提取:
BeautifulSoup4
文档生成:
python-docx
前端框架:
Bootstrap 5.3
API状态:
检测中...