WebArticleToWord
网站文章内容提取与Word导出工具
快速提取网页文章内容,一键生成Word文档
文章URL输入
文章URL列表
(每行一个URL)
添加示例URL
|
清空
标题开始标签
文章标题的开始HTML标签
标题结束标签
文章标题的结束HTML标签
内容开始标签
文章内容的开始HTML标签
内容结束标签
文章内容的结束HTML标签
使用说明:
输入一个URL时,直接下载Word文档
输入多个URL时,下载包含所有文档的ZIP压缩包
智能提取
:如果不知道网站标签结构,可以清空标签输入框使用智能提取
自定义标签
:可根据网站结构修改标题和内容的开始/结束标签
支持图片保存到Word文档中
文件名使用文章标题,不包含时间戳
使用智能提取
(自动检测文章内容,无需设置标签)
勾选后,将忽略下面的标签设置,使用智能算法提取文章内容
重置
导出文档
导出结果
处理进度
0%
正在初始化...
使用说明
快速开始:
在左侧输入文章URL
设置内容提取标签(可选)
点击"导出文档"按钮
等待处理完成并下载文件
文件导出规则:
输入
输出
1个URL
单个Word文档
多个URL
ZIP压缩包
支持的功能:
智能文章内容提取
自定义内容范围
批量处理
Word文档格式化
进度实时显示
系统信息
后端框架:
FastAPI
内容提取:
BeautifulSoup4
文档生成:
python-docx
前端框架:
Bootstrap 5.3
API状态:
检测中...