WebArticleToWord

网站文章内容提取与Word导出工具

快速提取网页文章内容,一键生成Word文档

文章URL输入
文章标题的开始HTML标签
文章标题的结束HTML标签
文章内容的开始HTML标签
文章内容的结束HTML标签
使用说明:
  • 输入一个URL时,直接下载Word文档
  • 输入多个URL时,下载包含所有文档的ZIP压缩包
  • 默认使用标题标签:
  • 可根据网站结构修改标题和内容的开始/结束标签
  • 支持图片保存到Word文档中
  • 文件名使用文章标题,不包含时间戳
导出结果
使用说明
快速开始:
  1. 在左侧输入文章URL
  2. 设置内容提取标签(可选)
  3. 点击"导出文档"按钮
  4. 等待处理完成并下载文件
文件导出规则:
输入 输出
1个URL 单个Word文档
多个URL ZIP压缩包
支持的功能:
  • 智能文章内容提取
  • 自定义内容范围
  • 批量处理
  • Word文档格式化
  • 进度实时显示
系统信息
后端框架: FastAPI
内容提取: BeautifulSoup4
文档生成: python-docx
前端框架: Bootstrap 5.3
API状态: 检测中...