网页文字提取

URL 抓取 / HTML 粘贴 · 自动剔除脚本广告 · 导出 TXT · 字数统计

extract URL HTML 正文

支持 URL 抓取或直接粘贴 HTML 源代码。 快捷键: Ctrl/Cmd+Enter 提交 · Ctrl/Cmd+K 聚焦

功能说明

双模式

URL 抓取 + HTML 粘贴,灵活适配不同场景。

智能清洗

自动剔除 script、style、iframe、svg 等非文本元素。

导出 TXT

结果可一键导出为 TXT 文件,便于离线保存。

统计元数据

显示字数、段落数、原始页面长度等元数据。

常见问题

为什么有些网站抓不到?

部分网站有 CORS 或反爬限制。可改用「HTML 粘贴」模式,将 F12 复制的源码粘贴进来。

是否上传抓取数据?

抓取请求由后端代理转发;HTML 粘贴模式完全在本地处理。

支持 SPA 单页应用吗?

仅抓取首屏 HTML。SPA 内容需要先在浏览器内打开后用「HTML 粘贴」模式提取。