网页文字提取
URL 抓取 / HTML 粘贴 · 自动剔除脚本广告 · 导出 TXT · 字数统计
功能说明
双模式
URL 抓取 + HTML 粘贴,灵活适配不同场景。
智能清洗
自动剔除 script、style、iframe、svg 等非文本元素。
导出 TXT
结果可一键导出为 TXT 文件,便于离线保存。
统计元数据
显示字数、段落数、原始页面长度等元数据。
常见问题
为什么有些网站抓不到?
部分网站有 CORS 或反爬限制。可改用「HTML 粘贴」模式,将 F12 复制的源码粘贴进来。
是否上传抓取数据?
抓取请求由后端代理转发;HTML 粘贴模式完全在本地处理。
支持 SPA 单页应用吗?
仅抓取首屏 HTML。SPA 内容需要先在浏览器内打开后用「HTML 粘贴」模式提取。