常见问题
关于 Anyhunt 的常见问题解答
常见问题
基本问题
什么是 Anyhunt?
Anyhunt 是一个网页抓取 API,可以从任意网页提取内容。您通过 API 发送 URL,我们返回您所需格式(Markdown、HTML、链接或截图)的干净、结构化内容。
支持哪些输出格式?
我们支持多种输出格式:
- Markdown - 干净、可读的文本(默认)
- HTML - 清理后的 HTML(不含脚本)
- Raw HTML - 原始未修改的 HTML
- Links - 页面上的所有超链接
- Screenshot - PNG、JPEG 或 WebP 格式的页面截图
抓取速度有多快?
大多数抓取在 2-5 秒内完成,具体取决于页面复杂性和网络条件。我们会等待 JavaScript 完全渲染后再提取内容。
可以抓取需要登录的页面吗?
目前我们仅支持公开页面。需要认证的页面抓取功能已在开发计划中。
API 功能
Scrape 和 Crawl 有什么区别?
- Scrape - 从单个 URL 提取内容
- Crawl - 从一个 URL 开始,跟踪链接抓取多个页面,支持深度控制和路径过滤
单个页面使用 Scrape。需要抓取整个网站或某个部分时使用 Crawl。
AI 提取如何工作?
Extract API 使用 LLM(大型语言模型)从网页中提取结构化数据。您提供定义所需数据结构的 JSON Schema,我们返回符合该 Schema 的数据。非常适合提取产品信息、文章元数据或任何自定义数据。
页面交互(Actions)如何使用?
Page Actions 允许您在抓取前与页面交互。您可以:
- click - 点击元素(如"加载更多"按钮)
- type - 在输入框中输入文本
- scroll - 滚动页面
- wait - 等待元素或指定时间
- press - 按下键盘按键
这对于 SPA 和懒加载内容的页面非常有用。
Map API 有什么用?
Map API 发现网站的所有 URL。它首先尝试解析 sitemap(/sitemap.xml),如果不可用则回退到浏览器爬取。非常适合在爬取前了解网站结构。
技术问题
你们使用什么浏览器?
我们使用基于 Playwright 的 Chromium,提供一致的高保真渲染,与用户在 Chrome 中看到的效果一致。
会执行 JavaScript 吗?
是的,JavaScript 会完全执行。我们会等待页面完全加载和渲染后再提取内容。
截图最大高度是多少?
全页面截图最高可捕获 16,384 像素高度。
缓存如何工作?
响应默认缓存 1 小时。缓存键由 SHA256(url + options) 计算,因此相同的请求将返回缓存结果。缓存命中时响应中会显示 fromCache: true,且不计入配额。
主内容是如何提取的?
我们使用 Mozilla 的 Readability 算法(与 Firefox 阅读视图相同)来识别和提取主内容,过滤掉导航、广告和其他干扰元素。您可以通过设置 onlyMainContent: false 来禁用此功能,获取完整页面内容。
安全问题
我的 API 密钥安全吗?
API 密钥以 SHA256 哈希形式存储。明文密钥仅在创建时显示一次。请妥善保管密钥,切勿在客户端代码中暴露。
有什么 SSRF 防护措施?
我们阻止所有以下请求:
- 私有 IP 范围(10.x.x.x、192.168.x.x 等)
- localhost 和回环地址
- 云元数据端点(169.254.x.x)
- 内部 DNS 名称
数据存储在哪里?
抓取的内容缓存在 Cloudflare R2 上,并通过 Cloudflare 的全球 CDN 提供服务。数据在静态和传输中都经过加密。截图在配置的 TTL 后过期。
计费问题
如何计费?
根据您的套餐按月计费。每次 API 调用消耗配额中的额度。缓存命中不计入配额。
接受哪些支付方式?
我们通过支付处理商 Creem 接受所有主要信用卡。
可以退款吗?
月度订阅不可退款,但您可以随时取消。未使用的按量付费额度可在 30 天内退款。
提供发票吗?
是的,发票会自动生成,可在控制台的"账单"中查看。
支持
如何获得帮助?
- 文档:您正在阅读!
- 邮件:support@anyhunt.app
- 控制台:使用仪表板中的反馈按钮
正常运行时间 SLA 是多少?
我们的目标是 99.9% 的正常运行时间。访问 status.anyhunt.app 查看实时可用性。
有速率限制吗?
是的,速率限制取决于您的套餐:
- 免费版:10 请求/分钟
- 基础版:30 请求/分钟
- 专业版:60 请求/分钟
- 团队版:120 请求/分钟
还有其他问题?请联系 support@anyhunt.app。