Anyhunt

常见问题

关于 Anyhunt 的常见问题解答

常见问题

基本问题

什么是 Anyhunt?

Anyhunt 是一个网页抓取 API,可以从任意网页提取内容。您通过 API 发送 URL,我们返回您所需格式(Markdown、HTML、链接或截图)的干净、结构化内容。

支持哪些输出格式?

我们支持多种输出格式:

  • Markdown - 干净、可读的文本(默认)
  • HTML - 清理后的 HTML(不含脚本)
  • Raw HTML - 原始未修改的 HTML
  • Links - 页面上的所有超链接
  • Screenshot - PNG、JPEG 或 WebP 格式的页面截图

抓取速度有多快?

大多数抓取在 2-5 秒内完成,具体取决于页面复杂性和网络条件。我们会等待 JavaScript 完全渲染后再提取内容。

可以抓取需要登录的页面吗?

目前我们仅支持公开页面。需要认证的页面抓取功能已在开发计划中。

API 功能

Scrape 和 Crawl 有什么区别?

  • Scrape - 从单个 URL 提取内容
  • Crawl - 从一个 URL 开始,跟踪链接抓取多个页面,支持深度控制和路径过滤

单个页面使用 Scrape。需要抓取整个网站或某个部分时使用 Crawl。

AI 提取如何工作?

Extract API 使用 LLM(大型语言模型)从网页中提取结构化数据。您提供定义所需数据结构的 JSON Schema,我们返回符合该 Schema 的数据。非常适合提取产品信息、文章元数据或任何自定义数据。

页面交互(Actions)如何使用?

Page Actions 允许您在抓取前与页面交互。您可以:

  • click - 点击元素(如"加载更多"按钮)
  • type - 在输入框中输入文本
  • scroll - 滚动页面
  • wait - 等待元素或指定时间
  • press - 按下键盘按键

这对于 SPA 和懒加载内容的页面非常有用。

Map API 有什么用?

Map API 发现网站的所有 URL。它首先尝试解析 sitemap(/sitemap.xml),如果不可用则回退到浏览器爬取。非常适合在爬取前了解网站结构。

技术问题

你们使用什么浏览器?

我们使用基于 Playwright 的 Chromium,提供一致的高保真渲染,与用户在 Chrome 中看到的效果一致。

会执行 JavaScript 吗?

是的,JavaScript 会完全执行。我们会等待页面完全加载和渲染后再提取内容。

截图最大高度是多少?

全页面截图最高可捕获 16,384 像素高度。

缓存如何工作?

响应默认缓存 1 小时。缓存键由 SHA256(url + options) 计算,因此相同的请求将返回缓存结果。缓存命中时响应中会显示 fromCache: true,且不计入配额。

主内容是如何提取的?

我们使用 Mozilla 的 Readability 算法(与 Firefox 阅读视图相同)来识别和提取主内容,过滤掉导航、广告和其他干扰元素。您可以通过设置 onlyMainContent: false 来禁用此功能,获取完整页面内容。

安全问题

我的 API 密钥安全吗?

API 密钥以 SHA256 哈希形式存储。明文密钥仅在创建时显示一次。请妥善保管密钥,切勿在客户端代码中暴露。

有什么 SSRF 防护措施?

我们阻止所有以下请求:

  • 私有 IP 范围(10.x.x.x、192.168.x.x 等)
  • localhost 和回环地址
  • 云元数据端点(169.254.x.x)
  • 内部 DNS 名称

数据存储在哪里?

抓取的内容缓存在 Cloudflare R2 上,并通过 Cloudflare 的全球 CDN 提供服务。数据在静态和传输中都经过加密。截图在配置的 TTL 后过期。

计费问题

如何计费?

根据您的套餐按月计费。每次 API 调用消耗配额中的额度。缓存命中不计入配额。

接受哪些支付方式?

我们通过支付处理商 Creem 接受所有主要信用卡。

可以退款吗?

月度订阅不可退款,但您可以随时取消。未使用的按量付费额度可在 30 天内退款。

提供发票吗?

是的,发票会自动生成,可在控制台的"账单"中查看。

支持

如何获得帮助?

  • 文档:您正在阅读!
  • 邮件support@anyhunt.app
  • 控制台:使用仪表板中的反馈按钮

正常运行时间 SLA 是多少?

我们的目标是 99.9% 的正常运行时间。访问 status.anyhunt.app 查看实时可用性。

有速率限制吗?

是的,速率限制取决于您的套餐:

  • 免费版:10 请求/分钟
  • 基础版:30 请求/分钟
  • 专业版:60 请求/分钟
  • 团队版:120 请求/分钟

还有其他问题?请联系 support@anyhunt.app