インストール
Rust 1.70以降が必要です。
使用方法
- firecrawl.dev でAPIキーを取得します
- APIキーを
FIRECRAWL_API_KEYという名前の環境変数に設定するか、Client::new(...)に直接渡します
URLのスクレイピング
scrapeメソッドを使用します。
JSON抽出
scrape_with_schema を使用して、構造化されたJSONを抽出します:
ScrapeOptions で直接 JSON 抽出を設定することもできます:
アップロードしたファイルの解析
parse を使うと、ローカルファイル (.html、.htm、.pdf、.docx、.doc、.odt、.rtf、.xlsx、.xls) を multipart form data として /v2/parse にアップロードできます。この endpoint は、指定したフォーマットを含む Document を返します。
ParseOptions では、/v2/parse が受け付けないスクレイピング専用のフィールド (actions、waitFor、location、mobile、screenshot、branding、changeTracking など) を意図的に除外しています。
メモリ上のバイト列、またはパスから直接 ParseFile を作成します。
ParseFile
| Constructor | 説明 |
|---|---|
ParseFile::from_bytes(filename, bytes) | ファイル名とメモリ上のバイト列から生成 |
ParseFile::from_path(path) | ディスクからバイト列を読み込み、ファイル名を取得 |
.with_content_type(content_type) | MIME タイプのヒントを付与 (例: text/html, application/pdf) |
ParseOptions
formats: Vec<ParseFormat>—Markdown、Html、RawHtml、Links、Images、Summary、Json、Attributesのいずれかonly_main_content: boolinclude_tags: Vec<String>/exclude_tags: Vec<String>headers: HashMap<String, String>timeout: u32(ms)parsers: Vec<ParserConfig>(例: PDF パーサーの設定)skip_tls_verification: boolremove_base64_images: boolfast_mode: boolblock_ads: boolproxy: ParseProxyType(BasicまたはAuto)json_options: JsonOptionsattribute_selectors: Vec<AttributeSelector>zero_data_retention: boolintegration: String,origin: String,use_mock: String
Web サイトのクロール
crawl を使用します。
クロールを開始する
start_crawl を使うと、待たずにジョブを開始できます。
クロールのステータスを確認
get_crawl_statusでクロールの進行状況を確認できます。
クロールをキャンセルする
cancel_crawl でキャンセルできます。
クロールエラーの確認
get_crawl_errors でクロールジョブのエラーを取得します。
Web サイトをマッピングする
map を使用して Web サイト内のリンクを見つけます。
map_urls を使用します:
Webを検索する
search を使うと、任意の設定で検索できます。
バッチスクレイピング
batch_scrape を使用して、複数のURLを並列でスクレイピングします。
Agent
agent を使って AI エージェントを実行します。
スクレイピングに紐づいたインタラクティブセッション
interact(...)は、スクレイピングに紐づいたブラウザセッション内でコードまたはプロンプトを実行します。stop_interaction(...)は、作業完了後にインタラクティブセッションを停止します。
設定
Client::new(...) と Client::new_selfhosted(...) でクライアントを作成します。
| Option | Description |
|---|---|
Client::new(api_key) | Firecrawl のクラウドサービス (https://api.firecrawl.dev) 用のクライアントを作成します |
Client::new_selfhosted(api_url, api_key) | セルフホストの Firecrawl インスタンス用のクライアントを作成します |
環境変数
FIRECRAWL_API_KEY 環境変数を設定してください。
ポーリング間隔
crawl、batch_scrape、agent) は、完了するまでポーリングを続けます。ポーリング間隔は、options 構造体でカスタマイズできます。
エラー処理
Error、Debug、Display を実装する FirecrawlError 列挙型を使用します。すべてのメソッドは Result<T, FirecrawlError> を返します。
Firecrawl API キーを必要とする AI エージェントですか?自動オンボーディング手順については、firecrawl.dev/agent-onboarding/SKILL.md を参照してください。

