`@d-zero/replicator`

ウェブページとそのリソースをレスポンシブ画像対応でローカルディレクトリに複製するツールです。複数のURLを並列処理し、効率的にリソースを取得します。

インストール

``bash npm install @d-zero/replicator`

`使い方`

`$3`

`bash npx @d-zero/replicator -o [options]`

#### オプション

- --version: バージョンを表示（注: -vは--verboseのエイリアス） --o, --output

: 出力ディレクトリ（必須）
-

-t, --timeout

: リクエストタイムアウト（ミリ秒、デフォルト: 30000）
-

-d, --devices

: デバイスプリセット（カンマ区切り、デフォルト: desktop-compact,mobile）
-

-l, --limit

: 並列処理数の上限（デフォルト: 3）
-

--interval

: 並列実行間の間隔（デフォルト: なし）
  - 数値または"min-max"形式でランダム範囲を指定可能
-

--only : ダウンロード対象を限定（page または resource

）
-

-v, --verbose: 詳細ログモード

##### --only オプション

- page: HTMLページのみをダウンロード（リソーススキャンをスキップして高速化） -resource: リソース（CSS、JS、画像など）のみをダウンロード（HTMLページを除外） - 未指定: すべてのファイルをダウンロード（デフォルト動作）

#### 利用可能なデバイスプリセット

- desktop: 1400px幅 -tablet: 768px幅 -mobile: 375px幅（2倍解像度） -desktop-hd: 1920px幅 -desktop-compact: 1280px幅 -mobile-large: 414px幅（3倍解像度） -mobile-small: 320px幅（2倍解像度）

#### 使用例

`bash

`単一URL（デフォルトデバイス: desktop-compact, mobile）`


npx @d-zero/replicator https://example.com -o ./output
複数URLを並列処理

npx @d-zero/replicator https://example.com/page1 https://example.com/page2 -o ./output
並列数を制限

npx @d-zero/replicator https://example.com/page1 https://example.com/page2 -o ./output --limit 2
カスタムデバイス指定

npx @d-zero/replicator https://example.com -o ./output --devices desktop,tablet,mobile
タイムアウト指定

npx @d-zero/replicator https://example.com -o ./output --timeout 60000
HTMLページのみダウンロード（高速）

npx @d-zero/replicator https://example.com -o ./output --only page
リソースのみダウンロード（HTMLを除外）

npx @d-zero/replicator https://example.com -o ./output --only resource

$3

`typescript import { replicate } from '@d-zero/replicator';

// 単一URL await replicate({ urls: ['https://example.com'], outputDir: './output', });

// 複数URLを並列処理 await replicate({ urls: [ 'https://example.com/page1', 'https://example.com/page2', 'https://example.com/page3', ], outputDir: './output', limit: 2, // 最大2つのURLを同時処理 });

// カスタムデバイス await replicate({ urls: ['https://example.com'], outputDir: './output', devices: { desktop: { width: 1400 }, mobile: { width: 375, resolution: 2 }, }, timeout: 30000, verbose: true, });

// HTMLページのみダウンロード await replicate({ urls: ['https://example.com'], outputDir: './output', only: 'page', });

// リソースのみダウンロード await replicate({ urls: ['https://example.com'], outputDir: './output', only: 'resource', });`

`機能`

- 並列処理: 複数のURLを並列で効率的に処理 - メモリ効率: リソースを直接ディスクに保存してメモリ使用量を最小化 - 選択的ダウンロード:--onlyオプションでHTMLページのみまたはリソースのみをダウンロード可能 - レスポンシブ画像対応: 複数のデバイス幅で要素やメディアクエリのリソースを取得 - 遅延読み込み対応: ページを自動スクロールしてloading=lazyやIntersectionObserver`ベースのコンテンツを取得
- マルチデバイスシミュレーション: 様々なデバイス幅と解像度をシミュレートして包括的なリソース取得を実現
- HTMLページのディレクトリ構造を保持してダウンロード
- 関連するすべてのリソース（CSS、JS、画像など）を取得
- リソース間の相対リンクを維持
- 同一ホストのリソースのみサポート（複数ホストが検出された場合はエラー）
- 元のファイル拡張子とパスを保持

License

MIT