2008年09月07日

wgetでwebサイトを丸ごとダウンロードする場合は・・

 
 

 例えばオフラインでウェブサイトを見るためにwebサイトを全てダウンロードしたい場合、wgetなら以下の様にすることでうまく解決できます。

$ wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.website.org/tutorials/html/

 このコマンドでwww.website.org/tutorials/html/のファイルを全て取得することができます。

* --recursive: 関連する全てのウェブサイトを保存する
* --domains website.org: webside.org以外のlinkの先を保存しない
* --no-parent: 親ディレクトリ(上位階層)のリンク先を保存しない
* --page-requisites: 画像やCSS等、ウェブサイトを構成する全ての要素を収集する
* --html-extension: HTML ファイルに拡張子 ".html" を付加する
* --convert-links: HTML 中のリンクを相対指定に書き換える。つまりローカルで読めるようになる
* --restrict-file-names=windows: Windowsでも快適に読めるようにファイルネームを修正する
* --no-clobber: 既に存在しているファイルを上書きしない

__________________________
 


 ■参考記事
 ・Downloading an Entire Web Site with wget
 ・wget で認証付きサイトをダウンロードする
posted by ぴぺ at 08:12| Comment(1) | TrackBack(0) | ソフト | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
wgetでwebサイトを丸ごとダウンロードする場合は・・: アメコロガシ
Posted by gucci 銀座 at 2013年07月21日 12:39
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。