MASIGNCLEAN101

Baixando Sites (arquivos) com o comando WGET

O wget é um programa inicialmente criado para o ambiente Unix/Linux, que tem como objetivo principal é baixar arquivos da internet. O que facilita a programação de aplicações, é o fato dele poder ser usado em scripts.

Usando alguns argumentos você se torna capaz de baixar  tipos diferentes de arquivos em sites, baixar totalmente o site em si, arquivos que estão hospedado nele, vídeos entre outras coisas.

Tenha em mente que baixar sites inteiros pode prejudicar os mesmos. Além dos sites em si, essa tarefa que pode consumir muita banda de download deles, você pode acabar prejudicando outros sites que estejam hospedados no mesmo servidor. Use com racionalidade!

Temos abaixo um vídeo explicando alguns argumentos básicos que podem te ajudar no dia a dia.



Sintaxe dos comandos

wget -r = baixar todo o siste

wget -m = faz um mirror (espelhamento) do site

wget -r -A “.jpg” = baixar filtrando apenas o que está entre aspas

wget -r erobots=off = quando quiser baixar um arquivo linkado mas que não esteja disponível para ser indexado pelos buscadores (via robots)

Fonte: Blog Seja Livre
Compartilhe esse artigo!
Marcus Vinicius
escreve para o Mundo Informal sob a licença Creative Commons BY-SA 3.0. Você pode usar e compartilhar este conteúdo desde que credite o autor e veículo original do mesmo.
Seja livre para expor seu pensamento!

Se preferir, antes leia nossa política para comentários...
Atenção: Comentários "Anônimo" não serão publicados. Escolha "Nome/URL". Obrigado!