29
set

HTTrack – copiando um site

Caso você precise de tirar uma cópia de um site, o HTTrack é a solução. Com uma interface muito simples e prática de se usar, ela ajuda a extrair um site completo ou parcial para poder ser visualizado localmente e OFFLINE. Ele possui versão Windows e Linux, inclusive em Portguês do Brasil.

Exemplo de uso: um professor precisa tirar um Backup de uma Wiki, onde seus alunos atualizam seus trabalhos. No final de cada curso, é tirado um backup do site e arquivado como sendo o trabalho final daquele curso. No próximo semestre os novos alunos continuam a usar a mesma Wiki, fazendo suas atualizações e alterações.

Passo a passo

  1. Baixe e instale a última versão do HTTrack em: http://download.httrack.com/cserv.php3?File=httrack.exe
  2. A instalação é simples e padrão, basta pressionar Next até o final e Finish para finalizar e abrir o aplicativo.
  3. Logo no inicio, escolha a o idioma de sua preferência, apenas depois de reiniciar o aplicativo que o novo idioma entra em vigor.:


  4. Configure o proxy de sua rede, caso não tenha apenas deixe em branco e clique em OK.
  5. Em seguida feche o programa e abra-o novamente, para entrar em vigor o idioma de sua escolha:
  6. Configure seu novo projeto, dando um nome a ele e, se quiser, estabelecendo categorias. Por padrão ele gravará seus sites em C:\Meus Sites:
  7. Entre com a URL do site a ser copiado:
  8. Agora escolha para não conectar automaticamente ao provedor nem desconectar automaticamente, partindo do princípio que de estamos numa rede e não numa conexão discada ou direta a internet:
  9. Pronto, o site está sendo copiado para o seu C:\Meus Sites!
  10. No final a copia do site e o projeto ficam gravados. Se você abrir um projeto já existente, tem a opção de apenas atualizar a cópia do site para não ter que baixa-la novamente por inteiro.
  11. Agora abra seu navegador de preferência (Firefox, Internet Explorer, Google Chrome, etc) e no menu de arquivos peça para abrir um arquivo ao invés de abrir um endereço. Você deve abrir o index.html que fica em C:\Meus Sites.
  12. Seus sites/projetos podem ser visualizados localmente/offline agora. Você pode gravar em PenDrive, CD ou DVD a pasta toda C:\Meus Sites, contendo todos os sites, ou gravar seletivamente cada site, que é representado por uma pasta dentro de C:\Meus Sites. A cada uma destas vai conter um index.html que é o arquivo a ser aberto inicialmente para começar a navegar offline no site gravado.
  13. Agora quando você abrir o HTTrack novamente os projetos já aparecem na lista:
  14. E pode abri-los individualmente pelo arquivo do projeto com extensão .WHTT, na pasta C:\Meus Sites:

Opções Avançadas

Por exemplo, quero gravar o site http://cafe-ti.blog.br e incluir todas os links de referências/citações que ficam no final de cada artigo, apontando para referências em Wikis e outros sites EXTERNOS ao Cafe-Gourmet:

  • Clique em “Definir as opções”, botão na página de URLs como no passo 7.
  • Defina 1, para Máximo de profundidade externa:

Agora além de acessar o Cafe-Gourmet localmente, posso seguir as referências clicando nelas. Ou seja, ele baixou a primeira página de cada link externo para o projeto local.

Existem várias outras opções nesta página, como a Profundidade máxima no próprio site, velocidade máxima de transferência, para não congestionar um link de internet, e em Filtros excluir ou incluir tipos de arquivos a serem baixados do site. Se você quiser baixar um site que possui muitos downloads de músicas, por exemplo, você pode filtrar todos os arquivos MP3 para eles não serem baixados, baixando apenas o site em si.

Dicas e Observações:

  • Ao tentar gravar a Wiki de meu cliente, tive que usar a URL para qual o navegador foi redirecionado ao invés de usar o URL principal de entrada.
    Por exemplo: Ao entrar em http://www.wikixxx.com.br/curso08 sou automaticamente redirecionado para
    http://www.wikixxx.com.br/curso08/index.php/Pagina_principal, por isso devo usar o segundo URL no HTTrack, não o primeio.
  • Configurações diversas:

Linux:

  • Basicamente a mesma coisa, mas o httrack em si é uma ferramenta de linha de comando. Para usar o ambiante gráfico use o webhttrack que é via web. Inicie o webhttrack pelo menu de Programas/Internet e use http://localhost:8080 para entrar em seu WebHTTrack. httrack e webhttrack podem ser encontrados na lista de Adicionar/Remover Programas do Ubuntu.

Links e Refs:

Alroger Filho

4 Responses to “HTTrack – copiando um site”

  1. 1
    Leusenice Says:

    Olá, estou com problemas para copiar sites com Active X usanto o httrack. Tenho o Vista e gostaria de saber como posso ter sucesso no processo.
    Uns dos sites que não consigo copiar e o http://www.conjugador.com.br/
    Agradeço se puderem me orientar.

  2. 2
    Alroger Filho Says:

    Hmmm, desculpe, Leusenice, mas há muitos anos que faço questão de não usar o Internet Explorer, mais ainda o ActiveX.
    Lembre-se que copiar um site, não quer dizer que você está copiando algum banco de dados do site. Não é possível copiar o banco de dados.
    Pelo que vi no site conjugador, ele não tem páginas prontas que você pode copiar. Ele é uma pesquisa de banco de dados. Talvez seja este o seu problema.
    O HTTrack é feito para copiar paginas e imagens.

  3. 3
    Renan Gustavo Says:

    Show de bola cara, tava errando sempre e não entendia… apenas tinha esquecido de coloca o proxy correto, que dá pra olhar no próprio navegador do PC que vai baixar, em configurações – opções da internet – conexões de lan

  4. 4
    Renan Gustavo Says:

    Claro… esqueci de escrever que isto vale para o IE, outros navegadores mostram o proxy mas por caminhos diferentes, coloquei este porque é o básico e está na instalação de todos os windows.

Leave a Reply

© 2014 Cafe TI – pra perder o sono. | [RSS] Artigos and [RSS] Comentários

Design by Web4 Sudoku - Powered By Wordpress