Как скачать сайт целиком в HTTrack Website Copier

Как скачать сайт целиком в HTTrack Website Copier

Рассматриваемая в обзоре программа HTTrack Website Copier для загрузки сайта в наше время уже не настолько востребована, как раньше. В наше время высокая скорость и безлимитный Интернет позволяет просматривать любые сайты. А не так давно многим пользователям было удобнее скачать сайт целиком и просматривать его локальную копию на своём компьютере без подключения к Интернету. Однако во многих случаях, например, для изучения структуры сайта, утилита HTTrack Website Copier может пригодиться и сейчас. Программа позволяет загружать сайт в соответствии с заданными правилами и сохранять его локальное зеркало на нашем компьютере.

Перед тем, как начнётся скачивание сайта, необходимо создать в HTTrack Website Copier проект, где мы определим все параметры загрузки. Жмём кнопку [Далее] в окне программы.

Окно приветствия в HTTrack Website Copier

В поле Имя нового проекта вводим название проекта, также указываем категорию и Каталог, где будет сохраняться загружаемая информация. Если проект уже был создан ранее, его можно выбрать в списке для продолжения загрузки или изменения параметров.

Настройка имени проекта в HTTrack Website Copier

На следующем этапе потребуется указать адрес загружаемого сайта (или несколько ссылок), а также выбрать способ загрузки. HTTrack Website Copier поддерживает несколько способов: загрузка сайтов, загрузка отдельных файлов, всех сайтов с указанной страницы, тестирование ссылок со страницы, продолжение прерванной загрузки или обновление существующей закачки. Список загружаемых сайтов можно составить и сохранить в текстовой файл, после чего указать его в поле URL list (.txt).

Настройка адресов загружаемых сайтов в HTTrack Website Copier

Кнопка [Задать параметры…] открывает массу дополнительных параметров загрузки сайта. Здесь можно указать прокси-сервер, каким браузером будет идентифицировать себя HTTrack Website Copier, определить нижний колонтитул на HTML-страницах, настроить параметры логов и кеширования. Кстати, в программе «кривой перевод», поэтому все пункты меню, где встретится слова «мода», его нужно рассматривать как «режим», например: «Мода сканирования» — «Режим сканирования».

Ещё несколько параметров рассмотрим подробнее. Вкладка Фильтры позволяет ограничить загрузку нежелательных типов файлов. Например, чтобы исключить мелкие картинки (баннеры, иконки, аватарки) формата GIF, можно ввести «-*.gif». Для включения в загрузку определённых типов файлов указываем маску со знаком +. Программа позволяет создавать и более гибкие правила, в том числе файлы или каталоги, в имени которых есть указанный текст, ссылки с указанных доменов, или содержащие указанный текст и т.д.

Фильтры для ограничения загружаемых данных в HTTrack Website Copier

Вкладка Ограничения поможет настроить такие параметры, как Максимальная глубина, это количество уровней ссылок. Например, при значении, равном 2, HTTrack Website Copier скопирует главную страницу сайта и страницы, которые открываются по ссылкам с неё. Параметр Максимальная глубина внешних ограничивает уровень сканирования и закачки других сайтов, ссылки на которые могут быть на загружаемом сайте. Здесь же задаются ограничения на размер загружаемых html- и других страниц, максимальный размер сайта, время и скорость загрузки. Выбрать представление структуры загружаемого сайта можно во вкладке Структура.

По завершении настроек можно сразу запустить закачку сайта или отложить её на потом. Во время загрузки сайта отображается сканируемая страница или папка, а также скорость соединения, загрузки, размер сохранённой информации, количество просканированных и сохранённых страниц/каталогов. Прервать загрузку сайта в HTTrack Website Copier можно нажатием кнопки [Отмена]. Лог закачки поможет получить информацию о загруженных страницах и файлах.

Экран загрузки сайта в HTTrack Website Copier

Чтобы просмотреть загруженный сайт, жмём кнопку [Просмотр зеркала], после чего локальная копия сайта загружается в браузере. Для этого даже не требуется подключение к интернету. Обратим внимание, все ссылки на сайте HTTrack Website Copier подменяет на локальные, благодаря чему возможна навигация по сайту:

Измененный адрес ссылки в локальной копии сайта


Характеристики:
Язык интерфейса: русский, английский и др.
ОС: Windows 2000, XP, Vista, 7
Размер файла: 3,8 Мб
Лицензия: бесплатная

23158
Foma4567
14:57
Кстати, по умолчанию HTTrack чувствителен к файлу [b]robots.txt[/b] - указанные в роботе страницы/картинки загружать не будет.
В настройках - (Качалка) [b]spider[/b] нужно указать - "[i]не подчиняться правилам robots.txt[/i]", тогда сайт загрузится целиком.
*04
Гость ПК-гида
07:42
Foma4567, Спасибо!!!
долго тормозил :(
По умолчанию HTTrack чувствителен к файлу robots.txt - указанные в роботе страницы/картинки загружать не будет.
В настройках - (Качалка) spider нужно указать - "не подчиняться правилам robots.txt", тогда сайт загрузится целиком.
Гость ПК-гида
16:26
Подскажите,пожалуйста,если закачка прервана, не указала папку куда скачать,но зеркало смотрела,программу удалила,то в компе часть закачки остается или нет.Где посмотреть не знаю! "чайник"
Гость ПК-гида
12:40
А у меня при закачке сайта пишет, что текущее зеркало пусто. И не скачивает ни один сайт:(
Serga
08:31
Спасибо! пока не указал этот параметр качалась только главная страничка!!!
zie
16:03
Forma4567 респект!!!
Загрузка...