Crea una copia speculare offline di un sito con Wget su Windows e Linux
A volte è necessario ottenere una copia sfogliabile di un sito Web, in modo da poterlo accedere offline, inserirlo su una chiavetta USB o persino caricarlo sul proprio smartphone e leggerlo durante il volo o in viaggio. Sebbene sia facile nei browser e nei sistemi operativi moderni salvare una pagina Web in PDF, può essere fastidioso elaborare ogni singola pagina. Ecco che arriva wget.
Pubblicità
Wget è un download manager open source. È un'app console sviluppata principalmente per Linux, ma trasferita con successo su altri sistemi operativi, inclusi Windows e MacOS.
err_connection_refused windows 10
Se non hai familiarità con wget, dovresti assolutamente provarlo. È molto potente. Consente il recupero di file da siti Web utilizzando HTTP, HTTPS e FTP, i protocolli Internet che stiamo utilizzando in questi giorni. Il suo comportamento è controllato dagli argomenti della riga di comando.
Wget supporta una varietà di opzioni per recuperare i file su connessioni lente o instabili, inclusi i tentativi, continuare da dove era rimasto e altro ancora. Supporta il file 'robots.txt', quindi può funzionare come un web crawler. Può recuperare solo file modificati, supporta caratteri jolly, limiti di tipi di file ed estensioni regolari.
Wget supporta il recupero ricorsivo di siti Web HTML e server FTP, consentendo di creare un sito Web mirror. Ecco come si può fare.
Prima di procedere, è necessario scaricare l'app wget.
Ottieni Wget su Windows
Di solito uso i binari da queste fonti:
Entrambi fanno il loro lavoro.
Ottieni Wget su Linux
Usa il gestore di pacchetti della tua distro. Alcuni esempi (run loro come radice ):
Debian / Ubuntu / Mint:
apt installa wget
CentOS / Redhat
yum installa wget
Arch Linux
pacman -Sy wget
Annulla Linux
xbps-install -S wget
Per creare una copia offline di un sito con Wget,
- Aperto prompt dei comandi / terminale .
- Su Windows, digita il percorso completo del file wget.exe.
- Su Linux, digita solo wget.
- Ora, digita i seguenti argomenti per ottenere il seguente comando:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Sostituisci il
https://site-to-download.com
parte con l'URL del sito effettivo di cui desideri creare un mirror.
Hai fatto!
Ecco gli interruttori che utilizziamo:
--specchio
- applica una serie di opzioni per rendere ricorsivo il download.-no-genitore
- Non eseguire la scansione della directory principale per ottenere solo una parte del sito.--convert-link
- fa in modo che tutti i collegamenti funzionino correttamente con la copia offline.--page-requisites
- scarica i file JS e CSS per mantenere lo stile della pagina originale durante la navigazione in un mirror locale.--adjust-extension
- aggiunge le estensioni appropriate (ad esempio html, css, js) ai file se sono state recuperate senza di esse.
Questo è tutto.