Wenn Sie eine ganze Website herunterladen möchten, können Sie das rekursive Download-Modul verwenden und die maximal zulässige Tiefe auf eine angemessene Anzahl erhöhen (in diesem Beispiel nicht so vernünftig mit 50, aber was auch immer): ! Sorry, dass man nur links zu einem Artikel darüber, hier ist die tatsächliche App: websitedownloader.io In diesem Beispiel werden wir 3 Seiten der node.js Website (Index, über und Blog) in der URLs-Eigenschaft angegeben herunterladen. Der Inhalt wird im Knoten-Website-Ordner (in dem das Skript ausgeführt wird) gespeichert, wenn er nicht vorhanden ist, wird er erstellt. Um organisierter zu sein, werden wir jede Art von Ressourcen manuell in verschiedenen Ordnern (Bilder, Javascript, css und Schriftarten) sortieren. Die sources-Eigenschaft gibt mit einem Array von Objekten an, die geladen werden sollen, gibt Selektoren und Attributwerte an, um Dateien zum Laden auszuwählen. Ich versuche, den Inhalt von css-Dateien einer Website zu erhalten…. Alle Skripte, Stylesheets wurden heruntergeladen und die Website funktioniert wie ein Charme. Beachten Sie, dass der einzige Fehler, der in der Konsole angezeigt wird, auf das Analyseskript von Google zurückzuführen ist, das Sie offensichtlich manuell aus dem Code entfernen sollten. Um diese mit der rechten Maustaste anzuklicken, klicken Sie auf Seiteninformationen anzeigen. Klicken Sie auf diesem Bildschirm auf die Registerkarte «Medien». Auf dieser Registerkarte werden alle einzelnen Bilder von dieser Seite aufgelistet, einschließlich der Bilder im Stylesheet. Wählen Sie alle Bilder in diesem oberen Feld aus und klicken Sie dann auf Speichern unter… und speichern Sie sie in demselben Ordner, in dem die «Webseite, Komplett» alle Ihre Bilder abgelegt hat. Auf der jeweiligen Website sehen Sie nicht, was Sie erwartet haben, weil sie eine ungewöhnliche Technik namens @import verwendet haben, um mehrere Stylesheets in eins zu laden.

Im Allgemeinen ist Ihre Methode richtig — paceoil.ca/files/includes/templates-css-main.css ist in der Tat ein Link zu ihrem Stylesheet. Der einfache Weg: Verwenden Sie dieses Ein-Klick-Download-Website-Tool Wenn Sie w3.css an der Wurzel Ihres Webs platzieren, fügen Sie einen Schrägstrich hinzu: Was wäre besser, als den gesamten Code zu haben, der das tolle Widget erstellt und bearbeiten Sie es, wie Sie wollen (was Ihnen helfen wird, zu verstehen, wie das Widget funktioniert). Das ist genau das, was Sie in diesem Artikel lernen werden, wie Sie eine ganze Website über ihre URL mit Node.js mit einem Web-Scraper herunterladen. Web Scraping (auch Screen Scraping, Web Data Extraction, Web Harvesting usw.) ist eine Technik, die verwendet wird, um große Datenmengen von Websites zu extrahieren, bei denen die Daten extrahiert und in einer lokalen Datei auf Ihrem Computer oder in einer Datenbank im Tabellenformat gespeichert werden. Stellen Sie sich vor, Dass Sie nicht nur bestimmte Webseiten von einer Website benötigen, sondern alle Seiten davon. Eine Möglichkeit, es zu tun, ist, das vorherige Skript zu verwenden und manuell jede URL der Website anzugeben, die Sie bekommen können, um es herunterzuladen, aber dies kann kontraproduktiv sein, weil es viel Zeit in Anspruch nehmen wird und Sie wahrscheinlich einige URLs übersehen werden. Aus diesem Grund bietet Scraper die rekursive Download-Funktion, mit der Sie alle Links von einer Seite und die Links von dieser Seite und so weiter verfolgen können. Offensichtlich würde dies zu einer sehr langen (und fast unendlichen) Schleife führen, die Sie mit der maximal zulässigen Tiefe begrenzen können (maxDepth-Eigenschaft): Es ist z. B.

die Verknüpfung von css ref von paceoil.ca/.