Skip to content
PhantomJS-Skript, dass alle Hyperlinks einer Website auflistet
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
debian
.gitignore
Makefile
README
cut-cache.sh
free-games-on-steam.sh
gadclick.sh
listlinks.js
selenium-listlinks.pl
selenium-listlinks.py
test.html

README

PhantomJS-Skript was alle Hyperlinks einer Website auflistet

Dieses PhantomJS-Skript listet alle Hyperlinks einer Website auf. Wobei
JavaScript und Frames unterstützt werden (AJAX und Popups können noch
ein Problem sein).

    PhantomJS: listlinks.js (Wird aktuell installiert)

Weitere Lösungen mit Selenium

    Perl: selenium-listlinks.pl (Funktioniert noch fehlerhaft)
    Python: selenium-listlinks.py (Funktioniert schon zufriedenstellend)

Die Skripts nutzen z.Z. Firefox, aber Chromium sollte auch funktionieren
(entsprechenden Code aktivieren).

PhantomJS funktioniert z.Z. nicht (könnte aber einzurichten sein):

    Message: Error - Unable to load Atom ‘find_elements’ from file ‘:/ghostdriver/./third_party/webdriver-atoms/find_elements.js’

Installation

To install into your home directory run:

	git clone https://github.com/1nn3/listlinks listlinks
	cd listlinks
	make prefix=$HOME/.local install

To de-install run:

	make prefix=$HOME/.local uninstall

To build a Debian package run:

	debuild

Make sure bindir is in PATH!

free-games-on-steam

Mit dem Skript free-games-on-steam, kann man sich über Gratisaktionen
von Steam informieren lassen (Free Weekend/Free For a Limited Time)

Dazu erstellt man einen Cronjob:
	@hourly free-games-on-steam 2>/dev/null

So bekommt man alle neuen Gratisaktionen via Mail mitgeteilt.

gadclick

Mit dem Skript gadclick, können Werbebanner von Google Ads/Ad Scence
automatisiert anklicken werden. Das funktioniert allerdings nicht
immer/mit allen Websites (Ich tippe mal auf ein Timing-Problem o.ä.).

Dazu erstellt man einen Cronjob:

	SHELL=bash
	@daily at now + $((($RANDOM \% 1440))) minutes >/dev/null 2>&1 % gadclick >/dev/null 2>&1

Um Webseiten ohne bzw. mit abgeschalterter Werbung zu erkennen:

	@monthly comm -1 -3 <(awk '$3==1{print $4}' ~/.cache/gadclick.log|sort -u) <(sort -u ~/.config/gadclick.sites)

Dies verschickt monaltich eine Liste aller Webseiten, auf denen kein
Werbelink erkannt wurde.

Umgebungsvariablen

Das Skript listlinks wertet folgende Umgebungsvariablen aus:

	LISTLINKS_JAVASCRIPT_ENABLED
	LISTLINKS_RESOURCE_TIMEOUT
	LISTLINKS_USER_AGENT

Häufig gestellte Fragen (FAQ)

Was tun beim Fehler E: Fail to load URL: https://example.com?
Mit gesetztem Schalter --debug=true erhält man Details zum Fehler:
	phantomjs --debug=true listlinks.js https://example.com

You can’t perform that action at this time.