Skip to content
AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext.
AutoIt
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.

Files

Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
LICENSE
README.md
_HTML.au3

README.md

_HTML

Übersicht

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext, mit folgenden Funktionen:

Funktion Beschreibung
_HTML_ExtractURLVar Extrahiert eine URL-Variable aus einer URL.
_HTML_Get Liefert einen Wert, anhand Verschiedener Atrribute wie: class, id, title usw.
_HTML_GetAllLinks Gibt ein Array mit allen Links zurück.
_HTML_GetImageSrc Gibt die Quelle eines Bildes zurück.
_HTML_GetLink Gibt ein URL zurück, die den Parametern entspricht.
_HTML_GetSource Liefert den Quelltext einer Seite zurück. Scripte werden herausgefiltert.
_HTML_GetTable Liefert den Inhalt einer Tabelle als 2D-Array.
_HTML_GetText Gibt den reinen Text eines Bereiches zurück.
_HTML_GetURLVar Liefert eine URL-Variable aus einer URL.
_HTML_ImageSave Speicher das angebene Bild ab.
_HTML_Search Durchsucht den reinen Text einer Quelle.

Globale Suchparameter:

$_HTML_SEARCHMODE = 1
;(RegExp: 0 = Compare / 1 = Substring) (String: 2 = Compare / 3 = Substring)

Voraussetzungen

AutoIt

Installation

In das AutoIt Include Verzeichnis kopieren.

Diskussion / Vorschläge

...

ToDo

Die Reihenfolge entspricht keiner Priorität.

  • Funktion zum Auslesen von Tabellen verbessern.

Author

Thorsten Willert

Homepage

Lizenz

Das ganze steht unter der Apache 2.0 Lizenz. .

You can’t perform that action at this time.