Holen von Titel- und Meta-Tags von einer externen Website
In PHP können Sie die Funktion file_get_contents()
verwenden, um den HTML-Code einer Website abzurufen, und dann reguläre Ausdrücke oder eine DOM-Parsing-Bibliothek verwenden, um den Titel und die Meta-Tags zu extrahieren.
Hier ist ein Beispiel mit regulären Ausdrücken:
<?php
$url = "https://www.jsonplaceholder.com";
$html = file_get_contents($url);
preg_match("/<title>(.+)<\/title>/i", $html, $title);
preg_match_all('/<meta .*?name=["\']?([^"\']+)["\']? .*?content=["\']([^"\']+)["\'].*?>/i', $html, $meta);
echo "Title: " . $title[1];
for ($i = 0; $i < count($meta[1]); $i++) {
echo "Meta " . $meta[1][$i] . ": " . $meta[2][$i] . "<br>";
}
Alternativ können Sie eine DOM-Parsing-Bibliothek wie die DOMDocument-Klasse von PHP verwenden:
<?php
$dom = new DOMDocument();
@$dom->loadHTML(file_get_contents($url));
$title = $dom->getElementsByTagName('title')->item(0)->nodeValue;
$meta = $dom->getElementsByTagName('meta');
echo "Titel: " . $title;
foreach ($meta as $tag) {
echo "Meta " . $tag->getAttribute('name') . ": " . $tag->getAttribute('content') . "<br>";
}
Sie können auch ein Paket wie php-web-scraper
in Betracht ziehen, das eine einfache und effiziente Möglichkeit ist, Webseiten auszuschneiden und Informationen zu extrahieren.