Holen von Titel- und Meta-Tags von einer externen Website

In PHP können Sie die Funktion file_get_contents() verwenden, um den HTML-Code einer Website abzurufen, und dann reguläre Ausdrücke oder eine DOM-Parsing-Bibliothek verwenden, um den Titel und die Meta-Tags zu extrahieren.

Hier ist ein Beispiel mit regulären Ausdrücken:

<?php

$url = "https://www.jsonplaceholder.com";
$html = file_get_contents($url);
preg_match("/<title>(.+)<\/title>/i", $html, $title);
preg_match_all('/<meta .*?name=["\']?([^"\']+)["\']? .*?content=["\']([^"\']+)["\'].*?>/i', $html, $meta);

echo "Title: " . $title[1];
for ($i = 0; $i < count($meta[1]); $i++) {
  echo "Meta " . $meta[1][$i] . ": " . $meta[2][$i] . "<br>";
}

Alternativ können Sie eine DOM-Parsing-Bibliothek wie die DOMDocument-Klasse von PHP verwenden:

<?php

$dom = new DOMDocument();
@$dom->loadHTML(file_get_contents($url));
$title = $dom->getElementsByTagName('title')->item(0)->nodeValue;
$meta = $dom->getElementsByTagName('meta');

echo "Titel: " . $title;
foreach ($meta as $tag) {
  echo "Meta " . $tag->getAttribute('name') . ": " . $tag->getAttribute('content') . "<br>";
}

Sie können auch ein Paket wie php-web-scraper in Betracht ziehen, das eine einfache und effiziente Möglichkeit ist, Webseiten auszuschneiden und Informationen zu extrahieren.