Vraag & Antwoord

Webprogrammeren & scripting

WebSpider bot

Anoniem
bobvdvalk
2 antwoorden
  • Beste lezers,

    Ik kamp een beetje met een probleem waar ik nog geen oplossing heb gevonden ik heb hier een simpele bot gemaakt die na invoer van een url de inhoud in de database zet.

    Hier onder de code:
    [code:1:e01710c8ac]<?php
    if($_POST['submit'] == "Indexeren") {
    $url = $_POST['url'];
    $input_url = mysql_real_escape_string($url);
    $data = file_get_contents($url);
    $input_data = mysql_real_escape_string($data);
    include 'data/connect.php';
    $sql = "INSERT INTO `bot_test` (`index`, `url`) VALUES ('$input_data', '$input_url')";
    mysql_query($sql) or die("mysql_error ". mysql_error());
    echo '<h1>Site succesvol geindexeerd!!</h1>';
    echo '<a href=".">Ga terug naar search!</b>';
    }else{
    ?><form action="" method="post">
    Site: <input type="text" name="url" size="40" /><input type="submit" value="Indexeren" name="submit" />
    </form>
    <?php }; ?>[/code:1:e01710c8ac] Maar nou wil ik eigelijk als die de website indexeerd dat ie de meta tags apart invoert in de database.

    Heeft iemand een idee hoe ik dit zou kunnen doen?

    Alvast bedankt :D
  • Als het xml zou zijn, zou het makkelijker zijn toch? Dan haal je er zo de meta nodes uit. Het mooie is, html is xml. Ik zou het dus inladen als xml en vervolgens zo de meta tags eruit halen.

    http://php.net/manual/en/book.simplexml.php

    Succes!

Beantwoord deze vraag

Dit is een gearchiveerde pagina. Antwoorden is niet meer mogelijk.