Salut
Ca sa obtii ultimul cache al unei pagini indexate pe Google, se face cautare cu aceasta formula:
cache:domeniu.tld/pagina_site
Sau apelezi direct in browser:
http://webcache.googleusercontent.com/search?q=cache:adresa_url_fara_http
De exemplu, in bara de adrese:
http://webcache.googleusercontent.com/search?q=cache:marplo.net/php-mysql/
- Pagina returnata contine data ultimului cache.
Poti scrie un script PHP care sa preia pagina de la adresa:
http://webcache.googleusercontent.com/search?q=cache:adresa_url_fara_http
cu file_get_contents() sa cUrl. Te uiti in codul paginii HTML unde e acea data si o extragi cu preg_match() si RegExp.
Pentru Page Rank, e un script aici:
Script Page Rank.
In codul PHP de mai jos e un exemplu cu o functie ce returneaza un array cu 2 elemente:
- 'pg_cache' = contine codul HTML al paginii in cache
- 'dt_cache' = contine data ultimului cache al acelei pagini
Cod: Selectaţi tot
<?php
/* $pg is the URL address of your page (without http://)
returns an array with 2 elements:
- 'dt_cache' = date and time of last cache
- 'pg_cache' = HTML code of the page in cache
*/
function googleCache($pg) {
// get datetime of last google cache ( http://www.coursesweb.net/ )
$re = array('dt_cache'=>'', 'pg_cache'=>'');
// gets the page from Google
$page = file_get_contents('http://webcache.googleusercontent.com/search?q=cache:'.$pg);
// extract the date/time of the cache
if(preg_match('/snapshot of the page as it appeared on ([a-z0-9 :]+) GMT/i', $page, $mdc)) {
$re['dt_cache'] = 'Date-time of the last cache: '. $mdc[1];
}
// extract the HTML code of the page in cache
if(preg_match('#\<div style="position:relative"\>([\s\S]+)#i', $page, $mpc)) {
$re['pg_cache'] = $mpc[1];
}
return $re;
}
// Test
$pg = 'www.coursesweb.net/html/'; // URL address of page (without http://)
$g_cache = googleCache($pg); // get the array with 'dt_cache' and 'pg_cache'
echo $g_cache['dt_cache'];
// if you want to output the page
// echo $g_cache['pg_cache'];
?>
- Datele ar trebui retinute intr-un fisier sau tabel in baza de date, si de acolo preluate cand e vizitata pagina. Ca sa nu acceseze site-ul tau acele adrese de google la fiecare vizita, fiindca va fi considerat spam si poate sa blocheze ip-ul site-ului.
Iar datele le poti actualiza o data pe zi in fisier sau baza de date.