Конференции:  3D графика Delphi Игры Бизнес Потрепаться PHP&MySQL QuarkXPress Turbo Pascal WEB-дизайн 
<<<    Конференция "PHP&MySQL"   >>>
PAYN [2010-11-24 02:08:46]
Google PR (pagerank)
Подскажите, как программно узнать гуглевский ПР произвольной страницы произвольного сайта?

ai [2010-11-25 20:12:47]    [1]
При слишком частых запросах придется искать другие гуглевские сервера, кстати.
А код вот

<?php

 include('pagerank.php');

 $pr = getPageRank('
http://www.pagerankcode.com');

 echo 'pagerankcode.com has PR '.$pr;

?>

и сам pagerank.php

<?php

 define('GOOGLE_MAGIC', 0xE6359A60);

 function _zeroFill($a, $b){
   $z = hexdec(80000000);
   if ($z & $a){
     $a = ($a>>1);
     $a &= (~$z);
     $a |= 0x40000000;
     $a = ($a>>($b-1));
   }else
     $a = ($a>>$b);
   return $a;
 }

 function _mix($a,$b,$c){
   $a -= $b; $a -= $c; $a ^= (_zeroFill($c,13));
   $b -= $c; $b -= $a; $b ^= ($a<<8);
   $c -= $a; $c -= $b; $c ^= (_zeroFill($b,13));
   $a -= $b; $a -= $c; $a ^= (_zeroFill($c,12));
   $b -= $c; $b -= $a; $b ^= ($a<<16);
   $c -= $a; $c -= $b; $c ^= (_zeroFill($b,5));
   $a -= $b; $a -= $c; $a ^= (_zeroFill($c,3));
   $b -= $c; $b -= $a; $b ^= ($a<<10);
   $c -= $a; $c -= $b; $c ^= (_zeroFill($b,15));
   return array($a,$b,$c);
 }

 function _GoogleCH($url, $length=null, $init=GOOGLE_MAGIC){
   if(is_null($length))
     $length = sizeof($url);
   $a = $b = 0x9E3779B9;
   $c = $init;
   $k = 0;
   $len = $length;
   while($len >= 12){
     $a += ($url[$k + 0] + ($url[$k + 1] << 8) + ($url[$k + 2] << 16) + ($url[$k + 3] << 24));
     $b += ($url[$k + 4] + ($url[$k + 5] << 8) + ($url[$k + 6] << 16) + ($url[$k + 7] << 24));
     $c += ($url[$k + 8] + ($url[$k + 9] << 8) + ($url[$k + 10] << 16) + ($url[$k + 11] << 24));
     $_mix = _mix($a,$b,$c);
     $a = $_mix[0]; $b = $_mix[1]; $c = $_mix[2];
     $k += 12;
     $len -= 12;
   }
   $c += $length;
   switch($len){
     case 11: $c += ($url[$k + 10] << 24);
     case 10: $c += ($url[$k + 9] << 16);
     case 9 : $c += ($url[$k + 8] << 8);
     case 8 : $b += ($url[$k + 7] << 24);
     case 7 : $b += ($url[$k + 6] << 16);
     case 6 : $b += ($url[$k + 5] << 8);
     case 5 : $b += ($url[$k + 4]);
     case 4 : $a += ($url[$k + 3] << 24);
     case 3 : $a += ($url[$k + 2] << 16);
     case 2 : $a += ($url[$k + 1] << 8);
     case 1 : $a += ($url[$k + 0]);
   }
   $_mix = _mix($a,$b,$c);
   return $_mix[2];
 }

 function _strord($string){
   for($i = 0;$i < strlen($string);$i++)
     $result[$i] = ord($string{$i});
   return $result;
}

 function getPageRank($url){
   $pagerank = -1;
   $ch = "6"._GoogleCH(_strord("info:" . $url));
   $fp = fsockopen("www.google.com", 80, $errno, $errstr, 30);
   if($fp){
     $out = "GET /search?client=navclient-auto&ch=" . $ch . "&features=Rank&q=info:" . $url . " HTTP/1.1\r\n";
     $out .= "Host: www.google.com\r\n";
     $out .= "Connection: Close\r\n\r\n";
     fwrite($fp, $out);
     while (!feof($fp)){
       $data = fgets($fp, 128);
       $pos = strpos($data, "Rank_");
       if($pos === false){
       }else
         $pagerank = substr($data, $pos + 9);
     }
     fclose($fp);
   }
   return $pagerank;
}

?>

выдает от 1 до 10 или -1 (минус 1) при отсутствии ранга страницы.
Или в случае если она не закеширована гуглем.

PAYN [2011-01-26 19:04:36]    [2]
С этим кодом странность имеется.
на локале под апачем работает хорошо, но когда закидываю скрипт на сервер, функция ch() выдает другой код для страниц, и соответственно, всегда получается -1 (минус один)

Prospector [2011-01-27 17:50:19]    [3]
Отдаю свой. 100% рабочий я улыбаюсь

<?php

function stringord($string) {
for($i=0;$i<strlen($string);$i++) {
  $result[$i] = ord($string{$i});
}
return $result;
}
function GoogleCH($url, $length=null) {
$url=stringord($url);
if(is_null($length)) {
$length = sizeof($url);
}
$a = $b = 0x9E3779B9;
$c = 0xE6359A60; # GOOGLE MAGIC
$k = 0;
$len = $length;
while($len >= 12) {
$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
$mix = mix($a,$b,$c);
$a = $mix[0]; $b = $mix[1]; $c = $mix[2];
$k += 12;
$len -= 12;
}

$c += $length;

switch($len) /* all the case statements fall through */
{
case 11: $c+=($url[$k+10]<<24);
case 10: $c+=($url[$k+9]<<16);
case 9 : $c+=($url[$k+8]<<8);
/* the first byte of c is reserved for the length */
case 8 : $b+=($url[$k+7]<<24);
case 7 : $b+=($url[$k+6]<<16);
case 6 : $b+=($url[$k+5]<<8);
case 5 : $b+=($url[$k+4]);
case 4 : $a+=($url[$k+3]<<24);
case 3 : $a+=($url[$k+2]<<16);
case 2 : $a+=($url[$k+1]<<8);
case 1 : $a+=($url[$k+0]);
/* case 0: nothing left to add */
}
$mix = mix($a,$b,$c);
/*-------------------------------------------- report the result */
return $mix[2];
}
function intval_like32($iv)
{
 $i_min=-2147483648;

 if(intval($i_min-1)!=$i_min)
 {

   $iv=intval($iv);
 }
 else
 {

   if($iv!=intval($iv))
   {
     if($iv<0)
     {
       $iv=$iv-intval($iv)*2;
     }
     else  $iv=intval($iv);
   }
 }
 return $iv;
}

function zeroFill($a, $b) {
$a=intval_like32($a);

$z = hexdec(80000000);
if ($z & $a) {
$a = ($a>>1);
$a &= (~$z);
$a |= 0x40000000;
$a = ($a>>($b-1));
} else {
$a = ($a>>$b);
}

return $a;
}

function mix($a,$b,$c) {
$a -= $b; $a -= $c;

$a=intval_like32($a);


$a ^= (zeroFill($c,13));

$b -= $c; $b -= $a; $b=intval_like32($b); $b ^= ($a<<8);
$c -= $a; $c -= $b; $c=intval_like32($c); $c ^= (zeroFill($b,13));
$a -= $b; $a -= $c; $a=intval_like32($a); $a ^= (zeroFill($c,12));
$b -= $c; $b -= $a; $b=intval_like32($b); $b ^= ($a<<16);
$c -= $a; $c -= $b; $c=intval_like32($c); $c ^= (zeroFill($b,5));
$a -= $b; $a -= $c; $a=intval_like32($a); $a ^= (zeroFill($c,3));
$b -= $c; $b -= $a; $b=intval_like32($b); $b ^= ($a<<10);
$c -= $a; $c -= $b; $c=intval_like32($c); $c ^= (zeroFill($b,15));

return array($a,$b,$c);
}
function isurl($strng){
return preg_match('/^http:\/\/[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/i',$strng);
}
### MAIN FUNCTION ###
function getPageRank($url){

$url="info:".((substr(strtolower($url),0,7)!="
http://";) ? "http://".$url : $url);
$GoogleCH=GoogleCH($url);

$url_cont = sprintf("client=navclient-auto&ch=6%u",$GoogleCH);


$url_cont .= "&features=Rank&q=".urlencode($url);
## final url ##
$url = "http://www.google.com/search?".$url_cont;
##

#$url= "www.joeabiraad.com"" target="_blank">http://www.google.com/search?client=navclient-auto&ch=62715026412&features=Rank&q=info%3Ahttp%3A%2F%2Fwww.joeabiraad.com";;;
$f=fopen($url,'r');
$ret=fread($f,1024);

if((stristr($ret,"rank")!==false)&&($res=explode(":",$ret)))
{

  return $res[2];
}
else
{
  return '-1';
}
}
#####################
// Пример:
//echo getPageRank("http://google.com";);

?>


Возвращает от 0 до 9, если страница закеширована гугльом, и -1, если не в кеше гуглища. я улыбаюсь


ПОДПИСАТЬСЯ НА ТЕМУ

E-mail
7+8?



приветя улыбаюсьхадаподмигиваюя тащусьмое почтениесчастливоцелуюбухаемужас
не понялплачуфупечальзлойстесняюсьсогласеннетгыкурю
суперязыкмузонпыворыдаю


Ваше имя: 
     Осталось: 

 

Допускается форматирование текста:
[•B]полужирный[B•] [•I]наклонный[I•] [•U]подчеркнутый[U•] [•‹]URL картинки[›•].
Для кода программ используйте [•¤] код программы [¤•]
Количество открывающих и закрывающих тэгов форматирования текста должно быть равным, иначе форматирование не осуществится.


Adelavida Link       Рейтинг@Mail.ru