============================================Sphider - um Search Engine de pouco peso em PHPVersão 1.2.xInstruções da instalação e do usoAndo Saabas 2005============================================------------Documentação------------ 1. Instalação 2. Opções de Indexing 3. Customizing 4. Indexing da comando-linha 5. Mantendo páginas do índice * Robots.txt * Deve incluir/não deve incluir a lista da corda * Ignorando as ligações * Ignorando partes de uma página1. Instalação1. Desembalar as limas, e copí as ao usuário, por exemplo a /home/youruser/public_html/sphider (consultado mais tarde a como [path_of_sphider])2. No usuário, criar uma base de dados em MySQL para prender dados de Sphider.a) no tipo do alerta de comando (ao registro em MySQL):mysql - username> do do do php spider.php onde o está- todos Reindex tudo na base de dados- o de u ajustou o URL ao índice- profundidade ajustada do indexing de f completamente (profundidade ilimitada)- profundidade ajustada do indexing do de d ao - l permite que a aranha saa do domínio inicial- aranha ajustada de r para reindex um local- o de m ajustou as cordas que um URL deve incluir (uso \ n como um delimitador entre cordas múltiplas)- o de n ajustou as cordas que um URL não deve incluir (uso \ n como um delimitador entre cordas múltiplas)Por exemplo, para spidering e posicionar http://www.domain.com/test.html à profundidade 2, usophp spider.php - u http://www.domain.com/test.html - d 2Se você quiser reindex o mesmo URL, usarphp spider.php - u http://www.domain.com/test.html - r 5. Mantendo páginas do índice* Robots.txtA maneira a mais comum impedir que as páginas estejam posicionadas está usando o padrão de robots.txt, por qualquer um que põe uma lima de robots.txt no o diretório de raiz do usuário, ou de adicionar o meta necessário etiqueta nos encabeçamentos da página (para mais informação em como a fazer isto, ver aqui).* Deve incluir/não deve incluir a lista da cordaAs sustentações poderosas de um Sphider da opção estão definindo a devem incluir/não devem incluir a lista da corda para um local (estalar opções dentro sobre avançadas Posicionar a tela para isto). Todo o URL que não contem uma corda no “deve incluir” a lista é ignorado, como ser urls que contêm cordas em 'não deve lista do include. Todas as cordas na lista da corda devem ser separadas por um newline (entrar). Por exemplo, para impedir um forum em seu local de sendo posicionado, você pôde adicionar www.yoursite.com/forum ao “não deve incluir” a lista. Isto significa que todos os urls que contêm a corda serão ignorado e não será posicionado. Usar expressões regulares do estilo do Perl em vez das cordas literais é suportado também. Cada corda que começa com “*” na parte dianteira é considerado como uma expressão regular, de modo que “*/[a] +” denota uma corda com uma ou o mais a nela.* Ignorando as ligaçõesAtributo do " nofollow " do rel= do respeito de Sphider no href do os Tag, assim que por exemplo a ligação foo.html nofollow> " do rel= " de " foo.html no href= do e os Tag não são posicionados, porém as ligações nele são seguidas.