PhpDig

Site officiel
Bookmark and Share
Vous recherchiez un (bon) moteur de recherche pour votre site sous Apache/PHP/mySQL ? PhpDig semble tout à fait indiqué "sur le papier" (car non testé in situ par nos services débordés).
Clair dans son interface et dans son affichage des résultats il possède de nombreuses caractéristiques qui méritent l’attention. Son fonctionnement est classique : "PhpDig suit les liens contenus dans les documents fournis par un serveur web, comme n’importe quel navigateur, afin de constituer sa liste de pages à indexer".
Par défaut il ne gère pas les mots de moins de trois lettres et les expressions courantes (de votre choix). Il ne gère pas non plus les expressions exactes (car sinon la base sql serait pour le moins volumineuse et les requêtes pas mal longues !). Vous pouvez bien entendu paramétrer la sortie des résultats (à commencer par traduction en français).
L’installation semble facile puisqu’automatisée à l’aide d’un script (comme souvent il suffit juste d’avoir le nom de sa base sql, l’identifiant et le mot de passe).
On notera par ailleurs la possibilité d’indexer les fichiers pdf, doc, xls (comme Google quoi !) "si vous installez sur la machine qui effectue l’indexation des exécutables externes capables d’extraire le contenu textuel de ces documents".
On attend vos retours d’expérience ! (surtout qu’on va peut-être l’adopter pour nous tant il a l’air séduisant)

- L’entrée en langue française du site
- Demo en ligne
- Un forum dédié en fr (semble mort, prévenez-nous si vous le retrouvez)
Tags: moteur robot crawler phpdig
Ajouter des tags (séparés par des virgules ou des espaces) :
 
Attention: tous les caractères spéciaux sont interdits (sauf le .). Les tags n'apparaîtront qu'au prochain rafraichissement du cache (dans plusieurs heures).

<< Mettre à jour >>
:: lien mort :: orthographe :: nouveauté :: mise à jour ::

Vous souhaitez mettre à jour la notice ? La première chose à faire est de déterminer s'il s'agit d'une mise à jour mineure ou d'une mise à jour majeure Icone d'aide.

  • Mineure : un lien mort, des fautes d'orthographe, un lien à ajouter ou encore une petite précision.

    Veuillez renseigner les champs ci dessous :

  • Majeure : une nouvelle version avec des nouveautés, des changements majeurs.

    En cochant cette case, vous allez créer une page sur le wiki afin de mettre à jour la notice.

Commentaires

<< Poster un message >>
:: question :: précision :: avis :: commentaire :: bug ::

PhpDig , le 8 août 2006 par Léo Studer (0 rép.)

Application intéressante, malheureusement le forum du site officiel est payant... pas cher, mais c’est une question de principes.

Dommage car rien n’est fait pour faciliter la prise en main, et du coup il faut passer à la caisse pour obenir les informations concernant l’intégration de l’application dans un site web déjà existant par exemple.

Répondre à ce message

PhpDig , le 13 juillet 2006 par Miketatoon (0 rép.)

l’adresse a changé en .de et non en .net je l’ai installé j’attends voir

++

-----> Réponse

Répondre à ce message

> PhpDig , le 17 juin 2005 (0 rép.)

Ce script est géniale mais il prend énormement de place qu mon serveur car il stocke une partie, des donné dans des fichiers texte dans le fichier text_content.

Je cherche quelqu’un ayant réussie a faire ce script être 100% sql

-----> Problème

Répondre à ce message

> PhpDig , le 14 janvier 2005 par twanoo (0 rép.)

ok, je l’ai installé et testé, assez efficace pour ce qui est des recherches. ( assez rapide ) l’indexing du site prend un peu de temps, mais ça me semble normal car il y a beaucoup de lecture / écriture au niveau de mysql.

Il est possible d’administrer le moteur via une interface web, ou en lignes de commandes. pour ma part, je recommande de gerer l’indexing en lignes de commandes, cela prend beaucoup moins de resources CPU , donc c’est unpeu plus rapide. quoi qu’il en soit , le soft est assez gourmand, donc faire attention si vous etes hebergés sur un serveur mutualisé...

a part ce petit "defaut", la solution est tres souple , ultra parametrable, il est possible de faire un "renice" sur le process ( cela se parametre dans le fichier de conf , au cas ou on a pas toute la cpu pour soi )

des templates pour la page de recherche sont livrés avec le soft à titre d’exemple, et il est tres facile d’en crééer ( ils sont en XML)

il est aussi possible de faire tourner le spider avec cron. le forum de leur site est assez réactif, ils vous donnent volontier un coup de main.

voila, je crois que j’en ai grossierement fait le tour. :))

Antoine.

-----> phpdig en live sur mon site :))

Répondre à ce message

> PhpDig, Probleme d’utilisation avec les Pdf , le 8 octobre 2004 par Daaniel (3 rép.)

Bonjour Ce logiciel me pose un problème. Il est très intéressant, car il utilise php, mysql, il est convivial, paramétrable, beau, etc … (et pas de bogue) Les référencements que j’ai à faire sont tous des pdf. Il scrute bien les pdf mais il n’indexe rien. (Les fichiers textes, html, etc.. c’est parfait) J’utilise une configuration sous Windows 2000.

Normalement il doit y avoir une procédure que transforme le pdf en texte, il indexe le texte en faisant référence au pdf. Je n’ai pas trouvé comment faire, donc pour moi, cet excellent logiciel est inutile. Avez vous une solution ?

> PhpDig, Probleme d’utilisation avec les Pdf , le 14 janvier 2005 par twanoo

il faut utiliser un soft du style pdftotext, mais je ne suis pas sur que ça fonctionne sous windows.

> PhpDig, Probleme d’utilisation avec les Pdf , le 28 avril 2005 par Daaniel

Tout à fait, il faut utiliser pdftotext, le probleme c’est que phpdig gardera comme référence le fichier texte converti et non pas le fichier pdf d’origine.

> PhpDig, Probleme d’utilisation avec les Pdf , le 7 octobre 2005 par Kithnos

Ca fonctionne avec Pdftotext (recherche la librairie Xpdf et telecharge uniquement la partie pdftotext) une fois que c’est fait et bien tu paramètre ton fichier de config sur PhpDig en lui indiquant d’indexer le PDF et en lui indiquant le chemin ou se trouve Pdftotext. si tu est sur un serveur mutualisé et bien tu ne pourra pas le faire !!! car tu ne peut pas installer Pdftotext donc se que tu peux faire est de l’installer en local chez toi ensuite d’indexer le site et puis tu transfert la base de données de Phpdig en local vers la base de données de ton serveur et le tour est joué, je sais que c’est lourd, mais c’est la seule solution que j’ai trouvé pour un hebergement mutualisé.... voir aussi je pense que tu peux même passer directement par FTP....voilà

Répondre à ce message

> PhpDig , le 9 janvier 2004 par shaders (0 rép.)

Génial ! ! !

Un programme fantastique, il m’indexe une centaine d’hôte et 4000 page sur 80 000 keywords. soit une base de 20 Mo grosso modo.

Aucun pbm de rapidité ni d’accés.

Attention toutefois à la lenteur d’indexation et de rafraichissement, ne pas être trop dans l’urgence.

-----> Moteur Snakes

Répondre à ce message

> Pas mal du tout. , le 19 décembre 2003 par Lycurgue (0 rép.)

J’ai installé PHpDig en local puis sur le Net, il fonctionne parfaitement dans les deux cas.

Le référencement n’est pas si long qu’annoncé par la documentaion (200 pages en 2 ou 3min.) et sans aucun problème. Le site indexé est en html compatible navigateur 3.0et +, ceci explique peut-être cela. Il semblerait (voir forum du site) que l’indexation cale sur des pages php complexes.

L’intérêt annexe est l’analyse de l’indexation par mots clés : cela donne une vision claire du contenu de votre site, mieux que tous les outils dédiés que j’ai utilisé jusqu’à maintenant.

Un bémol : la documentation très claire par ailleurs est encore trop ardue pour un débutant en php comme moi : les évidences et les non-dits de l’auteur ont rallongé l’intégration du moteur dans mes pages en m’obligeant à faire de longues recherches sur le net pour y trouver le fil à couper le beurre.

En bref, du très bon pour qui connaît -un peu - le php.

Répondre à ce message

Informations complémentaires

Faire un don ? (défiscalisé)

Aidez-nous à atteindre notre objectif de 1080 donateurs récurrents pour assurer notre pérennité et notre développement !

Je soutiens Framasoft
pour 10€/mois

Dégooglisons Internet, l’an 2

Les services en ligne de géants tentaculaires comme Google, Apple, Facebook, Amazon ou Microsoft (GAFAM) mettent en danger nos vies numériques.

Pour cette 2e année, nous continuons le défi de vous proposer une alternative Libre, Éthique, Décentralisée et Solidaire à chacun de ces services.

Découvrez notre campagne
« Dégooglisons Internet »

Autres rubriques

Informations générales

Juste une image

One Woman Show One Woman Show
Creative Commons BY