BlueGEEK Journal

Accueil > Programmes > RTT & The Windows Desktop Search > RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned (...)

Windows Desktop Search

RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs

RTT = Rapid’ Trouveur de Texte

dimanche 13 juillet 2008, par bluegyn_spip

L’idée vient de JJF (Fulmédico)

- Utiliser un scanner de production du type

  • Canon ou Fujitsu

- Et lancer le Moteur de Recherche de Google DeskTop pour retrouver facilement un document au format PDF indexé,

  • Perdu dans la masse des courriers reçus

- Tout l’art est dans la bonne formulation de la Requête (d’où l’idée de créer un robot qui mémorise les mots clefs le plus souvent utilisés,

  • Comme par exemple FROTTIS , BIOPSIE, MARQUEURS ou MAMMOGRAPHIE
  • Puisque une fois mémorisés dans une liste, il suffit de cliquer dessus pour ajouter l’Item dans les critères de recherche.

- Le concept est ici adapté au :

- WDS

Windows DeskTop Search

- Qui est intégré à la nouvelle mouture de VISTA

- Et qui doit être préalablement installé sous XP à partir du site de Microsoft

microsoft.com/Downloads/WDS_4.0

- Et qui se laisse très simplement piloter par une ligne de commande.

- RTT ne fonctionne que quand l’indexation du disque est terminée,

  • Ce qui peut prendre un certain temps
  • Et qui ralenti assez considérablement la machine au 1er lancement.

TÉLÉCHARGER RTT

- Lien de téléchargement Libre OpenSource

- Manuel de prise ne main


LANCER LE PROGRAMME


- Correspond à la simple traduction de la Requête en langage WDS

- Le programme se lance la première fois avec un minimum d’options actives

- Les listes sont vides


POUR AJOUTER DES CHAMPS

- Menu affichage

- Ou

- Clic Droit à coté du Champ Nom


POUR AJOUTER DES CHOIX

- Chaque nouvelle saisie de :

  • Prénom

- ou de

  • Ville

- Est automatiquement enregistrée dans un fichier

  • prenoms.txt

- ou

  • villes.txt

- Très facile à éditer (bloc-notes).

- Pour ajouter des Items aux 2 listes de critère

  • Clic Droit sur la liste
  • Ajouter

- Les choix sont mémorisés dans les 2 fichiers

  • liste_1.txt

- et

  • liste_2.txt

- En fin l’aide du Programme s’obtient en tapant :

F1

- Qui permet en particulier d’accéder à quelques liens appropriés sur le site de Bilou

  • (Dont le téléchargement)

EXERCICES PRATIQUES

- Retrouver un Chèque dans la compta de l’année en moins de 3 secondes

Messages

  • Bonjour

    j’utilise Scansnap organizer V3.0L13 qui transforme tous mes documents scannés en format PDF indexables, ce qui permet de retrouver n’importe quel mot ou expression contenue dans le document. c’est très puissant comme moteur.

    Qu’est-ce qu’un fichier PDF indexable ?

    La numérisation d’un document s’accompagne de la création d’un fichier au format PDF et tout le contenu du document (texte, images, tableaux etc.) est généré en une seule image.

    Un fichier PDF tel quel ne vous permet pas d’effectuer des recherches textuelles puisque toute l’image générée forme un bloc.

    À partir de là, vous pouvez traiter l’image générée avec le moteur OCR (reconnaissance de texte) afin de pouvoir récupérer les informations de l’image et superposer de manière transparente, les informations dans les données de l’image. Ainsi, ces données pourront être stockées en tant que fichier PDF avec des informations textuelles.

    Bien qu’un fichier PDF soit une donnée d’image, il peut être indexé, tel un fichier de texte, accompangé d’informations textuelles. Bien confraternellement.

    Docteur Zidani

    kamal.zidani@laposte.net

    • Merci Kamal de ces précisions,


      - En effet pour pouvoir utiliser le moteur de recherche :

      1. Intégré de ScanSnap
      1. le Nouveau Windows Search
      1. Ou le Google Desktop

      - L’image PDF doit subir une reconnaissance de caractères, qui s’effectue en tâche de fond avec ScanSnap (ça peut se faire en direct,mais ça ralentit très considérablement l’étape de numérisation)

      • C’est ce qu’on appelle :

      L’indexation


      RECHERCHE DE TEXTE DANS UN PDF

      - J’ai renoncé au :

      moteur de recherche intégré de ScanSnap ,

      car il n’est :

      • Ni convivial (36 clics avant d’obtenir un résultat)
      • Ni rapide ( car tous les documents sont parcourus de façon séquentielle de A à Z à chaque recherche
        • Ce qui est bien pour 100 fiches, mais désastreux pour 100.000
      • Et il est extrêmement complexe de reformuler une requête incomplète.

      - J’ai longtemps utilisé le

      Google Desktop Research

      - sur les conseils de Jean-Jacques Fraslin de Fulmédico

      • Car il suffit de l’appeler par une double pression sur la touche CTRL

      - Et c’est en l’utilisant que je me suis rendu compte que c’est globalement toujours les mêmes recherches d’examens que l’on fait,

      - Et donc qu’en fait ce sont toujours les mêmes mots clefs que l’on frappe au clavier

      - Pourquoi taper ?

      FROTTIS DURAND

      - Alors que je viens de frapper :

      FROTTIS DUPONT

      - Je peux économiser 5 frappes de touches (sans compter les fautes de frappe) en mémorisant FROTTIS et en ne frappant plus que DUPONT


      - Appliquant la règle numéro un de l’informatique qui est je le rappelle

      - La règle du moindre effort,

      - puisque c’est une science et un outil de fainéant

      - L’idée est de mémoriser les frappes répétitives dans un premier temps,

      • Puis de les re-servir au moteur de recherche par le truchement d’une ligne de commande pré formatée et dans laquelle il suffirait d’introduire : DUPONT, càd

      le Nom du patient

      - Ainsi que 2 ou 3 renseignements bien spécifiques, permettant de recouvrer en moins d’une seconde , une fiche parmi 100.000


      - Je n’ai rien trouvé de convivial pour piloter le Moteur de Google

      - Par contre j’ai trouvé mon bonheur avec le moteur de VISTA

      SEARCH-MS ://query=...&

      - Adapté pour XP (car je n’ai pas VISTA) sous la forme du Package WDS

      => Windows Desktop Search

      - Celui ci est en effet beaucoup plus rapide que Google (il me semble)

      • Car très intégré à WINDOWS

      - Affichant d’emblée dans une fenêtre WINDOWS (qui s’ouvre beaucoup plus vite que l’explorateur)

      • La liste des résultats trouvés
      • Et directement visualisés, par le Viewer ad-hoc

      - Le RTT

      Rapid’ Trouveur de Texte

      - (Ou Research Tool for Texts)

      - N’est donc rien d’autre qui interface qui se veut

      • la plus conviviale possible

      - pour attaquer le moteur WDS avec une ligne de commande

      • la plus pertinente possible

      LE PROJET RTT EST EN PLEIN ÉPANOUISSEMENT EN CE MOMENT

      - Car je m’en sers tous les jours

      - Et j’y apporte en temps réel les modifications qui me simplifient la vie

      • (C’est la la différence entre un programmeur et un médecin programmeur)

      - Et je vous conseille de mettre à jour quasi quotidiennement l’exécutable

      • En hésitant pas (si vous l’utilisez) à me faire part des ses lourdeurs, plantages et des améliorations possibles pour votre pratique personnelle.

      http://bluegyn.com/rtt/

      - C’est un OpenSource écrit en DELPHI-6 gratuit (le stockage des données ne fait en effet intervenir aucune base de données) qui nécessiterait la version payante

      - Je fournis donc les sources à qui les demande, avec en contre partie, le devoir moral de restituer les améliorations du programme à la collectivité.


      Merci de vous intéresser à ce programme

      Voir en ligne : http://bluegyn.com/rtt/

  • - Il ne faut pas utiliser le mot clef KIND qui se contente de faire une recherche générique sur le type de document

    Par exemple :

    * DUPONT kind:DOC

    - Ramène tous les "documents" qu’elle que soit leur extension (DOC, PDF,TXT 15 ou tout ce que tu veux)

    • Pour encadrer une recherche spécifique par extension il faut utiliser le paramètre EXT :

    - Par exemple :

    * DUPONT ext:DOC

    - Scanne uniquement les fichiers WORD (et pas les PDF)

    * DUPONT ext:15

    Scanne uniquement les fichiers 15


    J’ai corrigé RTT en conséquence

    http://bluegyn.com/rtt/download/

    Voir aussi pour les programmeurs

    Windows Search Advanced Query Syntax