Accueil > Programmes > RTT & The Windows Desktop Search > RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned (...)

Windows Desktop Search

RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs

RTT = Rapid’ Trouveur de Texte

dimanche 13 juillet 2008, par bluegyn_spip

L’idée vient de JJF (Fulmédico)

Utiliser un scanner de production du type

Canon ou Fujitsu

Et lancer le Moteur de Recherche de Google DeskTop pour retrouver facilement un document au format PDF indexé,

Perdu dans la masse des courriers reçus

Tout l’art est dans la bonne formulation de la Requête (d’où l’idée de créer un robot qui mémorise les mots clefs le plus souvent utilisés,

Comme par exemple FROTTIS , BIOPSIE, MARQUEURS ou MAMMOGRAPHIE

Puisque une fois mémorisés dans une liste, il suffit de cliquer dessus pour ajouter l’Item dans les critères de recherche.

Le concept est ici adapté au :

WDS

Windows DeskTop Search

Qui est intégré à la nouvelle mouture de VISTA

Et qui doit être préalablement installé sous XP à partir du site de Microsoft

microsoft.com/Downloads/WDS_4.0

Et qui se laisse très simplement piloter par une ligne de commande.

RTT ne fonctionne que quand l’indexation du disque est terminée,

Ce qui peut prendre un certain temps
Et qui ralenti assez considérablement la machine au 1er lancement.

TÉLÉCHARGER RTT

Lien de téléchargement Libre OpenSource

Manuel de prise ne main

LANCER LE PROGRAMME

Correspond à la simple traduction de la Requête en langage WDS

Le programme se lance la première fois avec un minimum d’options actives

Les listes sont vides

POUR AJOUTER DES CHAMPS

Menu affichage

Clic Droit à coté du Champ Nom

POUR AJOUTER DES CHOIX

Chaque nouvelle saisie de :

Prénom

ou de

Ville

Est automatiquement enregistrée dans un fichier

prenoms.txt

villes.txt

Très facile à éditer (bloc-notes).

Pour ajouter des Items aux 2 listes de critère

Clic Droit sur la liste

Ajouter

Les choix sont mémorisés dans les 2 fichiers

liste_1.txt

liste_2.txt

En fin l’aide du Programme s’obtient en tapant :

F1

Qui permet en particulier d’accéder à quelques liens appropriés sur le site de Bilou

(Dont le téléchargement)

EXERCICES PRATIQUES

Retrouver un Chèque dans la compta de l’année en moins de 3 secondes

Sources disponibles :

http://bluegyn.com/rtt/

WDS

http://www.microsoft.com/downloads/...

Messages

1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 20 juillet 2008, 10:01, par Dr Zidani

Bonjour

j’utilise Scansnap organizer V3.0L13 qui transforme tous mes documents scannés en format PDF indexables, ce qui permet de retrouver n’importe quel mot ou expression contenue dans le document. c’est très puissant comme moteur.

Qu’est-ce qu’un fichier PDF indexable ?

La numérisation d’un document s’accompagne de la création d’un fichier au format PDF et tout le contenu du document (texte, images, tableaux etc.) est généré en une seule image.

Un fichier PDF tel quel ne vous permet pas d’effectuer des recherches textuelles puisque toute l’image générée forme un bloc.

À partir de là, vous pouvez traiter l’image générée avec le moteur OCR (reconnaissance de texte) afin de pouvoir récupérer les informations de l’image et superposer de manière transparente, les informations dans les données de l’image. Ainsi, ces données pourront être stockées en tant que fichier PDF avec des informations textuelles.

Bien qu’un fichier PDF soit une donnée d’image, il peut être indexé, tel un fichier de texte, accompangé d’informations textuelles. Bien confraternellement.

Docteur Zidani

kamal.zidani@laposte.net
- 1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 20 juillet 2008, 11:54, par Bluegyn
  Merci Kamal de ces précisions,
  
  En effet pour pouvoir utiliser le moteur de recherche :
  
  Intégré de ScanSnap
  le Nouveau Windows Search
  Ou le Google Desktop
  
  L’image PDF doit subir une reconnaissance de caractères, qui s’effectue en tâche de fond avec ScanSnap (ça peut se faire en direct,mais ça ralentit très considérablement l’étape de numérisation)
  
  C’est ce qu’on appelle :
  
  L’indexation
  
  RECHERCHE DE TEXTE DANS UN PDF
  
  J’ai renoncé au :
  
  moteur de recherche intégré de ScanSnap ,
  
  car il n’est :
  
  Ni convivial (36 clics avant d’obtenir un résultat)
  Ni rapide ( car tous les documents sont parcourus de façon séquentielle de A à Z à chaque recherche
  
  Ce qui est bien pour 100 fiches, mais désastreux pour 100.000
  Et il est extrêmement complexe de reformuler une requête incomplète.
  
  J’ai longtemps utilisé le
  
  Google Desktop Research
  
  sur les conseils de Jean-Jacques Fraslin de Fulmédico
  
  Car il suffit de l’appeler par une double pression sur la touche CTRL
  
  Et c’est en l’utilisant que je me suis rendu compte que c’est globalement toujours les mêmes recherches d’examens que l’on fait,
  
  Et donc qu’en fait ce sont toujours les mêmes mots clefs que l’on frappe au clavier
  
  Pourquoi taper ?
  
  FROTTIS DURAND
  
  Alors que je viens de frapper :
  
  FROTTIS DUPONT
  
  Je peux économiser 5 frappes de touches (sans compter les fautes de frappe) en mémorisant FROTTIS et en ne frappant plus que DUPONT
  
  Appliquant la règle numéro un de l’informatique qui est je le rappelle
  
  La règle du moindre effort,
  
  puisque c’est une science et un outil de fainéant
  
  L’idée est de mémoriser les frappes répétitives dans un premier temps,
  
  Puis de les re-servir au moteur de recherche par le truchement d’une ligne de commande pré formatée et dans laquelle il suffirait d’introduire : DUPONT, càd
  
  le Nom du patient
  
  Ainsi que 2 ou 3 renseignements bien spécifiques, permettant de recouvrer en moins d’une seconde , une fiche parmi 100.000
  
  Je n’ai rien trouvé de convivial pour piloter le Moteur de Google
  
  Par contre j’ai trouvé mon bonheur avec le moteur de VISTA
  
  SEARCH-MS ://query=...&
  
  Adapté pour XP (car je n’ai pas VISTA) sous la forme du Package WDS
  
  => Windows Desktop Search
  
  Celui ci est en effet beaucoup plus rapide que Google (il me semble)
  
  Car très intégré à WINDOWS
  
  Affichant d’emblée dans une fenêtre WINDOWS (qui s’ouvre beaucoup plus vite que l’explorateur)
  
  La liste des résultats trouvés
  Et directement visualisés, par le Viewer ad-hoc
  
  Le RTT
  
  Rapid’ Trouveur de Texte
  
  (Ou Research Tool for Texts)
  
  N’est donc rien d’autre qui interface qui se veut
  
  la plus conviviale possible
  
  pour attaquer le moteur WDS avec une ligne de commande
  
  la plus pertinente possible
  LE PROJET RTT EST EN PLEIN ÉPANOUISSEMENT EN CE MOMENT
  
  Car je m’en sers tous les jours
  
  Et j’y apporte en temps réel les modifications qui me simplifient la vie
  
  (C’est la la différence entre un programmeur et un médecin programmeur)
  
  Et je vous conseille de mettre à jour quasi quotidiennement l’exécutable
  
  En hésitant pas (si vous l’utilisez) à me faire part des ses lourdeurs, plantages et des améliorations possibles pour votre pratique personnelle.
  
  http://bluegyn.com/rtt/
  
  C’est un OpenSource écrit en DELPHI-6 gratuit (le stockage des données ne fait en effet intervenir aucune base de données) qui nécessiterait la version payante
  
  Je fournis donc les sources à qui les demande, avec en contre partie, le devoir moral de restituer les améliorations du programme à la collectivité.
  
  Merci de vous intéresser à ce programme
  Voir en ligne : http://bluegyn.com/rtt/
2. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 12 février 2009, 21:24, par BlueGYN
Il ne faut pas utiliser le mot clef KIND qui se contente de faire une recherche générique sur le type de document

Par exemple :

* DUPONT kind:DOC

Ramène tous les "documents" qu’elle que soit leur extension (DOC, PDF,TXT 15 ou tout ce que tu veux)
- Pour encadrer une recherche spécifique par extension il faut utiliser le paramètre EXT :
Par exemple :

* DUPONT ext:DOC

Scanne uniquement les fichiers WORD (et pas les PDF)

* DUPONT ext:15

Scanne uniquement les fichiers 15

J’ai corrigé RTT en conséquence

http://bluegyn.com/rtt/download/

Voir aussi pour les programmeurs

Windows Search Advanced Query Syntax
- 1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 19 mars 2009, 20:50, par Michel Chrétien
  
  Bonjour jc,
  
  Tu m’as convaincu.
  
  J’ai acheté un ScanSnap S510 (450 € TTC livré), installé et tout. Ca marche d’enfer.
  
  Ça me fait des PDF indexés.
  
  Je suis sous Vista, donc pas besoin d’installer WDS. J’installe ton RTT. Super
  
  SAUF
  
  Que WDS ne me trouve que des fichiers .doc quand je fais une requête et aucun PDF.
  
  Je reindexe mon disque après avoir vérifié que les fichiers pdf étaient bien indexés avec contenu et pas seulement les propriétés. Toujours rien.
  
  Je cherche sur le net. Rien. Jusqu’à ce que je tombe sur ceci :
  
  http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611
  
  Acrobat complet ou Reader contient Adobe PDF IFilter v6.0, qui permet l’indexation des PDF.
  
  C’est cela qui me manquait. J’ai enlevé Acrobat Reader depuis longtemps, trop lourd et l’ai remplacé par Foxit Reader, plus léger et plus rapide.
  
  Or Foxit fait le même genre d’extension qu’Acrobat pour l’indexation. C’est là :
  
  http://www.foxitsoftware.com/pdf/ifilter/index.html#downifilter
  
  Et en installant Foxit Ifilter, ça marche. La recherche Windows me donne instantanément les PDF voulus (après avoir réindexé mon disque quand même).
  
  A ce stade, tu me diras que c’est bien joli, mais que tu t’en tapes un peu, car chez toi, ça marche sans problème avec Acrobat Reader.
  
  Mais, là ou ça intéressera tout le monde, c’est que Foxit Ifilter permet d’indexer le disque 4 fois plus vite en 32 bit et 5 fois plus vite en 64 bits, par rapport à Acrobat PDF Ifilter. C’est là :
  
  En Win32 bits
  
  http://blogs.msdn.com/ifilter/archive/2007/11/14/foxit-vs-adobe-pdf-ifilter-32-bit-only.aspx
  
  51 minutes contre 218 pour 10 000 fichiers
  
  En Win64 bits
  
  http://blogs.msdn.com/opal/archive/2008/12/10/pdf-ifilter-battle-foxit-vs-adobe-64bit-version.aspx
  
  8 minutes contre 41 pour 2600 fichiers
  
  Donc, j’écris tout cela pour dire ca vaut la peine d’enlever Acrobat et d’installer Foxit Reader et Foxit Ifilter.
  
  A essayer chez toi pour voir si tu sens une différence
  
  Michel Chrétien

RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs

L’idée vient de JJF (Fulmédico)

TÉLÉCHARGER RTT

LANCER LE PROGRAMME

POUR AJOUTER DES CHAMPS

POUR AJOUTER DES CHOIX

Messages

RECHERCHE DE TEXTE DANS UN PDF

LE PROJET RTT EST EN PLEIN ÉPANOUISSEMENT EN CE MOMENT

Programmes

Dans la même rubrique