Accueil > Programmes > RTT & The Windows Desktop Search > RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned (...)
Windows Desktop Search
RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs
RTT = Rapid’ Trouveur de Texte
dimanche 13 juillet 2008, par
L’idée vient de JJF (Fulmédico)
Utiliser un scanner de production du type
- Canon ou Fujitsu
Et lancer le Moteur de Recherche de Google DeskTop pour retrouver facilement un document au format PDF indexé,
- Perdu dans la masse des courriers reçus
Tout l’art est dans la bonne formulation de la Requête (d’où l’idée de créer un robot qui mémorise les mots clefs le plus souvent utilisés,
- Comme par exemple FROTTIS , BIOPSIE, MARQUEURS ou MAMMOGRAPHIE
- Puisque une fois mémorisés dans une liste, il suffit de cliquer dessus pour ajouter l’Item dans les critères de recherche.
Le concept est ici adapté au :
WDS
Windows DeskTop Search
Qui est intégré à la nouvelle mouture de VISTA
Et qui doit être préalablement installé sous XP à partir du site de Microsoft
microsoft.com/Downloads/WDS_4.0
Et qui se laisse très simplement piloter par une ligne de commande.
RTT ne fonctionne que quand l’indexation du disque est terminée,
- Ce qui peut prendre un certain temps
- Et qui ralenti assez considérablement la machine au 1er lancement.
TÉLÉCHARGER RTT
Lien de téléchargement Libre OpenSource
LANCER LE PROGRAMME
Correspond à la simple traduction de la Requête en langage WDS
Le programme se lance la première fois avec un minimum d’options actives
Les listes sont vides
POUR AJOUTER DES CHAMPS
Menu affichage
Ou
Clic Droit à coté du Champ Nom
POUR AJOUTER DES CHOIX
Chaque nouvelle saisie de :
- Prénom
ou de
- Ville
Est automatiquement enregistrée dans un fichier
- prenoms.txt
ou
- villes.txt
Très facile à éditer (bloc-notes).
Pour ajouter des Items aux 2 listes de critère
- Clic Droit sur la liste
- Ajouter
Les choix sont mémorisés dans les 2 fichiers
- liste_1.txt
et
- liste_2.txt
En fin l’aide du Programme s’obtient en tapant :
F1
Qui permet en particulier d’accéder à quelques liens appropriés sur le site de Bilou
- (Dont le téléchargement)
EXERCICES PRATIQUES
Retrouver un Chèque dans la compta de l’année en moins de 3 secondes
Messages
1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 20 juillet 2008, 10:01, par Dr Zidani
Bonjour
j’utilise Scansnap organizer V3.0L13 qui transforme tous mes documents scannés en format PDF indexables, ce qui permet de retrouver n’importe quel mot ou expression contenue dans le document. c’est très puissant comme moteur.
Qu’est-ce qu’un fichier PDF indexable ?
La numérisation d’un document s’accompagne de la création d’un fichier au format PDF et tout le contenu du document (texte, images, tableaux etc.) est généré en une seule image.
Un fichier PDF tel quel ne vous permet pas d’effectuer des recherches textuelles puisque toute l’image générée forme un bloc.
À partir de là, vous pouvez traiter l’image générée avec le moteur OCR (reconnaissance de texte) afin de pouvoir récupérer les informations de l’image et superposer de manière transparente, les informations dans les données de l’image. Ainsi, ces données pourront être stockées en tant que fichier PDF avec des informations textuelles.
Bien qu’un fichier PDF soit une donnée d’image, il peut être indexé, tel un fichier de texte, accompangé d’informations textuelles. Bien confraternellement.
Docteur Zidani
kamal.zidani@laposte.net
1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 20 juillet 2008, 11:54, par Bluegyn
Merci Kamal de ces précisions,
En effet pour pouvoir utiliser le moteur de recherche :
L’image PDF doit subir une reconnaissance de caractères, qui s’effectue en tâche de fond avec ScanSnap (ça peut se faire en direct,mais ça ralentit très considérablement l’étape de numérisation)
RECHERCHE DE TEXTE DANS UN PDF
J’ai renoncé au :
car il n’est :
J’ai longtemps utilisé le
sur les conseils de Jean-Jacques Fraslin de Fulmédico
Et c’est en l’utilisant que je me suis rendu compte que c’est globalement toujours les mêmes recherches d’examens que l’on fait,
Et donc qu’en fait ce sont toujours les mêmes mots clefs que l’on frappe au clavier
Pourquoi taper ?
Alors que je viens de frapper :
Je peux économiser 5 frappes de touches (sans compter les fautes de frappe) en mémorisant FROTTIS et en ne frappant plus que DUPONT
Appliquant la règle numéro un de l’informatique qui est je le rappelle
L’idée est de mémoriser les frappes répétitives dans un premier temps,
Ainsi que 2 ou 3 renseignements bien spécifiques, permettant de recouvrer en moins d’une seconde , une fiche parmi 100.000
Je n’ai rien trouvé de convivial pour piloter le Moteur de Google
Par contre j’ai trouvé mon bonheur avec le moteur de VISTA
Adapté pour XP (car je n’ai pas VISTA) sous la forme du Package WDS
Celui ci est en effet beaucoup plus rapide que Google (il me semble)
Affichant d’emblée dans une fenêtre WINDOWS (qui s’ouvre beaucoup plus vite que l’explorateur)
Le RTT
(Ou Research Tool for Texts)
N’est donc rien d’autre qui interface qui se veut
pour attaquer le moteur WDS avec une ligne de commande
LE PROJET RTT EST EN PLEIN ÉPANOUISSEMENT EN CE MOMENT
Car je m’en sers tous les jours
Et j’y apporte en temps réel les modifications qui me simplifient la vie
Et je vous conseille de mettre à jour quasi quotidiennement l’exécutable
C’est un OpenSource écrit en DELPHI-6 gratuit (le stockage des données ne fait en effet intervenir aucune base de données) qui nécessiterait la version payante
Je fournis donc les sources à qui les demande, avec en contre partie, le devoir moral de restituer les améliorations du programme à la collectivité.
Merci de vous intéresser à ce programme
Voir en ligne : http://bluegyn.com/rtt/
2. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 12 février 2009, 21:24, par BlueGYN
Il ne faut pas utiliser le mot clef KIND qui se contente de faire une recherche générique sur le type de document
Par exemple :
Ramène tous les "documents" qu’elle que soit leur extension (DOC, PDF,TXT 15 ou tout ce que tu veux)
Par exemple :
Scanne uniquement les fichiers WORD (et pas les PDF)
Scanne uniquement les fichiers 15
J’ai corrigé RTT en conséquence
http://bluegyn.com/rtt/download/
Voir aussi pour les programmeurs
Windows Search Advanced Query Syntax
1. RTT : Rapid Research of Text on Medical Usual Foutoir for MyBordel Scanned Docs, 19 mars 2009, 20:50, par Michel Chrétien
Bonjour jc,
Tu m’as convaincu.
J’ai acheté un ScanSnap S510 (450 € TTC livré), installé et tout. Ca marche d’enfer.
Ça me fait des PDF indexés.
Je suis sous Vista, donc pas besoin d’installer WDS. J’installe ton RTT. Super
SAUF
Que WDS ne me trouve que des fichiers .doc quand je fais une requête et aucun PDF.
Je reindexe mon disque après avoir vérifié que les fichiers pdf étaient bien indexés avec contenu et pas seulement les propriétés. Toujours rien.
Je cherche sur le net. Rien. Jusqu’à ce que je tombe sur ceci :
http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611
Acrobat complet ou Reader contient Adobe PDF IFilter v6.0, qui permet l’indexation des PDF.
C’est cela qui me manquait. J’ai enlevé Acrobat Reader depuis longtemps, trop lourd et l’ai remplacé par Foxit Reader, plus léger et plus rapide.
Or Foxit fait le même genre d’extension qu’Acrobat pour l’indexation. C’est là :
http://www.foxitsoftware.com/pdf/ifilter/index.html#downifilter
Et en installant Foxit Ifilter, ça marche. La recherche Windows me donne instantanément les PDF voulus (après avoir réindexé mon disque quand même).
A ce stade, tu me diras que c’est bien joli, mais que tu t’en tapes un peu, car chez toi, ça marche sans problème avec Acrobat Reader.
Mais, là ou ça intéressera tout le monde, c’est que Foxit Ifilter permet d’indexer le disque 4 fois plus vite en 32 bit et 5 fois plus vite en 64 bits, par rapport à Acrobat PDF Ifilter. C’est là :
En Win32 bits
http://blogs.msdn.com/ifilter/archive/2007/11/14/foxit-vs-adobe-pdf-ifilter-32-bit-only.aspx
51 minutes contre 218 pour 10 000 fichiers
En Win64 bits
http://blogs.msdn.com/opal/archive/2008/12/10/pdf-ifilter-battle-foxit-vs-adobe-64bit-version.aspx
8 minutes contre 41 pour 2600 fichiers
Donc, j’écris tout cela pour dire ca vaut la peine d’enlever Acrobat et d’installer Foxit Reader et Foxit Ifilter.
A essayer chez toi pour voir si tu sens une différence
Michel Chrétien