OCR (reconnaissance texte dans image) + coordonnées X, Y

OCR (reconnaissance texte dans image) + coordonnées X, Y - PHP - Programmation

Marsh Posté le 06-04-2009 à 11:34:24    

Bonjour à tous,
 
 
Je cherche un script me permettant de faire une analyse sur la position de certains texte dans des pages :
 
les images peuvent être en PDF ou JPG, PNG, GIF et je voudrais connaitre les coordonnées de certains textes:
 
pour l'instant j'ai trouvé des OCR qui me permettent de convertir le PDF en texte par exemple, mais celui ci ne me donne pas les coordonnées du texte de celui ci.
 
Avez des idées pour pouvoir détecter les coordonnées du texte (X, Y).
 
 
 
merci de vos retours.
 

Reply

Marsh Posté le 06-04-2009 à 11:34:24   

Reply

Marsh Posté le 06-04-2009 à 11:42:54    

c'est pas du PHP.
tu veux faire un OCR ou bien trouver un OCR qui réponde à ton besoin particulier ?

Reply

Marsh Posté le 06-04-2009 à 11:47:16    


 
 
En fait il existe des scripts OCR qui fonctionne en php.
 
Par exemple qui convertissent un PDF en txt.  
 
c'est la moitié de la problèmatique, car je voudrais connaitre exactement la position du mot en coordonnées X, Y dans la page.
 
ce que je cherche est un script permettant de reconnaitre des chaines de caractères et de me donner la position dans la page, le tout de manière automatique.
 
est ce possible dans un PDF ou une image ?
 

Reply

Marsh Posté le 06-04-2009 à 11:56:12    

un OCR en PHP ?
Les outils PHP PDF 2 TXT ne sont surement pas des OCR mais doivent prélever le texte du PDF !
Par exemple, le texte d'une image d'un PDF ne sera jamais récupéré je pense. Parce qu'un OCR en PHP rien qu'en terme de temps d'exécution çà doit être une cata... Et je sais même pas si techniquement c'est réalisable rien qu'avec GD.

Reply

Marsh Posté le 06-04-2009 à 12:20:36    


 
 
Ok, ok, je suis mal...
 
vois tu d'autres solution ?
 
J'ai vu qu'il existait quelques OCR en PHP PHPOCR par exemple mais ceux ci semble un peu léger...
 
existe il alors des logiciels qui peuvent le faire ?  
 
Ou des idées ?
 

Reply

Marsh Posté le 06-04-2009 à 12:25:07    

Tape ocr dans google pour commencer.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed