Traitement d'image, extraction de texte dans une image

Traitement d'image, extraction de texte dans une image - Algo - Programmation

Marsh Posté le 03-06-2005 à 14:44:37    

Bonjour, je debute un projet de reconnaissance de canette et je dois extraire le texte de l'image. Comment savoir ou se trouve le texte? Merci!

Reply

Marsh Posté le 03-06-2005 à 14:44:37   

Reply

Marsh Posté le 03-06-2005 à 15:01:33    

Segmentation et analyse des formes?
A toi de trouver des descripteurs géométriques qui peuvent décrire les caractères (tu peux aller voir là: http://pages.cpsc.ucalgary.ca/~fed [...] e-1996.pdf c'est un bon exemple).
Sinon en limitant ton analyse sur certaines fréquences (étudie les hautes puis les basses et regarde ce que ça peut donner).

Reply

Marsh Posté le 04-06-2005 à 14:15:38    

Merci pour ta reponse moktar1er!
Si j'utilise les frequences, comment differencier les hautes des basses ? de quoi ca depend ?

Reply

Marsh Posté le 04-06-2005 à 16:01:49    

Les hautes frequences, c'est du bruit => poubelle.
Les basses fréquences, c'est "les moyennes" de ton image => poubelle.
Selon moi, il faudrait  
-extraire les applats correspondant aux lettres,
-les séparer (différencier chaque applat),
-virer les applats de quelques pixels ou de beaucoup de pixels (ca c'est à toi de donner 2 seuils)
(donc ca ca doit correspondre a la segmentation de mok)
-ensuite analyse des formes.(je connais pas mais ca a l'air d'etre sur le PDF de mok)
 
C'est interressant ton truc, c'est différencier les cannettes???

Reply

Marsh Posté le 06-06-2005 à 00:13:23    

benji_100 a écrit :

Les hautes frequences, c'est du bruit => poubelle.
Les basses fréquences, c'est "les moyennes" de ton image => poubelle.
Selon moi, il faudrait  
-extraire les applats correspondant aux lettres,
-les séparer (différencier chaque applat),
-virer les applats de quelques pixels ou de beaucoup de pixels (ca c'est à toi de donner 2 seuils)
(donc ca ca doit correspondre a la segmentation de mok)
-ensuite analyse des formes.(je connais pas mais ca a l'air d'etre sur le PDF de mok)
 
C'est interressant ton truc, c'est différencier les cannettes???


 
 :ouch: , et les contours t'en fais quoi alors  :heink:  :??:

Reply

Marsh Posté le 06-06-2005 à 08:54:53    

Donc je reprends: d'abord procéder à une étude expérimentale. Essayer de dépouiller l'image, regarder ce qu'apportent les hautes fréquences, les basses etc. en essayant diverses gammes de filtres (biblio). De la même manière, si tes caractères sont dans une couleur ou un niveau de gris particulier, regarder si un seuillage sur histogramme peut suffire. Sinon, pourquoi pas, si c'est de la couleur, regarder différents espaces colorimétriques.
Ensuite, ce que j'appelle la segmentation c'est l'extraction même des zones d'interêt dans l'image. Pour ça, il existe une biblio assez conséquente (approche couleur, approche contour, approche région etc. etc.), alors: lire, comprendre, essayer.
Pour un problème de ce genre, il n'y a pas 36 méthodes de toutes façons. On fait l'analyse de l'état de l'art, on avale ce qu'on peut de biblio sur le domaine et on fait l'étude expérimentale avant de décider de la méthode, des seuils, des paramètres etc.

Reply

Marsh Posté le 09-06-2005 à 22:59:32    

Merci pour vos reponses! Pour commencer, j'ai pas penser a séparer la canette du fond de l'image. Comment puis-je proceder?  

Reply

Marsh Posté le 09-06-2005 à 23:02:28    

Elimination du fond :
-> soit par bete apprnetissage du fond s'il est fixe
-> soit par elimiantion gaussienne du fond

Reply

Marsh Posté le 10-06-2005 à 08:54:31    

analyse d'histogramme: si l'image de la cannette est plus largement plus petite que le fond, on devrait avoir un gros pic représentant les pixels du fond

Reply

Marsh Posté le 28-06-2005 à 01:49:42    

Merci! mais en fait, je viens d'apprendre qu'il faut utiliser la transformee de hough pour trouver le rectangle qui represente la canette. J'ai fait une detection de contour et une binarisation mais j'ai un probleme quand je fais une convolution de l'image, je pense que je vais poser le probleme dans un nouveau post.

Reply

Marsh Posté le 28-06-2005 à 01:49:42   

Reply

Marsh Posté le 28-06-2005 à 08:55:08    

Je vais reposer ma question: à quoi ressemble ton image? As-tu une canette d'une "certaine couleur" sur "un fond d'une autre couleur"? On peut avoir des exemples? Parceque Hough, ça marche super bien une fois qu'on a une idée de ce que l'on cherche, mais par contre c'est loin d'être ce que l'on a inventé de plus rapide, donc si tu vises le process. industriel avec des temps imbattables, j'ai peur qu'il faille imaginer d'autres solutions.

Reply

Marsh Posté le 28-06-2005 à 14:09:50    

Citation :

Je vais reposer ma question: à quoi ressemble ton image? As-tu une canette d'une "certaine couleur" sur "un fond d'une autre couleur"? On peut avoir des exemples? Parceque Hough, ça marche super bien une fois qu'on a une idée de ce que l'on cherche, mais par contre c'est loin d'être ce que l'on a inventé de plus rapide, donc si tu vises le process. industriel avec des temps imbattables, j'ai peur qu'il faille imaginer d'autres solutions.


 
Excuse, j'ai pas fait attention a ta question. Ce projet est dans le cadre de mes etudes et mon superieur impose l'utilisation de Hough, donc pas le choix!
Je trouve pas comment faire pour insere une piece jointe, je vous met ces image que j'ai trouvé sur le net.
 
http://www.djleonsmith.com/interviews/mike/fanta.jpg
http://www.thetravelhelper.com/HongKong/Photos/HK-Ph5-Lukes-Favorite-Drink-Grape-Fanta.jpg

Reply

Marsh Posté le 28-06-2005 à 14:19:56    

Ah oué, faut que tu reconnaisses une cannette dans n'importe quelle type d'image alors. Ta cannette peut avoir n'importe quelle dimension, n'importe quelle orientation, OK.
Euh... ton supèrieur là, il connait les descripteurs de forme sinon? [:joce]

Reply

Marsh Posté le 29-06-2005 à 18:36:28    

Je propose une petite reconnaissance de forme d'une chier de canette ! Puis faire un apprentissage (Réseau de neurone : perceptron, kohonen), k-ppv, Bayes, etc...chacune ayant leur avantage et inconvénient ;)

Reply

Marsh Posté le 30-06-2005 à 08:54:50    

T'entends quoi par "reconnaissance de forme"? (Méthode etc.?)
Ensuite si toutes les images ont cette tête, il va falloir aussi s'accrocher sur la segmentation...

Reply

Marsh Posté le 04-07-2005 à 18:35:53    

Moktar1er a écrit :

T'entends quoi par "reconnaissance de forme"? (Méthode etc.?)
Ensuite si toutes les images ont cette tête, il va falloir aussi s'accrocher sur la segmentation...


 
Ben pour la RDF, y'a des multitudes de techniques invariantes en translation/rotation/échelle (ex : moments de Zernik, moments de Hu, transformée de fourier Mellin, distance de Hosdroff, codage de freeman, et plein plein d'autres).
Donc l'apprentissage serait supervisé au départ : on crop des canettes sur des images. On en construit une belle image binaire à fond noir et la cannette en blanc. Ensuite on balance une centaine d'image traitées de cette façon (cad manuellement) et on apprends les signatures des cannettes (qui contiennent des descripteurs de formes des cannettes). Après l'apprentissage, les poids ds le cas d'un RDN seront ajustés et ziva ... Le blème c'est la segmentation comme tu dis, cad que lorsque on va balancer une image au systeme, il faut lui balancer que la cannette :/ (un crop indirectement). Cette segmentation et assez délicate ; faudrait utilisé des techniques bien connues (croissance de régions ou quadtree) et trouver un bon critère d'arrêt...c pas gagner mais malheuresement cela est une des difficultés du traitement d'image : faut-il reconnaître avant de segmenter ou bien segmenter avant de reconnaitre ... je veux dire pour extraire la cannette de l'image, ca suppose la reconnaitre ; et pour la reconnaitre ca suppose avoir segmenté avant...bref c'est le chat qui se mord la queue, l'un ne peut se faire que difficilement sans l'autre !

Reply

Marsh Posté le 18-07-2005 à 12:23:24    

C'est pas pour faire genre, mais les canettes elles ont pas un code barre par hasard ??

Reply

Marsh Posté le 18-07-2005 à 14:29:41    

Pas évident pour le lire sur le type de photos qu'il a posté plus haut ;)

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed