Nettoyage de texte [PHP] - PHP - Programmation
Marsh Posté le 21-01-2008 à 23:22:48
Hello,
si une ligne sur 2 est "pareille", il suffit de n'en lire qu'une sur 2 ...
Concrètement récupérer dans un tableau le code du premier bloc :
Code :
|
Je ne suis peut-être pas encore bien en forme à cette heure, mais le principe est simple : on "éclate" ligne par ligne ce code et pour chaque ligne, si ça ne ressemble pas à <!{quelque chose} alors on l'affiche.
ça permet d'avoir un tableau dont on récupère une ligne sur 2, 3 ... X mais pas de manière systématique : on analyse ligne par ligne.
Marsh Posté le 22-01-2008 à 08:55:03
Heu mon exemple est sans doute mauvais, ce n'est pas une ligne sur 2, ces insertions (car il s'agit d'insertion d'image, smileys, lien , ... ) peuvent apparraitre n'importe ou ...
Code :
|
par exemple.
Marsh Posté le 22-01-2008 à 09:06:12
Parsing via DOM, puis extraction juste du texte? (par contre je saurais pas te dire quelle méthode c'est, faut demander à florentg)
Marsh Posté le 22-01-2008 à 09:12:26
Code :
|
Marsh Posté le 22-01-2008 à 09:18:57
masklinn a écrit : Parsing via DOM, puis extraction juste du texte? (par contre je saurais pas te dire quelle méthode c'est, faut demander à florentg) |
Avec la propriété textContent d'un DOMNode
Marsh Posté le 22-01-2008 à 09:35:52
anapajari a écrit :
|
Ca suffit avec vos regexp pourries alors qu'il existe des outils qui font ça très bien, bon sang
FlorentG a écrit :
|
Walla, merci
Marsh Posté le 22-01-2008 à 10:29:16
masklinn a écrit : |
Je vois pas l'interêt de parser le truc puis extraire le contenu alors qu'il tient juste à virer toutes les balises
D'autant que je reste plus que scéptique sur la validité du "xml" contenu dans une base PhpBB et que s'il a un morceau de balise qui traine tout son truc va planter.
Mais c'est sur qu'on gagne en nerditude à utiliser le DOM.
Et ma regex pourrie tu sais ce que tu peux en faire
Marsh Posté le 22-01-2008 à 10:30:44
anapajari a écrit : Et ma regex pourrie tu sais ce que tu peux en faire |
Ouais, j'peux te la coller dans le fondement
Marsh Posté le 22-01-2008 à 11:42:48
masklinn a écrit : |
Parse error: syntax error, unexpected T_ASS in index.php on line 2
Marsh Posté le 22-01-2008 à 16:46:33
Une regexp pour virer des tags? Du dom pour enlever les balises?
Et pourquoi pas un chargement dans un navigateur suivit d'un copier collé du texte affiché tant que vous y êtes?
Si c'était du C#, je me dirais : ils ont pas du faire une fonction exprès pour ça, mais c'est du php, alors vive les 30 000 (nombre exagéré. ) fonctions dispos de base : http://fr3.php.net/manual/fr/function.strip-tags.php
Marsh Posté le 22-01-2008 à 20:28:31
le problème est que se ne sont pas des codes HTML !! c'est des balises spécifiques a phpbb3 !!
en ce qui concerne preg_replace ca ne fonctionne pas ....
Marsh Posté le 22-01-2008 à 20:38:12
mims1664 a écrit : le problème est que se ne sont pas des codes HTML !! c'est des balises spécifiques a phpbb3 !! en ce qui concerne preg_replace ca ne fonctionne pas .... |
Heuuu
<!-- s:D --><img src="{SMILIES_PATH}/icon_biggrin.gif" alt=":D" title="Very Happy" /><!-- s:D --> |
c'est du HTML à l'ancienne hein
Les trucs horribles là au milieu sont ptet utilisés par PHPBB, mais apparement ils ont été suffisament intelligents pour encoder leurs infos dans du HTML standard
Marsh Posté le 22-01-2008 à 21:15:52
ouais c'est vrai que ca ressemble bien a de l'html mais cette fonction ne fonctionne pas ....
Marsh Posté le 23-01-2008 à 10:06:19
mims1664 a écrit : preg_replace ca ne fonctionne pas .... |
mims1664 a écrit : cette fonction ne fonctionne pas .... |
problème d'ICC...
(j'ai testé les 3 méthodes qui t'ont été proposées, les 3 "fonctionnent" )
Marsh Posté le 23-01-2008 à 10:41:30
C'est quoi la signification d' "ICC"?
En cherchant sur google, je tombe sur les gestion de couleur, les "Rencontres Innovation Compétitivité et Connaissance", les "indice du coût de la construction" et autres "Impact Centre Chrétien" (vraiment aucun rapport avec l'informatique) .
Le plus proche au niveau signification que j'ai trouvé à l'air d'être : "ICC : Intermédiaire des Chercheurs & Curieux".
Marsh Posté le 23-01-2008 à 11:15:16
LOL c'est sympa ca !!!
je vais persévérer ! mais la je ne peux pas de suite, je vous tiens au courant !
Marsh Posté le 24-01-2008 à 10:27:15
c'est bon j'avais zappé le stripslashes !!! merchi tout plein !
Marsh Posté le 21-01-2008 à 19:42:03
bonjour,
Je souhaiterais faire un peu de nettoyage de texte que je récupere d'une base de donnée phpbb3 :
j'imagine que je trouverais mon bonheur avec la fonction preg_replace mais je ne comprends pas bien son fonctionnement...
je voudrais supprimer ce genre de chaine de caractère :
résultat souhaité :
merci !
Message édité par mims1664 le 21-01-2008 à 19:43:19
---------------
la vie à le goût qu'on lui donne !! Vive le photo numérique et le tirage photo