script sh pour scanner des html et remplacer des chaines de caracteres

script sh pour scanner des html et remplacer des chaines de caracteres - Codes et scripts - Linux et OS Alternatifs

Marsh Posté le 18-04-2006 à 11:48:55    

Bonjour a tous,
 
Dans le cadre de mon stage je suis amené à modifier de grandes données de texte,
toutes en .htm, je dois remplacer l'ancien nom du groupe par le nouveau, et forcement
45 000 pages html à la main, merci bien.
 
Je précise que c'est non pas dans les titres htm style www.anciengroupe.htm mais
à l'intérieur du .htm lui même, comme par exemple : href="www.anciengroupe/procedure.htm"
Voila.
 
Donc voici que je j'ai fait avec mon boss qui n'avais pas le temps, visiblement de m'aider.
find repertoirealisterici unautrerep etundernier -name "*.htm*" -type f -exec grep -in anciengroupe.fr {} /dev/null \;
donc qui scan les .htm et qui affiche toutes les lignes avec anciengroupe.fr
 
j'ai trouvé sur le net un petit script (que j'ai modifié) qui remplace une chaine par une autre, et ça marche très bien.
 
#! /bin/bash
for file in *.htm
    do
    cp $file $file.bak &&
    sed "s|$1|$2|g" $file.bak > $file
done

 
mais bon déja j'ai été incapable de modifier ce script pour qu'il aille chercher tous les .htm DANS les repertoires,
alors j'ai bien essayé de modifier la première ligne de commande en :  
find repertoirealisterici unautrerep etundernier -name "*.htm*" -type f -exec grep -in anciengroupe.fr {} /dev/null \; | cut -d":" -f1
et ça ma donné tous les fichiers ou ils y avait les noms à changer, mais encore une fois, incapable de prendre les noms et de les  
incorporer au script.
 
Voila, si quelqu'un à un nom de programme qui tourne sous windows ou linux, au choix, ou mieu, qui puisse me donner la ligne de  
commande, ca serais super gentil de sa part..
 
D'avance merci
 
 [:alizean]


Message édité par Sndk le 19-04-2006 à 09:31:05

---------------
Mon topic - Mon Feed-Back
Reply

Marsh Posté le 18-04-2006 à 11:48:55   

Reply

Marsh Posté le 19-04-2006 à 09:30:55    

j'ai trouver !


---------------
Mon topic - Mon Feed-Back
Reply

Marsh Posté le 19-04-2006 à 18:32:23    

bon avec l'aide d'un college ont a trouver ca,  
a mon avis ya bien plus court, mais ca marche :
 
fichier scan :
find . -name *.htm -type f -exec grep -l anciengroupe.fr {} /dev/null \;
 
donc je fais :
./scan > fic_liste
 
fichier rep :
 
#! /bin/bash
for file in $(cat fic_liste)
    do
    cp $file $file.bak &&
    sed "s|$1|$2|g" $file.bak > $file
done
 
donc au final je fais :  
./ rep anciengroupe nouveaugroupe
 
et ça marche impec, on peu tout incorporer pour que ca sois silencieux,
mais je préfère en 2 executable.
 
voila, si ca peux en aider certains !
vous pouvez proposer vos créations si le coeur vous en dis !
 
5 lignes de commandes et on évite de payer 20€ pour des progs windows qui font la même chose.
 
A++
 


---------------
Mon topic - Mon Feed-Back
Reply

Marsh Posté le 19-04-2006 à 19:35:07    

ou rpl qui fait ça tres bien

Reply

Marsh Posté le 19-04-2006 à 19:40:55    

splurf a écrit :

ou rpl qui fait ça tres bien


 
a la place de sed ?
tu peux me dire comment ca marche ton rpl, j'ai pas encore installé linux
a la maison la, je ne l'ai qu'au taf.
 
Merci  
 
 :hello:


---------------
Mon topic - Mon Feed-Back
Reply

Marsh Posté le 19-04-2006 à 21:31:27    

RPL(1)                                                               BSD General Commands Manual                                                               RPL(1)
 
NAME
     rpl - replace strings in files
 
SYNOPSIS
     rpl [-LhiwbqvsRepfdt] [-xSUFFIX] <old_string> <new_string> <target_file ...>
 
DESCRIPTION
     Basic usage is to specify two strings and one or more filenames or directories on the command line.  The first string is the string to replace, and the second
     string is the replacement string.
 
     -h, --help
             A short help text.
 
     -L, --license
             Show the license and exit.
 
     -xSUFFIX
             Search only files ending with SUFFIX, e.g.  ``.txt''.  May be specified multiple times.
 
     -i, --ignore-case
             Ignore the case of old_string.
 
     -w, --whole-words
             Make old_string match only on word boundaries.
 
     -b, --backup
             Move the original files to filename~ before replacing them.
 
     -q, --quiet
             Quiet mode.
 
     -v, --verbose
             Verbose mode.
 
     -s, --dry-run
             Simulation mode, no files are changed.
 
     -R, --recursive
             Recurse into subdirectories.
 
     -e, --escape
             Expand escape sequences in old_string and new_string.  Examples of escape sequences are '\n' (new-line), '\t' (tab), '\x42' (hexadecimal number 42),
             '\033' (octal number 033).
 
     -p, --prompt
             Prompt for confirmation before replacing each file.
 
     -f, --force
             Ignore errors when trying to restore permissions and file ownership.
 
     -d, --keep-times
             Keep modification times when replacing files.
 
     -t, --use-tmpdir
             Use a temporary directory for storing temporary files, usually the value of the environment variable TMPDIR.  The default is to put temporary files in
             the same directory as the file being modified.
 
     -a, --all
             Do not ignore files and directories starting with .
 
IMPLEMENTATION NOTES
     An effort has been made to make the program behave as much as the original rpl as necessary.  Where it has been possible to make improvements, improvements have
     been made.  This implementation lacks many of the bugs in the original.
 
EXAMPLES
     Replace all occurences of ``F'' (on word boundaries) with ``A'' in all text files under the grades/ directory:
           $ rpl -Rwd -x'.txt' 'F' 'A' grades/
 
SEE ALSO
     find(1), sed(1).
 
HISTORY
     This program was written for Debian as a free replacement for the non-free rpl program by Joe Laffey.

Reply

Marsh Posté le 19-04-2006 à 22:44:34    

merci


---------------
Mon topic - Mon Feed-Back
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed