[Python] Supprimer la fin d'un fichier texte

Marsh Posté le 20-01-2010 à 10:59:17

Bonjour,

j'ai un petit problème en python:
je cherche à effacer toutes les lignes d'un fichier après la dernière occurence d'une chaîne de caractères (ligne où se trouve cette chaîne comprise).
Je suis en train de chercher depuis un bon moment la demarche à adopter pour réaliser ça où le module qui pourrait m'aider.

Merci de votre aide.

Message cité 1 fois

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 20-01-2010 à 10:59:17

Reply

Marsh Posté le 20-01-2010 à 11:21:42

Il faut :
1. créer un nouveau fichier,
2. copier tout l'ancien dans le nouveau sauf la fin,
3. supprimer l'ancien fichier, et renommer le nouveau fichier pour qu'il est le nom de l'ancien.

Reply

Marsh Posté le 20-01-2010 à 11:24:00

Tangrim a écrit :

Bonjour,

j'ai un petit problème en python:
je cherche à effacer toutes les lignes d'un fichier après la dernière occurence d'une chaîne de caractères (ligne où se trouve cette chaîne comprise).
Je suis en train de chercher depuis un bon moment la demarche à adopter pour réaliser ça où le module qui pourrait m'aider.

Merci de votre aide.

ouvres ton fichier, passes les lignes dans itertools.takewhile, écrits les lignes sorties dans un nouveau fichier, dernière opération optionnelle supprimes le fichier d'origine et renommes le nouveau.

$ python
Python 2.6.1 (r261:67515, Jul 7 2009, 23:51:51)
[GCC 4.2.1 (Apple Inc. build 5646)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import itertools
>>> with open('as.txt','w') as f:
... f.writelines(itertools.takewhile(lambda line: not line.lower().startswith('b'), open('/usr/share/dict/words')))
...
>>> ^D
$ wc -l /usr/share/dict/words
234936 /usr/share/dict/words
$ wc -l as.txt
17061 as.txt

dans as.txt, j'ai que les mots qui commence par "a".

---------------
I mean, true, a cancer will probably destroy its host organism. But what about the cells whose mutations allow them to think outside the box by throwing away the limits imposed by overbearing genetic regulations? Isn't that a good thing?

Reply

Marsh Posté le 20-01-2010 à 11:34:44

Pour les problèmes de suppression de lignes je comptais déjà passer par quelque chose de la sorte, le problème que j'ai est de detecter la dernière occurence d'une chaîne de caractères dans le fichier.

Je suis en train de lire la doc de "re" mais il ne me semble pas y avoir ce que je cherche.

Message cité 1 fois

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 20-01-2010 à 11:42:51

Tangrim a écrit :

Pour les problèmes de suppression de lignes je comptais déjà passer par quelque chose de la sorte, le problème que j'ai est de detecter la dernière occurence d'une chaîne de caractères dans le fichier.

cette occurence arrive dans toutes les lignes jusqu'à ce qu'elle n'arrive plus, ou bien c'est plus pifométrique, genre elle peut arriver n'importe où?

Et la chaîne à checker, c'est quel genre, elle a quelle tête?

Message édité par masklinn le 20-01-2010 à 11:43:35

---------------
I mean, true, a cancer will probably destroy its host organism. But what about the cells whose mutations allow them to think outside the box by throwing away the limits imposed by overbearing genetic regulations? Isn't that a good thing?

Reply

Marsh Posté le 20-01-2010 à 12:07:51

Elle peut arriver n'importe où, et elle n'est pas dans toutes les lignes.

Elle ressemble à:

- 15:53:15 (logmount) TIMESTAMP 10/1/2010

Comme la chaîne "TIMESTAMP" est la seule spécifique à cette ligne, j'étais parti pour detecter le dernier TIMESTAMP du fichier et effacer cette ligne, puis tout ce qui suit.

Message cité 1 fois

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 20-01-2010 à 12:15:46

Tangrim a écrit :

Elle peut arriver n'importe où, et elle n'est pas dans toutes les lignes.

Elle ressemble à:

- 15:53:15 (logmount) TIMESTAMP 10/1/2010

Comme la chaîne "TIMESTAMP" est la seule spécifique à cette ligne, j'étais parti pour detecter le dernier TIMESTAMP du fichier et effacer cette ligne, puis tout ce qui suit.

La ligne même ne doit pas être inclue?

---------------
I mean, true, a cancer will probably destroy its host organism. But what about the cells whose mutations allow them to think outside the box by throwing away the limits imposed by overbearing genetic regulations? Isn't that a good thing?

Reply

Marsh Posté le 20-01-2010 à 12:37:45

Si si.

Message cité 1 fois

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 20-01-2010 à 13:59:30

Tangrim a écrit :

Si si.

bah étant très feignant je dirais

Code :

from itertools import dropwhile
with open('file.name.out', 'w') as output:
    with open('file.name') as input:
        output.writelines(reversed(
            dropwhile(lambda line: 'TIMESTAMP' not in line,
                      reversed(input))))

il y a sûrement des erreurs, c'est pas testé du tout, mais ça devrait être un truc du style.

Message édité par masklinn le 20-01-2010 à 13:59:43

---------------
I mean, true, a cancer will probably destroy its host organism. But what about the cells whose mutations allow them to think outside the box by throwing away the limits imposed by overbearing genetic regulations? Isn't that a good thing?

Reply

Marsh Posté le 20-01-2010 à 14:33:51

Il y a une erreur de synthaxe quelque part mais je crois avoir pigé le principe, merci beaucoup pour ton aide.

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 20-01-2010 à 14:33:51

Reply

Marsh Posté le 20-01-2010 à 15:55:04

Ça fonctionne :

Code :

from itertools import dropwhile
inpout="/home/moi/python/alphabet"
output="/home/moi/python/alphabet2"
temp="/home/moi/python/tempo"
# lecture du fichier d'entrée
filetoparse=open(inpout,'r')
linetoparse=filetoparse.readlines()
filetoparse.close()
wtemp=open(temp,'w')
# écriture des lignes à garder à l'envers dans un fichier temporaire
wtemp.writelines(dropwhile(lambda line: "TIMESTAMP" not in line,reversed(linetoparse)))
wtemp.close()
# effacement de la première ligne du fichier
firstlinemustdie=open(temp,'r').readlines()
del firstlinemustdie[0]
firstlinedie=open(temp,'w').writelines(firstlinemustdie)
# lecture du fichier temporaire
filetoparse=open(temp,'r')
linetoparse=filetoparse.readlines()
filetoparse.close()
woutput=open(output,'w')
# écriture à l'envers (donc à l'endroit) dans le fichier de sortie
for line in reversed(linetoparse):
woutput.writelines(line)

Message édité par Tangrim le 20-01-2010 à 16:49:07

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 22-01-2010 à 14:05:53

J'arrive après la discussion... mais la création d'un fichier temporaire passe plutôt par un module spécialisé en Python : http://docs.python.org/library/tempfile.html, non ?

Message cité 1 fois

---------------
rule #1 : trust the python

Reply

Marsh Posté le 03-02-2010 à 13:53:25

suizokukan a écrit :

J'arrive après la discussion... mais la création d'un fichier temporaire passe plutôt par un module spécialisé en Python : http://docs.python.org/library/tempfile.html, non ?

Je suis en train de regarder ça, ça semble plus elegant que mon tempo en effet.

Merci.

---------------
Des Bisous et des nounours ! | Internet 2025 | Dungeon-Generator

Reply

Marsh Posté le 11-07-2010 à 10:26:15

Bizarre vos trucs me paraissent bien compliqués.

J'aurais à priori chargé, splitté sur le retour à la ligne, parcouru à l'inverse par indice pour retenir l'indice voulu et juste écrit la partie [ :indice ].

Message édité par gzii le 11-07-2010 à 10:26:29

Reply

Marsh Posté le 13-07-2010 à 22:18:01

C’est en effet compliqué, à cause du fait que le fichier est considéré comme constitué de lignes, alors que c’est essentiellement une succession de caractères.

Code :

with open('fichier coupable.txt','r+b') as f:
f.seek(f.read().rfind('TIMESTAMP'))
f.readline()
f.truncate()

L'ouverture en mode binaire est obligatoire sinon seek() risque de ne pas positionner au bon endroit.

Si le fichier est trop gros pour ne pas épuiser la RAM, on pourra facilement adapter ce code pour rechercher dans le fichier par morceaux.

Message édité par eyquem le 13-07-2010 à 22:20:36

Reply

[Python] Supprimer la fin d'un fichier texte

Sujets relatifs:

Leave a Replay