[Edition de fichier] j'ai des "^@" intercalés partout > Unicode inside

j'ai des "^@" intercalés partout > Unicode inside [Edition de fichier] - Logiciels - Linux et OS Alternatifs

Marsh Posté le 18-12-2002 à 22:25:41    

Hello,
 
Je regardes des fichiers de log générés sur un serveur Unreal Tournament tournant sous Linux et entre chaque caractère j'ai un ^@ qui apparait, c'est assez embetant pour le lire =). Voici un exemple ou on voit marqué game GameMutator
 

^@g^@a^@m^@e^@  ^@G^@a^@m^@e^@M^@u^@t^@a^@t^@o^@r^@  

 
 
Y'a t'il une explication à cela avant de tenter une quelconque modfications via sed ou autre ? (ou j'aurais besoin d'aide :D)
 
A+


Message édité par Evadream -jbd- le 19-12-2002 à 00:24:21
Reply

Marsh Posté le 18-12-2002 à 22:25:41   

Reply

Marsh Posté le 18-12-2002 à 22:33:58    

En faisant un cat sur ce fichier, il s'affiche correctement. Mais en redirigeant le cat sur un fichier et en éditant celui après, j'ai toujours la même chose :/

Reply

Marsh Posté le 18-12-2002 à 22:54:26    

Je viens de faire des essais non concluant avec flip et dos2unix :/

Reply

Marsh Posté le 18-12-2002 à 23:09:11    

UT => Unicode => log d'UT en Unicode
 
Le caractère ^@ correspond au caractère 0x00 en hexa. Unicode donc :)

Reply

Marsh Posté le 18-12-2002 à 23:20:18    

Merci pour ta rapide réponse ! Je vais chercher dans ce sens. Cependant, je suis pas très familié avec tous ces problèmes. N'y a t'il pas des outils de conversion, ou bien des commande via cat qui pourraient me permettre de récupérer ce que je souhaite ?
 
Je n'ai pas vu grand chose d'exploitable de le man cat :/
 
Merci, a+

Reply

Marsh Posté le 18-12-2002 à 23:40:48    

Il me faudrait en fait un cat unicode alors ?
 
Ca existe ? :D

Reply

Marsh Posté le 18-12-2002 à 23:59:29    

Je suis en train de lire le Unicode HowTo, c'est fichtrement intéressant.

Reply

Marsh Posté le 19-12-2002 à 00:10:01    

J'ai tenté un less apres un export LESSCHARSET=utf-8 mais ca passe pas :/

Reply

Marsh Posté le 19-12-2002 à 01:41:07    

J'ai cross posté sur Programmation :
 
http://forum.hardware.fr/forum2.ph [...] ubcat=#bas
 

Reply

Marsh Posté le 19-12-2002 à 10:28:39    

En fait, le charset n'est pas UTF-8 mais UTF-16. La preuve car il stoque tes lettres de base sur 16 bits : "^@A" soit 2 octets pour representer le caractere A
 
Sinon, trouve toi yudit ;)

Reply

Marsh Posté le 19-12-2002 à 10:28:39   

Reply

Marsh Posté le 19-12-2002 à 12:07:12    

Ok, merci bien ! Je comprends donc pourquoi la petite fonction que j'ai mis au point ( cf. lien vers programmation ) fonctionne.
 
Encore merci pour toutes tes infos !
 
A+

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed