Passer en UTF8 ?

Passer en UTF8 ? - Débats - Linux et OS Alternatifs

Marsh Posté le 09-04-2007 à 12:21:32    

J'ai vu qu'Etch était maintenant par défaut en UTF8, tout comme Ubuntu. Une question me taraude : qu'est-ce que ça apporte comme avantage de passer en UTF8 depuis du ISOsamère-1 ? Il y a une procédure correcte écrite quelque part ?

Reply

Marsh Posté le 09-04-2007 à 12:21:32   

Reply

Marsh Posté le 09-04-2007 à 13:50:37    

C'est le bordel tous ces encodages... ça te fait des caractères alakon si tu reçois une mail (simple exemple) d'un autre encodage.
L'avantage de l'UTF-8 je crois, c'est qu'il serait universel (anglais et français notamment, donc plus de pb avec les € et accents).
Information à confirmer, j'ai un doute malgré tout.

Reply

Marsh Posté le 09-04-2007 à 13:51:48    

ah oui, pour la migration, il existe iconv (à vérifier aussi ! je fais tout de mémoire). Certains ont même créé des scripts pour automatiser le transfert. :sol:


Message édité par cactus le 09-04-2007 à 13:52:00
Reply

Marsh Posté le 09-04-2007 à 14:01:23    

J'ai donné 2~3 éléments de réponse ici :
   ---> http://forum.hardware.fr/hfr/OSAlt [...] tm#t901529


---------------
THRAK (def.) : 1) A sudden and precise impact moving from intention, direction and commitment, in service of an aim. 2) 117 guitars almost striking the same chord simultaneously.
Reply

Marsh Posté le 09-04-2007 à 15:04:29    

Merci THRAK pour ton excellent commentaire ! :jap:

Reply

Marsh Posté le 09-04-2007 à 19:41:01    

UTF-8 est basé sur unicode qui est un encodage universel capable de restituer n'importe quel caractère de n'importe quelle langue : Français, Anglais, Arabe, Chinois, Géorgien..... et bien plus : le codage utilisé s'étale sur 32 bits (si je me rappelle bien) soit plus de 4 milliards de caractères.
 
 
http://fr.wikipedia.org/wiki/Unicode
http://fr.wikipedia.org/wiki/UTF-8

Reply

Marsh Posté le 10-04-2007 à 23:07:58    

Merci THRAK :jap:
Faut pas faire attention aux noms de fichiers aussi ?
 
J'ai lancé une commande pour chercher des noms louches :
find / -ls | sed 's/\\ //g; s/\\303\\...//g' | grep '\\' | more
 
L'idée, c'est que les caractères indésirables apparaissent avec un "\".
Mais j'ignore aussi les espaces et les caractères déjà en utf-8 (google-earth chez moi).
 
Je me pose la question de la compatibilité avec les cd/dvd aussi.
J'ai trouvé ça :
http://developpeur.journaldunet.co [...] WTO-3.html
 
Je vais le lire. :o

Message cité 1 fois
Message édité par regdub le 10-04-2007 à 23:08:17

---------------
Legalize it @HFR
Reply

Marsh Posté le 10-04-2007 à 23:15:36    

Déjà, il y a une version plus récente en anglais.
ftp://ftp.ilog.fr/pub/Users/haibl [...] HOWTO.html


---------------
Legalize it @HFR
Reply

Marsh Posté le 11-04-2007 à 12:35:43    

regdub a écrit :

Déjà, il y a une version plus récente en anglais.
ftp://ftp.ilog.fr/pub/Users/haibl [...] HOWTO.html


Je ne sais pas s'il y avait grand chose à tirer de ce doc de 2001. [:gnub]
 
Finalement, je me suis appuyé sur une procédure adaptée à ma distrib.
http://www.vcn.bc.ca/~dugan/setting-up-slackware.html
 
Elvis n'a pas l'air de connaître utf-8, mais vim est bon.
Il repasse en latin1 sur les fichiers qui ne sont pas convertis.
 
Et il y a quelque chose qui marche mieux qu'avant, c'est quand je copie un bout de texte avec des accents sur une page web comme celle-là : http://www.radiofrance.fr/francein [...] p?id=53662
et que je le collais dans le nom du fichier lors d'un "save link as".
 
Avant, j'avais du n'importe quoi dans les caractères, une sorte d'utf-8 corrompu et maintenant, ça marche bien.


Message édité par regdub le 11-04-2007 à 12:36:29

---------------
Legalize it @HFR
Reply

Marsh Posté le 11-04-2007 à 14:42:27    

Il y a pour debian un paquet utf8-migration-tool  (et dire que je me suis cassé le cxx à faire un script  mais bon le paquet n'existait pas encore)
Une fois la migration faite c'est bien il n'y a plus de problème.
Le plus difficile a été pour moi php+mysql pour les requètes.

Reply

Marsh Posté le 11-04-2007 à 14:42:27   

Reply

Marsh Posté le 12-04-2007 à 13:50:32    

regdub a écrit :

Merci THRAK :jap:
Faut pas faire attention aux noms de fichiers aussi ?


À nouveau ça ne concerne pas les fichiers systèmes, mais uniquement les fichiers personnels. Comme je l'indiquais avant, le passage en UTF-8 n'a pas de réelle incidence sur le système en soi : c'est pas le genre de migration où l'on risque de se retrouver avec un OS en carafe.
 
Maintenant pour ce qui est des noms de fichiers, il faudra utiliser un utilitaire de conversion ou pas, en fonction de comment on a nommé ses fichiers personnels. On ne le dira jamais assez, certaines règles et conventions de nommage pour les fichiers ce n'est pas là pour emmerder le monde ou pour décorer, ça rend bien des services de ne pas avoir de caractères exotiques, de noms à rallonge ou même simplement des espaces dans certains cas.
 
Généralement le mec qui nomme un fichier : Vive les systèmes basés sur BSD, GNU/Linux & GNU/Hurd !.txt par exemple, on sent qu'il n'a jamais réellement bossé en ligne de commande, parce que c'est typiquement avec ce type d'environnement qu'on se rend compte combien c'est la misère les noms de fichiers foireux et à rallonge (encore qu'avec un shell comme bash ou zsh et l'auto complétion activée ça se ressent moins).
 
Certains diront qu'avec les systèmes modernes si l'on se passe de la ligne de commande, il n'y a aucun intérêt à les nommer d'une façon précise. Ce n'est pas forcément vrai pour des questions d'interopérabilité (cf. les différences entre les systèmes de fichiers existants), ensuite il y a des situations comme le changement d'encodage, la récupération de fichiers suite à un problème de disque, etc. où la question de nommer correctement ses fichiers amène à réfléchir.


---------------
THRAK (def.) : 1) A sudden and precise impact moving from intention, direction and commitment, in service of an aim. 2) 117 guitars almost striking the same chord simultaneously.
Reply

Marsh Posté le 12-04-2007 à 15:55:19    

Donc, tu vas bannir les accents et "ç" dans les noms de fichiers ?
 
Parce que pour les espaces, "/", "!" et autres, je suis bien d'accord, surtout que l'utf-8 ne change rien par rapport à ça.


---------------
Legalize it @HFR
Reply

Marsh Posté le 12-04-2007 à 18:22:34    

regdub a écrit :

Donc, tu vas bannir les accents et "ç" dans les noms de fichiers ?
 
Parce que pour les espaces, "/", "!" et autres, je suis bien d'accord, surtout que l'utf-8 ne change rien par rapport à ça.


Dans mes noms de fichiers oui, je m'en fous pas mal qu'il n'y ait pas d'accent et de 'ç' ; faut dire que j'ai pour habitude de nommer mes fichiers en anglais (automatiquement c'est tout de suite plus simple et plus court :D ).


---------------
THRAK (def.) : 1) A sudden and precise impact moving from intention, direction and commitment, in service of an aim. 2) 117 guitars almost striking the same chord simultaneously.
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed