Passer en UTF8 ? - Débats - Linux et OS Alternatifs
Marsh Posté le 09-04-2007 à 13:50:37
C'est le bordel tous ces encodages... ça te fait des caractères alakon si tu reçois une mail (simple exemple) d'un autre encodage.
L'avantage de l'UTF-8 je crois, c'est qu'il serait universel (anglais et français notamment, donc plus de pb avec les et accents).
Information à confirmer, j'ai un doute malgré tout.
Marsh Posté le 09-04-2007 à 13:51:48
ah oui, pour la migration, il existe iconv (à vérifier aussi ! je fais tout de mémoire). Certains ont même créé des scripts pour automatiser le transfert.
Marsh Posté le 09-04-2007 à 14:01:23
J'ai donné 2~3 éléments de réponse ici :
---> http://forum.hardware.fr/hfr/OSAlt [...] tm#t901529
Marsh Posté le 09-04-2007 à 19:41:01
UTF-8 est basé sur unicode qui est un encodage universel capable de restituer n'importe quel caractère de n'importe quelle langue : Français, Anglais, Arabe, Chinois, Géorgien..... et bien plus : le codage utilisé s'étale sur 32 bits (si je me rappelle bien) soit plus de 4 milliards de caractères.
http://fr.wikipedia.org/wiki/Unicode
http://fr.wikipedia.org/wiki/UTF-8
Marsh Posté le 10-04-2007 à 23:07:58
Merci THRAK
Faut pas faire attention aux noms de fichiers aussi ?
J'ai lancé une commande pour chercher des noms louches :
find / -ls | sed 's/\\ //g; s/\\303\\...//g' | grep '\\' | more
L'idée, c'est que les caractères indésirables apparaissent avec un "\".
Mais j'ignore aussi les espaces et les caractères déjà en utf-8 (google-earth chez moi).
Je me pose la question de la compatibilité avec les cd/dvd aussi.
J'ai trouvé ça :
http://developpeur.journaldunet.co [...] WTO-3.html
Je vais le lire.
Marsh Posté le 10-04-2007 à 23:15:36
Déjà, il y a une version plus récente en anglais.
ftp://ftp.ilog.fr/pub/Users/haibl [...] HOWTO.html
Marsh Posté le 11-04-2007 à 12:35:43
regdub a écrit : Déjà, il y a une version plus récente en anglais. |
Je ne sais pas s'il y avait grand chose à tirer de ce doc de 2001.
Finalement, je me suis appuyé sur une procédure adaptée à ma distrib.
http://www.vcn.bc.ca/~dugan/setting-up-slackware.html
Elvis n'a pas l'air de connaître utf-8, mais vim est bon.
Il repasse en latin1 sur les fichiers qui ne sont pas convertis.
Et il y a quelque chose qui marche mieux qu'avant, c'est quand je copie un bout de texte avec des accents sur une page web comme celle-là : http://www.radiofrance.fr/francein [...] p?id=53662
et que je le collais dans le nom du fichier lors d'un "save link as".
Avant, j'avais du n'importe quoi dans les caractères, une sorte d'utf-8 corrompu et maintenant, ça marche bien.
Marsh Posté le 11-04-2007 à 14:42:27
Il y a pour debian un paquet utf8-migration-tool (et dire que je me suis cassé le cxx à faire un script mais bon le paquet n'existait pas encore)
Une fois la migration faite c'est bien il n'y a plus de problème.
Le plus difficile a été pour moi php+mysql pour les requètes.
Marsh Posté le 12-04-2007 à 13:50:32
regdub a écrit : Merci THRAK |
À nouveau ça ne concerne pas les fichiers systèmes, mais uniquement les fichiers personnels. Comme je l'indiquais avant, le passage en UTF-8 n'a pas de réelle incidence sur le système en soi : c'est pas le genre de migration où l'on risque de se retrouver avec un OS en carafe.
Maintenant pour ce qui est des noms de fichiers, il faudra utiliser un utilitaire de conversion ou pas, en fonction de comment on a nommé ses fichiers personnels. On ne le dira jamais assez, certaines règles et conventions de nommage pour les fichiers ce n'est pas là pour emmerder le monde ou pour décorer, ça rend bien des services de ne pas avoir de caractères exotiques, de noms à rallonge ou même simplement des espaces dans certains cas.
Généralement le mec qui nomme un fichier : Vive les systèmes basés sur BSD, GNU/Linux & GNU/Hurd !.txt par exemple, on sent qu'il n'a jamais réellement bossé en ligne de commande, parce que c'est typiquement avec ce type d'environnement qu'on se rend compte combien c'est la misère les noms de fichiers foireux et à rallonge (encore qu'avec un shell comme bash ou zsh et l'auto complétion activée ça se ressent moins).
Certains diront qu'avec les systèmes modernes si l'on se passe de la ligne de commande, il n'y a aucun intérêt à les nommer d'une façon précise. Ce n'est pas forcément vrai pour des questions d'interopérabilité (cf. les différences entre les systèmes de fichiers existants), ensuite il y a des situations comme le changement d'encodage, la récupération de fichiers suite à un problème de disque, etc. où la question de nommer correctement ses fichiers amène à réfléchir.
Marsh Posté le 12-04-2007 à 15:55:19
Donc, tu vas bannir les accents et "ç" dans les noms de fichiers ?
Parce que pour les espaces, "/", "!" et autres, je suis bien d'accord, surtout que l'utf-8 ne change rien par rapport à ça.
Marsh Posté le 12-04-2007 à 18:22:34
regdub a écrit : Donc, tu vas bannir les accents et "ç" dans les noms de fichiers ? |
Dans mes noms de fichiers oui, je m'en fous pas mal qu'il n'y ait pas d'accent et de 'ç' ; faut dire que j'ai pour habitude de nommer mes fichiers en anglais (automatiquement c'est tout de suite plus simple et plus court ).
Marsh Posté le 09-04-2007 à 12:21:32
J'ai vu qu'Etch était maintenant par défaut en UTF8, tout comme Ubuntu. Une question me taraude : qu'est-ce que ça apporte comme avantage de passer en UTF8 depuis du ISOsamère-1 ? Il y a une procédure correcte écrite quelque part ?