TextEncoder

Formats pris en charge

Avec le TextEncoder, vous pouvez modifier l’encodage et le type de saut de ligne de fichiers texte. Sur cette page, nous avons compilé pour vous les codecs et les sauts de ligne que le TextEncoder peut lire, écrire et modifier.

Encodages

Les encodages suivants peuvent être lus et écrits avec le TextEncoder. Dans la colonne "BOM", vous pouvez voir si le codage prend en charge une marque d’ordre d’octet (Byte Order Mark). Dans la colonne des paramètres, vous pouvez voir quel paramètre vous pouvez utiliser dans la version de traitement par lots pour convertir les fichiers au format correspondant via un script.

CodageDescriptionBOMParamètre
ASCIICodage 7 bits avec 128 caractères (00 à 7F)
nonascii
Latin-1Codage 8 bits selon ISO 8859-1
nonlatin1
Latin-2Codage 8 bits selon ISO 8859-2
nonlatin2
WIN-ANSIPage de Code ANSI dépendante de la langue de votre installation Windows
nonwin-ansi
WIN-1250Page de Code Windows 1250 (Europe Centrale)
nonwin-1250
WIN-1251Page de Code Windows 1251 (Cyrillique)nonwin-1251
WIN-1252Page de Code Windows 1252 (Europe de l’Ouest)nonwin-1252
WIN-1253Page de Code Windows 1253 (Grec)nonwin-1253
CP437Code Page 437 (CP437, IBM437, OEM-US)noncp437
UTF-7Pour l’utilisation d’Unicode dans les environnements non-8 bits
ouiutf7
UTF-8Encodage Unicode avec de 1 à 4 octets variables par caractère
ouiutf8
UTF-16 LE
Encodage Unicode à 2 ou 4 octets variables par caractère, Little Endian
ouiutf16le
UTF-16 BE
Encodage Unicode à 2 ou 4 octets variables par caractère, Big Endian
ouiutf16be
UTF-32 LE
Encodage Unicode avec 4 octets fixes par caractère, Little Endian
ouiutf32le
UTF-32 BE
Encodage Unicode avec 4 octets fixes par caractère, Big Endianouiutf32be

En savoir plus sur chaque encodage dans l'introduction aux formats de fichier texte Unicode.

Sauts de Ligne

Les types de saut de ligne suivante peuvent être lus et écrits avec le Text Encoder. Dans la colonne "Paramètre", vous pouvez voir le paramètre que vous pouvez utiliser dans la version de lot pour changer le saut de ligne de fichiers via un script dans le type respectif.

Saut de LigneSystème / Désignation
Code Point
Paramètre
CRLF
Windows, DOS, OS/2, CP/M, Symbian, Palm, AtariU+000D + U+000Acrlf
LFUnix, Linux, macOS, Mac OS X, Android, AmigaOS, BSDU+000Alf
CRClassic Mac OS, Apple II, Commodore C64, OS-9U+000Dcr
NLEBCDIC New Line - IBM Mainframe SystemsU+0015nl
RNLEBCDIC Require New LineU+0006rnl
LFEBCDIC Line FeedU+0025lf_ebcdic
EOLATASCII End Of LineU+009Beol
GSGroup SeparatorU+001Dgs
RSRecord SeparatorU+001Ers
USUnit SeparatorU+001Fus
FFUnicode Form Feed
U+000Cff
NELUnicode Next Line
U+0085nel
LSUnicode Line Separator
U+2028ls
PSUnicode Paragraph Separator
U+2029ps
VTVertical Tab
U+000Bvt
TABHorizontal Tab
U+0009tab
FIXEDLongueur de ligne fixe (x = Nombre de Caractères)
-fixedlength-x
NOCHARPas de caractère
-nochar
-Saut de Ligne au Caractère x personnalisé-customstr-x
-Saut de Ligne au Point de Code x personnalisé-customcp-x
-Saut de Ligne à l'un des Caractères x, y ou z-customstrs-x,y,z
-Saut de Ligne à l'un des Points de Code x, y ou z-customcps-x,y,z

Voir l’introduction aux nouvelles lignes pour en savoir plus sur les différents types de sauts de ligne. De plus, nous recommandons le didacticiel AskingBox sur la réécriture de fichiers texte avec une longueur de ligne fixe concernant les types de pause de ligne FIXED et NOCHAR.

Sauts de Ligne personnalisées

En plus des types de saut de ligne prédéfinis répertoriés dans le tableau ci-dessus, tous les caractères et chaînes personnalisées peuvent également être utilisées comme un saut de ligne. Ces caractères peuvent être définis comme texte ou sous forme de points de code dans le TextEncoder. Pour cela, dans l'interface utilisateur graphique, sous "Lire comme" et "Sauver sous", vous pouvez sélectionner les options "Caractère personnalisé" ou "Point de code personnalisé" et entrez les caractères ou les points de code souhaités dans le champ ci-dessous. Les points de code peuvent être spécifiés de trois manières différentes: hexadécimal (par exemple #0D#0A), décimal (par exemple 13 10) ou sous la forme U+X (par exemple, U+0D U+0A ou U+000D U+000A).

Lors du contrôle du TextEncoder via la ligne de commande, vous pouvez utiliser les paramètres customstr-x et customcp-x pour les sauts de ligne personnalisées. Le x signifie les caractères ou les points de code respectifs définis par l'utilisateur, par exemple: customstr-a (caractère de saut de ligne est la lettre a) ou customcp-#0D#0A (saut de ligne sur la chaîne définie par les points de code #0D#0A = Saut de Ligne de Windows CR LF).

Sauts de Ligne en plusieurs Caractères

Pour les sauts de ligne en plusieurs caractères différents, les options "Saut de ligne à chacun de ces caractères (séparé par des virgules)" et "Saut de ligne à chacun de ces points de code (séparé par des virgules)" ou les paramètres customstrs-x et customcps-x peut être utilisé.

Tous les caractères qui doivent être interprétés comme un saut de ligne peuvent être définis séparés par des virgules. Par exemple, "a,b" pour les sauts de ligne aux deux, sur chaque "a" et sur chaque "b". De même, vous pouvez définir les paramètres pour le ligne de commande: par exemple, customstrs-",",";" (saut de ligne sur chaque virgule et sur chaque point-virgule) ou customcps-#0A,#0D (saut de ligne sur les deux points de code #0A ou #0D = LF ou CR).

Plus d'informations sur ce sujet sont disponibles dans le didacticiel AskingBox sur les fichiers texte avec des sauts de ligne mixtes.