Formats pris en charge
Avec le TextEncoder, vous pouvez modifier l’encodage et le type de saut de ligne de fichiers texte. Sur cette page, nous avons compilé pour vous les codecs et les sauts de ligne que le TextEncoder peut lire, écrire et modifier.
Encodages
Les encodages suivants peuvent être lus et écrits avec le TextEncoder. Dans la colonne "BOM", vous pouvez voir si le codage prend en charge une marque d’ordre d’octet (Byte Order Mark). Dans la colonne des paramètres, vous pouvez voir quel paramètre vous pouvez utiliser dans la version de traitement par lots pour convertir les fichiers au format correspondant via un script.
Codage | Description | BOM | Paramètre |
ASCII | Codage 7 bits avec 128 caractères (00 à 7F) | non | ascii |
Latin-1 | Codage 8 bits selon ISO 8859-1 | non | latin1 |
Latin-2 | Codage 8 bits selon ISO 8859-2 | non | latin2 |
WIN-ANSI | Page de Code ANSI dépendante de la langue de votre installation Windows | non | win-ansi |
WIN-1250 | Page de Code Windows 1250 (Europe Centrale) | non | win-1250 |
WIN-1251 | Page de Code Windows 1251 (Cyrillique) | non | win-1251 |
WIN-1252 | Page de Code Windows 1252 (Europe de l’Ouest) | non | win-1252 |
WIN-1253 | Page de Code Windows 1253 (Grec) | non | win-1253 |
CP437 | Code Page 437 (CP437, IBM437, OEM-US) | non | cp437 |
UTF-7 | Pour l’utilisation d’Unicode dans les environnements non-8 bits | oui | utf7 |
UTF-8 | Encodage Unicode avec de 1 à 4 octets variables par caractère | oui | utf8 |
UTF-16 LE | Encodage Unicode à 2 ou 4 octets variables par caractère, Little Endian | oui | utf16le |
UTF-16 BE | Encodage Unicode à 2 ou 4 octets variables par caractère, Big Endian | oui | utf16be |
UTF-32 LE | Encodage Unicode avec 4 octets fixes par caractère, Little Endian | oui | utf32le |
UTF-32 BE | Encodage Unicode avec 4 octets fixes par caractère, Big Endian | oui | utf32be |
En savoir plus sur chaque encodage dans l'introduction aux formats de fichier texte Unicode.
Sauts de Ligne
Les types de saut de ligne suivante peuvent être lus et écrits avec le Text Encoder. Dans la colonne "Paramètre", vous pouvez voir le paramètre que vous pouvez utiliser dans la version de lot pour changer le saut de ligne de fichiers via un script dans le type respectif.
Saut de Ligne | Système / Désignation | Code Point | Paramètre |
CRLF | Windows, DOS, OS/2, CP/M, Symbian, Palm, Atari | U+000D + U+000A | crlf |
LF | Unix, Linux, macOS, Mac OS X, Android, AmigaOS, BSD | U+000A | lf |
CR | Classic Mac OS, Apple II, Commodore C64, OS-9 | U+000D | cr |
NL | EBCDIC New Line - IBM Mainframe Systems | U+0015 | nl |
RNL | EBCDIC Require New Line | U+0006 | rnl |
LF | EBCDIC Line Feed | U+0025 | lf_ebcdic |
EOL | ATASCII End Of Line | U+009B | eol |
GS | Group Separator | U+001D | gs |
RS | Record Separator | U+001E | rs |
US | Unit Separator | U+001F | us |
FF | Unicode Form Feed | U+000C | ff |
NEL | Unicode Next Line | U+0085 | nel |
LS | Unicode Line Separator | U+2028 | ls |
PS | Unicode Paragraph Separator | U+2029 | ps |
VT | Vertical Tab | U+000B | vt |
TAB | Horizontal Tab | U+0009 | tab |
FIXED | Longueur de ligne fixe (x = Nombre de Caractères) | - | fixedlength-x |
NOCHAR | Pas de caractère | - | nochar |
- | Saut de Ligne au Caractère x personnalisé | - | customstr-x |
- | Saut de Ligne au Point de Code x personnalisé | - | customcp-x |
- | Saut de Ligne à l'un des Caractères x, y ou z | - | customstrs-x,y,z |
- | Saut de Ligne à l'un des Points de Code x, y ou z | - | customcps-x,y,z |
Voir l’introduction aux nouvelles lignes pour en savoir plus sur les différents types de sauts de ligne. De plus, nous recommandons le didacticiel AskingBox sur la réécriture de fichiers texte avec une longueur de ligne fixe concernant les types de pause de ligne FIXED et NOCHAR.
Sauts de Ligne personnalisées
En plus des types de saut de ligne prédéfinis répertoriés dans le tableau ci-dessus, tous les caractères et chaînes personnalisées peuvent également être utilisées comme un saut de ligne. Ces caractères peuvent être définis comme texte ou sous forme de points de code dans le TextEncoder. Pour cela, dans l'interface utilisateur graphique, sous "Lire comme" et "Sauver sous", vous pouvez sélectionner les options "Caractère personnalisé" ou "Point de code personnalisé" et entrez les caractères ou les points de code souhaités dans le champ ci-dessous. Les points de code peuvent être spécifiés de trois manières différentes: hexadécimal (par exemple #0D#0A), décimal (par exemple 13 10) ou sous la forme U+X (par exemple, U+0D U+0A ou U+000D U+000A).
Lors du contrôle du TextEncoder via la ligne de commande, vous pouvez utiliser les paramètres customstr-x et customcp-x pour les sauts de ligne personnalisées. Le x signifie les caractères ou les points de code respectifs définis par l'utilisateur, par exemple: customstr-a (caractère de saut de ligne est la lettre a) ou customcp-#0D#0A (saut de ligne sur la chaîne définie par les points de code #0D#0A = Saut de Ligne de Windows CR LF).
Sauts de Ligne en plusieurs Caractères
Pour les sauts de ligne en plusieurs caractères différents, les options "Saut de ligne à chacun de ces caractères (séparé par des virgules)" et "Saut de ligne à chacun de ces points de code (séparé par des virgules)" ou les paramètres customstrs-x et customcps-x peut être utilisé.
Tous les caractères qui doivent être interprétés comme un saut de ligne peuvent être définis séparés par des virgules. Par exemple, "a,b" pour les sauts de ligne aux deux, sur chaque "a" et sur chaque "b". De même, vous pouvez définir les paramètres pour le ligne de commande: par exemple, customstrs-",",";" (saut de ligne sur chaque virgule et sur chaque point-virgule) ou customcps-#0A,#0D (saut de ligne sur les deux points de code #0A ou #0D = LF ou CR).
Plus d'informations sur ce sujet sont disponibles dans le didacticiel AskingBox sur les fichiers texte avec des sauts de ligne mixtes.