TextEncoder

Batch Text Encoder

Avec la version du programme TextEncoder Pro CL, vous pouvez modifier le codage et le saut de ligne utilisé des fichiers texte via la ligne de commande. Cela permet de contrôler le TextEncoder via un script. Sur cette page, nous aimerions vous présenter le sujet et vous montrer quelques exemples d’utilisation du TextEncoder pour éditer et convertir des fichiers individuels ou le contenu de dossiers entiers. De plus, au bas de cette page, vous trouverez un aperçu de tous les paramètres que vous pouvez utiliser.

Convertir un ou plusieurs Fichiers

Commençons par un exemple simple. Nous aimerions changer l’encodage d’un seul fichier en UTF-8. Pour cela, nous passons les paramètres suivants:

TextEncoder.exe -cl C:\test.txt enc=utf8

Vous voyez d’abord le paramètre -cl, qui signifie "command line (ligne de commande). Ce paramètre détermine si le TextEncoder est démarré avec une interface utilisateur graphique ou en mode ligne de commande sans interface utilisateur graphique. Nous utilisons toujours ce paramètre si nous voulons contrôler le TextEncoder via la ligne de commande. Si nous omettons ce paramètre, le TextEncoder démarre normalement avec une fenêtre. En tant que paramètre suivant, nous passons le chemin du fichier que nous voulons éditer. Enfin, nous passons enc=utf8. Cela indique que nous souhaitons convertir au codage UTF-8. Au bas de cette page, vous trouverez une liste de tous les encodages que nous pouvons vous remettre ici. Cette commande convertit le fichier C:\test.txt au format UTF-8.

De même, nous contrôlons le changement du type de saut de ligne. L’exemple suivant modifie le saut de ligne du fichier C:\test.txt en CR LF (Windows).

TextEncoder.exe -cl C:\test.txt lb=crlf

Ensuite, nous voulons spécifier explicitement que le marque d’ordre des octets (Byte Order Mark, bom) est écrit dans le fichier. Nous faisons cela avec le paramètre "bom":

TextEncoder.exe -cl C:\test.txt enc=utf8 bom=1

Le paramètre "bom" peut prendre les valeurs "keep", "0" ou "1". Avec "1", la marque d’ordre des octets est toujours écrite dans le fichier, avec "0" jamais. Avec "keep", l’état du fichier d’origine est adopté (si possible). En d’autres termes, si le fichier d’origine a une marque d’ordre d’octet, une marque d’ordre d’octet est également écrite dans le fichier. Si non, pas.

Jusqu’ici, nous avons toujours écrasé le fichier C:\test.txt. Nous voulons maintenant enregistrer le fichier converti en tant que nouveau fichier. Pour cela, nous utilisons le paramètre "save":

TextEncoder.exe -cl C:\test.txt enc=latin1 save=C:\nouveau.txt

Ici, nous modifions l’encodage du fichier C:\test.txt en Latin 1 (ISO 8859-1) et sauvegardons le fichier sous C:\nouveau.txt. Le fichier C:\test.txt reste inchangé.

TextEncoder.exe -cl C:\test1.txt C:\test2.txt enc=utf16le

Bien sûr, nous pouvons aussi éditer plusieurs fichiers en même temps. Par exemple, dans cet exemple, nous allons convertir les fichiers C:\test1.txt et C:\test2.txt au format UTF16-LE. Vous pouvez spécifier autant de fichiers que vous le souhaitez.

Convertir le Contenu des Dossiers

En plus de spécifier des fichiers individuels, vous pouvez également transmettre le chemin d’accès à un dossier pour en modifier le contenu. La syntaxe est la même que celle utilisée pour éditer des fichiers:

TextEncoder.exe -cl C:\dossier enc=utf8

Cette commande convertit tous les fichiers du dossier C:\dossier au format UTF-8. Si vous ne souhaitez pas écraser le fichier, vous pouvez utiliser l’un des paramètres save-folder, save-name ou save-ext pour modifier le dossier, le nom du fichier ou l’extension du fichier des fichiers modifiés afin que les fichiers modifiés soient sauvegardés en tant que nouveaux fichiers.

TextEncoder.exe -cl C:\dossier enc=utf8 save-folder=C:\nouveaudossier

Dans cet exemple, nous convertissons tous les fichiers du dossier C:\dossier au format UTF-8 et enregistrons le résultat dans le dossier C:\nouveaudossier. Les fichiers d’origine restent inchangés.

TextEncoder.exe -cl C:\dossier enc=utf8 save-folder=C:\nouveau save-name=%%jjjj%%-%%mm%%-%%tt%

Dans cet exemple, nous souhaitons changer non seulement le dossier mais également le nom du fichier. Ici, nous sauvegardons les fichiers du dossier C:\dossier au format UTF-8 dans le nouveau dossier C:\nouveaudossier et modifions le nom du fichier à la date du jour. C’est ce que signifient les espaces réservés utilisés dans le paramètre "save-name". Comme nous n’avons pas défini de nouvelle extension de fichier avec le paramètre "save-ext", l’extension de fichier du fichier d’origine respectif est adoptée.

Si nous ne voulons pas convertir tous les fichiers du dossier, nous pouvons passer des filtres en utilisant des paramètres. Par exemple, pour éditer uniquement les fichiers d’une certaine extension:

TextEncoder.exe -cl C:\dossier enc=utf8 filter-ext=txt

Nous passons ici le paramètre "filter-ext" avec la valeur "txt". Cela signifie que nous voulons uniquement éditer des fichiers avec l’extension TXT. S’il existe des fichiers avec d’autres terminaisons dans le même dossier, ils ne seront pas pris en compte. Plusieurs extensions de fichier peuvent être spécifiées comme suit:

TextEncoder.exe -cl C:\dossier enc=utf8 filter-ext=txt-htm

Ce filtre garantit que seuls les fichiers portant les extensions TXT ou HTM sont convertis à partir du dossier C:\dossier. Plus de filtres et des options de recherche se trouvent au bas de cette page dans la liste de tous les paramètres disponibles.

TextEncoder.exe -cl C:\dossier enc=utf8 search-subdirs=0

De plus, vous pouvez utiliser le paramètre "search-subdirs" pour spécifier si seuls les fichiers directement au premier niveau du dossier spécifié doivent être modifiés ou si tous les sous-dossiers du dossier spécifié doivent également être inclus. Dans cet exemple, nous spécifions search-subdirs=0. Le résultat est que les fichiers qui se trouvent dans les sous-dossiers ne sont pas traités. Si vous omettez ce paramètre ou passez search-subdirs=1, tous les fichiers de tous les sous-dossiers sont également traités. Dans l’exemple, par exemple, les fichiers d’un dossier tel que C:\dossier\dossier1\dossier2.

Lire des Fichiers en utilisant un Format spécifique

Normalement, le TextEncoder devine le codage et le saut de ligne des fichiers existants et lit les fichiers sur cette base. Bien sûr, vous pouvez également appliquer un type de codage ou de saut de ligne spécifique lors de la lecture des fichiers. Vous faites cela avec les paramètres enc-read et lb-read.

TextEncoder.exe -cl C:\fichier.txt enc-read=utf8 lb-read=lf

Nous imposons ici que le fichier est lu au format UTF-8 avec le saut de ligne LF (Unix, Linux, macOS) et interprété en conséquence. Si vous omettez l’un des deux paramètres, ou les deux, la valeur enc-read=auto respectivement lb-read=auto est utilisée. Cela signifie que les fichiers sont lus et interprétés en raison de la reconnaissance automatique du codage et du saut de ligne.

Vue d’ensemble de tous les Paramètres disponibles

Le tableau suivant répertorie tous les paramètres disponibles que vous pouvez utiliser dans le TextEncoder. Dans les exemples sur cette page nous avons déjà présenté certains des paramètres.

ParamètreValeursDéfautDescription
[Fichiers]tout chemin(s) de fichier
-Chemin du fichier à convertir. Vous pouvez spécifier plusieurs fichiers en séquence pour convertir plusieurs fichiers en même temps.
[Dossiers]tout chemin(s) de dossier
-Chemin d’accès à un dossier dont le contenu doit être converti. Pour éviter de convertir tous les fichiers du dossier, vous pouvez utiliser les paramètres search-subdirs, filter-ext, filter-name, filter-name-matchcase, filter-name-regex, filter-hiddenfiles et filter-onlytextfiles pour affiner votre recherche. Plusieurs dossiers peuvent être spécifiés consécutivement pour convertir simultanément le contenu de plusieurs dossiers.
lbkeep, system, crlf, lf, cr, nl, ff, nel, ls, ps ou vt
keepType de saut de ligne pour le fichier converti. "keep" conserve le type de saut de ligne du fichier d’origine, sinon le type spécifié. La valeur "system" correspond au type de saut de ligne standard du système d’exploitation sur lequel le TextEncoder est en cours d’exécution. Ainsi, par exemple, crlf pour Windows.  Ici, vous trouverez un aperçu des différents types de saut de ligne.
lb-readauto, system, crlf, lf, cr, nl, ff, nel, ls, ps ou vtautoSaut de ligne avec lequel le fichier est lu. Si ce paramètre n’est pas spécifié ou "auto" est spécifié, une tentative est faite pour détecter automatiquement le saut de ligne. La valeur "system" correspond au type de saut de ligne standard du système d’exploitation sur lequel le TextEncoder est en cours d’exécution. Ainsi, par exemple, crlf pour Windows.
enckeep, ascii, latin1, latin2, win-ansi, win-1250, win-1251, win-1252, win-1253, utf7, utf8, utf16le, utf16be, utf32le ou utf32be
keepEncodage pour le fichier converti. "keep" utilise le codage du fichier d’origine, sinon le codage spécifié. Le codage "win-ansi" dépend de la localisation de votre version de Windows. La page de code Windows correspondant à votre version linguistique de Windows sera utilisée. Vous trouverez un aperçu de tous les encodages disponibles ici.
enc-readauto, ascii, latin1, latin2, win-ansi, win-1250, win-1251, win-1252, win-1253, utf7, utf8, utf16le, utf16be, utf32le ou  utf32beautoCodage avec lequel le fichier est lu. Si ce paramètre n’est pas spécifié, une tentative est faite pour détecter automatiquement le codage. Le codage "win-ansi" dépend de la localisation de votre version de Windows. La page de code Windows correspondant à votre version linguistique de Windows sera utilisée.
bom0, 1 ou keep
keepUne marque d’ordre de byte (byte order mark) doit-elle être écrite dans le fichier? 0 pour jamais, 1 pour toujours, "keep" comme dans le fichier d’origine.
saveChemin d'un fichier
-Avec ce paramètre, vous pouvez enregistrer explicitement le fichier converti sous un nom de fichier que vous pouvez sélectionner librement. Par exemple, spécifiez save=C:\Dossier\Fichier.txt pour enregistrer le fichier converti en tant que C:\Dossier\Fichier.txt. Si vous souhaitez uniquement enregistrer le fichier converti dans un autre dossier tout en conservant le nom du fichier et son extension, utilisez le paramètre save-folder et omettez le paramètre save. De plus, les paramètres save-name pour le nom et save-ext pour l’extension de fichier peuvent être utilisés de la même manière et combinés entre eux. Si vous ne spécifiez aucun des paramètres save, save-folder, save-name ou save-ext, le fichier d’origine sera écrasé.
save-folderkeep ou tout texte
keepDossier dans lequel le fichier converti est enregistré. Si vous ne spécifiez pas ce paramètre ou si vous appelez ce paramètre avec la valeur "keep", le fichier est enregistré dans le dossier dans lequel se trouve le fichier d’origine. Ce paramètre peut être combiné avec les paramètres save-name et save-ext. Chacun de ces paramètres est facultatif, vous permettant de définir indépendamment le dossier, le nom et l’extension. Si vous souhaitez enregistrer le fichier converti sous un nom de fichier explicite avec chemin, nom et extension, utilisez le paramètre save. Si vous ne spécifiez aucun des paramètres save, save-folder, save-name ou save-ext, le fichier d’origine sera écrasé.
save-namekeep ou tout texte
keepNom sans dossier ni extension de fichier, avec lequel le fichier converti est enregistré. Si vous ne spécifiez pas ce paramètre ou si vous utilisez ce paramètre avec la valeur "keep", le fichier reçoit le même nom que le fichier d’origine. Ce paramètre peut être combiné avec les paramètres save-folder et save-ext. Chacun de ces paramètres est facultatif, vous permettant de définir indépendamment le dossier, le nom et l’extension. Si vous souhaitez enregistrer le fichier converti sous un nom de fichier explicite avec chemin, nom et extension, utilisez le paramètre save. Si vous ne spécifiez aucun des paramètres save, save-folder, save-name ou save-ext, le fichier d’origine sera écrasé.
save-extkeep ou tout texte
keepExtension de fichier avec laquelle le fichier converti est enregistré. Si vous ne spécifiez pas ce paramètre ou si vous utilisez ce paramètre avec la valeur "keep", le fichier converti reçoit l’extension de fichier qui contenait également le fichier d’origine. Ce paramètre peut être combiné avec les paramètres save-folder et save-name. Chacun de ces paramètres est facultatif, vous permettant de définir indépendamment le dossier, le nom et l’extension. Si vous souhaitez enregistrer le fichier converti sous un nom de fichier explicite avec chemin, nom et extension, utilisez le paramètre save. Si vous ne spécifiez aucun des paramètres save, save-folder, save-name ou save-ext, le fichier d’origine sera écrasé.
search-subdirs0 ou 11Les sous-dossiers doivent-ils être recherchés lors de la modification d'un dossier? 0 pour non, 1 pour oui. Une valeur de 0 n'édite que les fichiers du premier niveau du dossier.
filter-exttout texte
-Si vous voulez seulement éditer des fichiers avec une extension spécifique, vous pouvez entrer cette extension(s) ici. Par exemple, filter-ext=txt permet de ne modifier que les fichiers portant l’extension TXT. Les fins multiples peuvent être séparées par un trait d'union. Par exemple, filter-ext=php-htm-html permet de modifier uniquement les fichiers portant les extensions PHP, HTM ou HTML. Si vous omettez ce paramètre ou laissez-le vide, les fichiers avec toutes les extensions de fichier seront pris en compte.
filter-nametout texte
-Si vous souhaitez uniquement modifier des fichiers portant un nom spécifique, vous pouvez entrer un nom ici. Tous les fichiers contenant les caractères spécifiés avec "filter-name" sont traités. Avec filter-name=ab, par exemple, des fichiers tels que abc.txt ou xab.txt. Si vous omettez ce paramètre ou le laissez vide, les fichiers avec tous les noms sont pris en compte.
filter-name-matchcase0 ou 10Le texte spécifié avec le paramètre "filter-name" doit-il être interprété en fonction de sa casse (écriture majuscule et minuscule)? 0 pour non, 1 pour oui. Si 1, le texte du nom du fichier doit être identique dans la même cas et orthographe. Si 0, la recherche est insensible à la casse.
filter-name-regex0 ou 10Si le filtre de recherche spécifié sous "filter-name" doit être interprété comme une expression régulière, utilisez 1. Si vous souhaitez uniquement rechercher le texte spécifié, 0.
filter-hiddenfiles0 ou 10Voulez-vous éditer des fichiers cachés lors de la conversion d’un dossier? 0 pour non, 1 pour oui. Une valeur de 0 laisse tous les fichiers cachés sans traitement, une valeur de 1 gère également les fichiers cachés.
filter-onlytextfiles0 ou 11Voulez-vous éditer uniquement les fichiers texte lors de l’édition d’un dossier? 0 pour non, 1 pour oui. Si 1, chaque fichier est vérifié avant d’être converti pour voir s’il s’agit d’un fichier binaire et le traitement n’est pas exécuté si c’est le cas.
openfile0 ou 10Le fichier converti doit-il être ouvert après l'édition? openfile=1 ouvrira le fichier nouvellement créé.
delfile0 ou 10Le fichier d’origine doit-il être supprimé après la conversion? delfile=1 supprime le fichier d’origine. Cette option est utile uniquement si les fichiers convertis doivent être enregistrés sous un nom ou un emplacement différent de celui du fichier d’origine et que les fichiers d’origine ne doivent pas être conservés.

En principe, tous ces paramètres peuvent être combinés les uns avec les autres et utilisés ensemble. Si vous ne définissez pas de paramètre, la valeur par défaut spécifiée est utilisée pour ce paramètre (le - indique que ce paramètre est vide par défaut). Dans la colonne "Valeurs", vous pouvez voir toutes les valeurs que ce paramètre peut avoir.