Diviser Fichiers Texte en plusieurs nouveaux Fichiers
Si nous souhaitons diviser le contenu d'un fichier texte en plusieurs nouveaux fichiers, l'automatisation de cette tâche peut nous faire économiser beaucoup de travail et, surtout, beaucoup de temps. Surtout si nous voulons diviser un très grand nombre de fichiers et la séparation doit toujours être effectuée selon le même modèle, la tâche est facile à automatiser et les économies sont particulièrement grand. Dans ce tutoriel, nous aimerions vous montrer un moyen facile comment vous pouvez obtenir un résultat rapide sans trop d'effort. Nous utilisons le programme TextConverter pour cela.
Procédure Générale
Avant de jeter un aperçu détaillé des options individuelles de séparation et des options associées, nous aimerions d'abord consulter la procédure générale sur la façon d'utiliser le TextConverter pour diviser les fichiers individuels dans plusieurs nouveaux fichiers:
- Tout d'abord, ajoutez tous les fichiers à séparer à la liste des fichiers dans le programme. La façon la plus simple de le faire est de simplement faire glisser les fichiers de n'importe quel dossier sur TextConverter.
- Ensuite, activez l'action "Divisir Fichiers" sur le côté droit de la fenêtre principale sous "Actions > Fichiers". Dans les options de cette action, vous devez activer au moins un critère selon lequel les fichiers doivent être divisés.
- Lorsque vous avez défini toutes les options et, peut-être d'autres actions pour modifier vos fichiers, simplement cliquez sur le bouton "Convertir et Sauver" (Maj + CTRL + S) pour effectuer la séparation. Comme base des noms de fichiers des pièces individuelles, les paramètres des options de sauvegarde sont utilisés. De plus, un nombre continu pour chacune des pièces est attaché aux noms de base.
Dans cette description générale de la procédure, nous n'avons pas encore parlé des critères que nous pouvons sélectionner pour la séparation. Nous aimerions y entrer dans la section suivante.
Possibilités de Séparation
Le TextConverter vous offre 3 options ou critères différents selon lesquels vous pouvez diviser vos fichiers. Ces options peuvent également être combinées:
- Diviser Fichiers en un Texte ou une Expression Régulière
- Diviser Fichiers en Sauts de Ligne
- Diviser Fichiers après Nombre de Caractères
- Combinaison de plusieurs Critères
- Options Générales pour toutes les Séparations
- Espaces Réservés pour la Numérotation des Pièces
- Stockage et Configuration des Noms de Fichiers des Pièces
- Rejoindre plusieurs Fichiers Texte
Diviser Fichiers en un Texte ou une Expression Régulière
Avec cette option, vous pouvez diviser votre fichier d'origine à un texte spécifique. Cela signifie qu'après chaque apparence de ce texte de recherche, un nouveau fichier commence. En conséquence, si votre texte se produit deux fois dans le fichier d'origine, trois nouveaux fichiers sont stockés (un avec le texte qui apparaît dans le fichier original avant la première occurrence du texte de recherche, un avec le texte entre la première occurrence et la deuxième occurrence du texte de recherche et un troisième fichier avec le texte qui se tient dans le fichier d'origine derrière la deuxième occurrence du texte de recherche).
Ce n'est pas important que votre texte de recherche se compose d'un seul caractère, de plusieurs mots ou même de plusieurs lignes. De plus, le texte de recherche ne doit pas être un texte statique: si vous activez l'option "Interpréter comme expression régulière" sous la zone de texte, vous pouvez également travailler avec des expressions régulières à ce stade. Un exemple simple serait l'expression régulière [0-9] qui exécute une séparation sur n'importe quel chiffre.
Si vous souhaitez garder le texte de recherche sur lequel a été séparé dans les nouveaux fichiers, vous pouvez activer une ou les deux options "Conserver le texte de recherche au début de chaque nouveau fichier" ou "Conserver le texte de recherche à la fin de chaque nouveau fichier". Si vous n'activez aucune de ces deux options, le texte de recherche n'apparaîtra pas dans les nouveaux fichiers.
Une autre option permet de ne pas se séparer directement sur le texte de recherche mais sur le saut de ligne suivante. Si l'option "Diviser au saut de ligne suivante" est activée, les mots associés d'un paragraphe restent dans le même fichier et ne sont pas séparés les uns des autres. Cela vous permet de séparer, par exemple, selon les sections qui contiennent certains mots sans déchirer les sections respectives.
Diviser Fichiers en Sauts de Ligne
Avec cette option, vous pouvez séparer le fichier original sur ses sauts de ligne. Cela signifie que pour chaque ligne du fichier d'origine, un nouveau fichier est créé qui contient le texte de la ligne respective.
Pour cette option, les paramètres sous "Actions > Fichiers > Type de Saut de Ligne" s'appliquent. Par défaut, cela signifie que si vous n'apportez aucune modification ici, le type de saut de ligne du fichier original est automatiquement reconnu et vous obtenez le résultat que vous attendez en général. Le facteur décisif est alors le saut de ligne typique que vous connaissez d'un éditeur de texte moyen. Cependant, vous pouvez également définir d'autres critères pour un saut de ligne dans le TextConverter. Par exemple, il est possible de définir des caractères arbitraires, des chaînes de caractères ou plusieurs caractères différents comme saut de ligne. Cela vous donne d'autres moyens de séparer vos fichiers de manière flexible. Vous pouvez découvrir comment cela fonctionne dans les explications des sauts de ligne personnalisées sur un ou plusieurs caractères.
Diviser Fichiers après Nombre de Caractères
Avec cette option, vous pouvez couper votre fichier original en pièces avec un numéro respectivement une longueur librement sélectionnable des caractères. Vous pouvez saisir n'importe quelle valeur numérique dans le champ. Par exemple, si votre fichier d'origine a 2500 caractères et vous spécifiez une valeur de 1000 caractères, votre fichier est divisé en 3 parties: le premier nouveau fichier contient les 1000 premiers caractères du fichier d'origine, le deuxième nouveau fichier contient le deuxième 1000 caractères du fichier d'origine et du troisième nouveau fichier contient les 500 caractères restants. Si votre fichier original contient moins de caractères que la valeur spécifiée, il n'y a pas de séparation et le fichier d'origine reste avec son contenu tel qu'il est.
Vous pouvez également utiliser cette option pour limiter le texte de tous les fichiers créés à un nombre maximum de caractères. Par exemple, si vous combinez cette option avec les autres options.
Combinaison de plusieurs Critères
Au moins une de ces options introduites doit être activée afin de pouvoir exécuter la fonction. L'activation de plus d'une de ces options est également possible. Dans ce cas, il est d'abord séparé en fonction du critère de la première option activée. Ensuite, les pièces résultantes sont à nouveau séparées en fonction du critère de la deuxième option activée et ainsi de suite.
Par exemple, si vous activez à la fois l'option pour une séparation en les sauts de ligne ainsi que l'option pour une séparation après un certain nombre de caractères, il est d'abord séparé aux sauts de ligne. Ensuite, toutes les parties (ici les pièces sont égales aux lignes) sont passées et si une ligne se compose de plus que le nombre de caractères permis, il est à nouveau divisé dans la ligne pertinente conformément au deuxième critère.
Options Générales pour toutes les Séparations
En dessous des 3 options avec lesquelles vous pouvez déterminer les critères de séparation des fichiers, vous trouverez d'autres options générales qui sont toujours utilisées quels que soient les critères sélectionnés:
- Supprimer whitespace du début ou de la fin de chaque nouveau fichier: Si cette option est activée, les espaces, les onglets et les sauts de ligne seront supprimés du début ou de la fin de chaque nouveau fichier. Cela signifie que si une partie de la division doit démarrer ou terminer, par exemple avec des sauts de ligne ou certains espaces, ceux-ci sont supprimés avant de stocker afin que le nouveau fichier commence ou se termine directement avec le texte réel.
- Effectuer des actions avant ou après la division des fichiers: S'il existe d'autres actions telles que des actions texte, des actions ligne ou des actions CSV activées en plus de la division des fichiers, la question se pose si ces actions doivent être appliquées avant ou après la séparation. Ceci est particulièrement important pour les actions de lignes ou les actions de CSV qui se réfèrent à une certaine ligne ou colonne dans le texte ou dans le fichier. C'est parce que, la partition peut changer à la fois le numéro de ligne et le numéro de colonne. Un exemple extrême de cela serait la séparation aux sauts de ligne. Avant la séparation, un fichier pourrait avoir 100 lignes qui peuvent être traitées individuellement avec les actions via les 100 numéros des lignes différents. Après la séparation, cependant, chaque fichier seulement a une seule ligne avec la ligne numéro 1 - une distinction selon les lignes n'est plus possible. Cependant, si vous souhaitez séparer en fonction d'un critère différent et fournir aux nouveaux fichiers une numérotation des lignes dans les nouveaux fichiers respectifs, cette action doit avoir lieu après la séparation afin que les numéros de ligne recommencent pour chaque nouveau fichier. Ainsi, selon le domaine d'application, il peut être plus logique d'exécuter les actions avant ou après la séparation. Vous pouvez contrôler cette distinction avec ces deux options. Il est également possible d'appliquer les actions pour deux fois, avant ainsi qu'après la séparation aux deux occasions.
- Longueur minimale d'un nouveau fichier (en caractères): Avec cette option, vous pouvez définir une longueur minimale pour les pièces résultantes respectivement pour les nouveaux fichiers. Il n'est enregistré que si un nouveau fichier résultant contient au moins autant de caractères que indiqué. Avec cette option, vous pouvez empêcher, par exemple, le stockage de fichiers vides. Selon les critères de séparation, les fichiers vides sans contenu peuvent survenir en différentes circonstances. Par exemple, si vous séparez aux sauts de ligne et un fichier contient plusieurs sauts de ligne ou des lignes vides l'un après l'autre consécutif. Si vous indiquez que les nouveaux fichiers doivent avoir au moins une longueur d'un caractère, ces pièces vides sont ignorées pendant la séparation et non enregistrées. Bien sûr, vous pouvez également définir un nombre plus élevé et ainsi contrôler le stockage en fonction d'autres critères. Si vous définissez le numéro en 0, chaque pièce résultante est enregistrée, donc également des fichiers vides.
Espaces Réservés pour la Numérotation des Pièces
En plus des espaces réservés simples et des espaces réservés pour les références, le TextConverter fournit deux autres espaces réservés qui ne peuvent être utilisés qu'en relation avec le fractionnement de fichiers: %part_num% et %part_abs%.
L'espace réservé %part_num% représente le numéro de la pièce tandis que l'espace réservé %part_abs% représente le nombre total de pièces. Les deux espaces réservés peuvent être utilisés dans le nom du fichier (c'est-à-dire dans les champs "Dossier", "Nom" et "Extension" des options de stockage) ainsi que dans les actions et les fichiers eux-mêmes.
Si, par exemple, un fichier est divisé en 5 parties, l'espace réservé %part_abs% représente toujours "5" tandis que l'espace réservé %part_num% dépend de la partie respective. Pour la première partie, %part_num% est "1", pour la deuxième partie, c'est "2", et ainsi de suite. Avec cet espace réservé, il est donc possible, par exemple, d'écrire le numéro de chaque pièce dans le fichier partiel respectif, de numéroter les noms de fichier des pièces consécutivement ou d'enregistrer les pièces individuelles dans différents dossiers dont les noms contiennent le numéro de la pièce.
Étant donné que la version actuelle du TextConverter ne fournit pas d'aperçu pour les séparations de fichiers, les espaces réservés %part_num% et %part_abs% ne sont pas pris en compte dans l'aperçu.
Stockage et Configuration des Noms de Fichiers des Pièces
Dans quel dossier et sous quel nom les nouveaux fichiers doivent être enregistrés, vous pouvez définir en bas à droite de la fenêtre principale du TextConverter. Ici, vous pouvez sélectionner un dossier arbitraire et déterminer un nom de base pour tous les fichiers. Avec l'option "conserver", cela peut également être le dossier ou le nom du fichier d'origine.
Si vous utilisez les paramètres par défaut, les parties individuelles respectivement les fichiers contenant les parties individuelles sont numérotés consécutivement en ajoutant un numéro consécutif au nom spécifié. Par exemple, les noms de fichier des pièces enregistrées pourraient être "fichier-01.txt", "fichier-02.txt" à "fichier-20.txt".
Si vous souhaitez numéroter les fichiers d'une manière différente, vous pouvez utiliser l'espace réservé %part_num% dans les options de sauvegarde, qui représente le numéro de la pièce en question. Par exemple, si vous utilisez "%part_num% %name%" comme nom de fichier, les fichiers partiels de l'exemple seraient nommés "01 fichier.txt", "02 fichier.txt" à "20 fichier.txt" ou si vous utilisez "%name% (%part_num%)", les noms de fichiers résultants seraient "fichier (01).txt", "fichier (02).txt" à "fichier (20).txt".
Si le nom du fichier contient l'espace réservé "%part_num%", il n'y a pas de numérotation automatique en ajoutant le numéro de la pièce. D'autre part, si le nom du fichier ne contient pas l'espace réservé "%part_num%", une numérotation automatique se produit toujours, sauf que l'option "Numéroter les fichier des pièces uniquement si nécessaire" est activée et qu'aucun fichier avec le nom résultant n'existe déjà.
Pour nommer les fichiers des pièces individuelles, vous pouvez également utiliser des références. Un exemple serait d'utiliser l'espace réservé "%ref:line=1%" qui représente la première ligne du fichier. Si vous utilisez cet espace réservé comme nom de fichier, la première ligne de chaque pièce est utilisée comme nom de fichier pour cette pièce. Si vous spécifiez, par exemple, l'espace réservé "%ref:word=1%" comme dossier, les parties individuelles seront triées en fonction de leur premier mot dans différents dossiers, chaque dossier ayant le premier mot du fichier respectif comme nom. Bien sûr, vous pouvez également utiliser n'importe quelle autre référence disponible ou combiner les références avec d'autres caractères ou espaces réservés. Si vous utilisez des références et obtenez ainsi déjà un nom de fichier unique avec cela, vous pouvez activer l'option "Numéroter les fichier des pièces uniquement si nécessaire" si vous ne souhaitez pas de numérotation automatique supplémentaire des fichiers.
Même si nous ne parlons parfois qu'un seul fichier comme fichier original dans ce tutoriel, la fonction peut bien sûr être également utilisée avec plusieurs fichiers en même temps. Cela signifie que si vous avez plus d'un fichier dans votre liste de fichiers, chaque fichier est séparé individuellement indépendamment des autres fichiers dans la liste de fichiers.
Rejoindre plusieurs Fichiers Texte
En plus de la possibilité de diviser des fichiers individuels en plusieurs nouveaux fichiers, le TextConverter offre également le chemin inverse: Comment assembler n'importe quel nombre de fichiers, vous pouvez apprendre dans le tutoriel sur la combinaison de plusieurs fichiers texte.