Centre d‘Information

Entrée de Caractères Unicode

Bien sûr, la saisie de plus de 140.000 caractères Unicode possibles ne peut pas être facilement effectuée avec un bouton d’un clavier classique car les claviers ne peuvent fournir qu’une petite sélection des caractères les plus courants.

Mais que pouvons-nous faire pour pouvoir saisir un autre caractèr que nous ne trouvons pas sur notre clavier? Plusieurs possibilités sont présentées ci-dessous.

Les options et les notes concernant l'entrée des caractères Unicode présentées dans cet article sont divisées en les sections suivantes:

Entrer en utilisant le Code de Caractère

Dans de nombreux programmes, tels que Microsoft Word ou WordPad, les caractères Unicode peuvent être entrés directement à l’aide de leur code de caractère (point de code). Pour cela, maintenez la touche ALT enfoncée et entrez le code décimal de votre caractère sur le pavé numérique (clavier numéro). Par exemple, la combinaison ALT + 142 entraînerait la lettre äÄ ou la combinaison ALT + 8364 serait le signe euro €.

Il convient de noter que la saisie doit être effectuée à l’aide du pavé numérique (pas avec les chiffres que l’on peut trouver au-dessus des lettres du clavier) et vous devez activer le pavé numérique (généralement avec la touche NUM LOCK au-dessus du pavé numérique). Il est plus difficile de le faire sur des ordinateurs portables ne disposant pas d’un pavé numérique séparé. Dans ce cas, vous pouvez normalement utiliser la touche FN pour accéder à un bloc de chiffres situé sur les lettres du clavier.

Les codes de caractère des caractères vous pouvez obtenir à partir des tableaux correspondants, publiés par exemple par le Consortium Unicode sur la page unicode.org/charts. Veuillez noter que beaucoup de ces tables n’offrent que la notation hexadécimale des caractères, mais vous devez utiliser la notation décimale avec la touche ALT pour produire le bon signe. Si nécessaire, vous devez convertir le code hexadécimal pour le faire.

Il convient également de noter que tous les programmes ne prennent pas en charge chaque code de caractère. Dans certains programmes tels que les anciennes versions du Bloc-Notes de Windows, seuls les codes jusqu'à 255 sont pris en charge, tous les codes supérieurs à 255 sont divisés par 256 et le caractère qui correspond au reste de la division est indiqué. Par exemple, ¼ au lieu du signe € (8364 MOD 256 = 172).

Bien sûr, écrire des caractères Unicode en utilisant le code de caractère décrit ci-dessus n’est pas très pratique, en particulier lorsque les tableaux ne sont disponibles que pour les codes hexadécimaux ou si vous utilisez fréquemment des caractères. Une approche améliorée consiste à sélectionner les caractères directement à partir de cartes de caractères ou de listes de caractères, qui sont disponibles, par exemple, par tous les grands systèmes d'exploitation et sont également incluses dans certains programmes tels que Microsoft Word, LibreOffice ou OpenOffice. Dans le même temps, ces programmes offrent souvent la possibilité de créer des combinaisons de clés pour des caractères fréquents, tels qu'il est possible avec Microsoft Word, par exemple. Vous trouverez une description de cette opportunité dans la section suivante "Insertion via des Tables de Caractères".

Une autre possibilité consiste à créer votre propre configuration de clavier, dans lequel vos symboles et caractères personnels ont leur propre touche de clavier et sont donc immédiatement disponibles dans toutes vos applications et logiciels. Vous serez informé de cette option dans la section la prochaine mais une section "Disposition de Clavier Personnalisée".

Insertion via des Tables de Caractères

En plus de la possibilité d'entrée des caractères via leur code, de nombreux systèmes d'exploitation tels que Windows ou macOS ainsi que certains programmes tels que Microsoft Word, LibreOffice ou OpenOffice offrent la possibilité d'insérer des caractères spéciaux directement via des tables de caractères. Cela élimine la recherche fastidieuse du code de caractères et les caractères peuvent être facilement copiés et insérés via le presse-papiers.

Pour afficher une table de caractères, vous pouvez simplement ouvrir le programme "Table de Caractères" préinstallé dans Windows. Sur macOS, la carte des caractères est appelée "Caractères" et est accessible à partir de nombreux programmes via le menu "Edit > Emoji and Symboles" (généralement seuls les emojis sont affichés après avoir ouvert l'outil pour la première fois et la vue de tous les caractères doit être activé via le symbole en haut à droite). Dans des programmes tels que les applications de bureau et d'autres programmes de traitement de texte, vous pouvez généralement appeler la table de caractères intégrée à l'aide de fonctions telles que "Insérer > Caractère Spécial" ou "Insérer > Symbole" du menu, à condition que le programme respectif fournisse un caractère table.

Bien sûr, la table des caractères semble différente en fonction du système d'exploitation et du programme. Cependant, généralement, c'est une fenêtre dans laquelle tous les caractères disponibles ou une sélection de caractères sont répertoriés. Vous pouvez soit passer par tous ces caractères jusqu'à ce que vous ayez trouvé le caractère souhaité, soit limiter votre recherche en utilisant la fonction de recherche ou en sélectionnant certains types de caractères dans les options (par exemple latin, les symboles mathématiques, les marques de ponctuation ou les lettres cyrilliques). Les filtres disponibles diffèrent naturellement également de la mise en œuvre respective du tableau des caractères. Si vous avez trouvé votre caractère, vous pouvez généralement le copier dans le presse-papiers ou l'insérer directement.

Selon l'implémentation, vous pouvez également utiliser la table des caractères pour obtenir un aperçu des caractères disponibles dans les polices. De plus, selon le système et le programme, il est souvent possible de définir des combinaisons de clés pour des caractères spécifiques. Cela vous permet d'accéder à des caractères fréquemment utilisés plus rapidement et plus faciles au lieu d'avoir toujours à accéder à la table de caractères.

Il convient de noter que certaines de ces cartes de caractères n'affichent pas tous les caractères Unicode. Souvent, les caractères sont limités aux glyphes contenus dans la police sélectionnée, d'autres tables de caractères ne montrent que les caractères du plan multilingue de base (Basic Multilingual Plane, BMP). Un programme qui montre une table des caractères avec vraiment tous les caractères Unicode est BabelMap qui est présenté dans la section du même nom.

Trouver des Caractères sans Tables de Caractères

S'il n'y a pas de table de caractères disponible ou si vous n'obtiez pas plus loin d'utiliser votre table de caractères, vous pouvez également rechercher le nom d'un signe, d'un symbole ou d'un caractère sur Internet. Vous trouverez suffisamment de pages qui répertorient les caractères et leurs points de code Unicode. Les caractères trouvés peuvent simplement être copiés directement à partir du navigateur avec CTRL + C et CTRL + V dans une autre application.

Un autre conseil consiste à créer votre propre table de caractères. Un fichier texte simple ou un document office avec une collection de vos caractères Unicode fréquemment utilisés est suffisant. Chaque fois que vous rencontrez un nouveau caractère que vous souhaitez utiliser à nouveau, vous pouvez simplement copier le caractère dans le fichier. Et si vous avez besoin de caractères que vous avez déjà dans votre fichier, vous n'avez plus à rechercher de manière dispendieux - vous pouvez simplement copier et réutiliser directement les caractères du fichier à la place.

Disposition de Clavier Personnalisée

Une méthode élégante pour rendre les caractères Unicode fréquemment utilisés disponibles dans tous les programmes consiste à créer votre propre disposition de clavier. Cela signifie que vous décidez de la manière dont les touches de votre clavier sont utilisées et que vous pouvez basculer entre plusieurs dispositions de clavier si vous le souhaitez. Par exemple, vous pouvez simplement définir le signe de copyright sur le raccourci ALT GR + C ou apporter toute autre modification à la disposition actuelle de votre clavier. Cela fait gagner beaucoup de temps à la recherche de caractères dans les tableaux et est plus confortable que de mémoriser beaucoup de codes - surtout si vous utilisez toujours les mêmes caractères Unicode.

Votre propre disposition de clavier peut être facilement créée avec les programmes comme le Microsoft Keyboad Layout Creator (ici, vous obtenez le téléchargement) ou le Keyboard Layout Manager. Les deux programmes fonctionnent essentiellement de la même manière, le Keyboard Layout Manager est simplement un programme beaucoup plus léger que l’alternative de Microsoft.

Avec ces programmes, il est possible d’adapter les modèles existants ou d’en créer de nouveaux. Le programme créera automatiquement le package d’installation approprié pour votre disposition de clavier personnalisée.

Entrée en HTML et XML

Si vous souhaitez utiliser un certain caractère Unicode en HTML ou en XML, vous pouvez également utiliser directement le code du caractère pour cela. Pour les codes décimaux, la notation est � et � pour les codes hexadécimaux. Le code peut être saisi directement sous cette forme dans le fichier HTML ou XML, où 0000 doit être remplacé par le code du caractère Unicode. C'est, par exemple, © ou © pour le panneau du droit d'auteur ©.

En HTML, il existe un autre moyen de saisir Unicode et des caractères spéciaux. Cela s’appelle des entités nommées (named entities ou html entities), ce qui signifie que vous pouvez entrer un nom pour certains caractères dans un fichier HTML. Par exemple, le codage de Ä est Ä (A-Umlaut - ä est le ä en lettres minuscules), © représente le panneau du droit d'auteur ©, € représente le symbole de la monnaie euro € ou   représente un espace non cassant. Une liste des caractères et des codes associés est disponible ici. Cependant, bien sûr, tous les caractères Unicode n'ont pas leurs propre entité HTML.

Les entités nommées dans HTML et XML ont également une signification particulière dans le cas où les caractères ayant un sens dans la syntaxe XML doivent être écrits comme un texte visible dans le texte source HTML ou dans les fichiers XML. Plus précisément, il s'agit des parenthèses pointues < et > ainsi que des guillemets " et du signe & qui peut être écrit comme &lt; (lower than = inférieur à), &gt; (greater than = supérieur à), &quot; (quote) et &amp; (ampersand) sans déranger la syntaxe XML.

Cependant, la possibilité d'insérer des caractères Unicode dans les fichiers HTML ou XML via leur codes de caractère ou avec l'aide d'entités nommées devient moins importante aujourd'hui. Au début des années 2000, la plupart des sites Web ont utilisé des encodages ASCII ou ANSI tels que Latin-1, avec lequel seul un nombre limité de caractères pourrait être affiché directement. Si quelqu'un voulait utiliser des caractères Unicode avec des points de code en dehors de la plage prise en charge, il n'y avait pas d'autre changement que d'utiliser des entités nommées ou d'autres solutions de contournement. Aujourd'hui, presque tous les sites Web utilisent le codage UTF-8 avec lequel tous les caractères Unicode peuvent être affichés. Par conséquent, dans la plupart des cas, les anciens aides ne sont plus nécessaires car les caractères peuvent être écrits directement dans le fichier. Bien sûr, à l'exception des caractères qui ont un sens dans la syntaxe. Leur utilisation est également toujours utile pour les signes difficiles à reconnaître comme tels dans le code, tels que les espaces non cassant ou les séparations conditionnelles.

Unicode dans Microsoft Word, WordPad et LibreOffice

À partir de Microsoft Word 2002, vous pouvez entrer un caractère Unicode directement via son code. Pour ce faire, entrez simplement le code hexadécimal du caractère directement sous forme de texte dans le document Word, puis appuyez sur la combinaison de touche ALT + C (ALT + X dans les champs de dialogue). Le caractère Unicode demandé qui se cache derrière ce code apparaît alors automatiquement. La même combinaison de clés peut également être utilisée pour montrer le code du signe ou du caractère qui est actuellement devant le curseur. Ainsi, avec la presse répétée d'ALT + C, il peut être commuté entre le code et le caractère.

De même, il fonctionne avec l'application WordPad de Microsoft, qui est généralement préinstallée sur les systèmes Windows. Ici, cependant, nous devons utiliser la combinaison de clés ALT + X pour convertir les codes de caractères Unicode en caractères Unicode ou caractères Unicode en codes de caractère. À l'exception de la combinaison de clés différentes, la fonction fonctionne comme dans Microsoft Word.

Également dans le programme office "Writer" de LibreOffice, nous pouvons utiliser le raccourci clavier ALT + X. La seule différence comparé à Microsoft Word et WordPad est que LibreOffice montre le code hexadécimal sous une forme différente: tandis que Microsoft Word et WordPad affichent le code pour le signe euro (€) dans le formulaire "20AC", LibreOffice utilise plutôt le formulaire "U+20AC". Malheureusement, OpenOffice n'offre actuellement pas une telle fonction.

Vous pouvez obtenir un tableau de tous les codes de caractères sur la page unicode.org/charts du consortium Unicode. De plus, il existe des cartes de caractères dans les programmes Office qui peuvent bien sûr également être utilisés pour entrer des caractères Unicode, qui peuvent être accessibles via le menu "Insérer > Caractère Spécial".

BabelMap

Enfin, nous souhaitons que vous montriez un programme utile pouvant également aider à la saisie de caractères Unicode. Il s’appelle BabelMap et vous pouvez le télécharger gratuitement sur la page babelstone.co.uk.

BabelMap facilite l’affichage et la recherche de caractères Unicode confortablement via leur numéro/point de code ou leur nom afin de les utiliser dans une application différente via le presse-papiers. Contrairement à certaines autres tables de caractères, BabelMap montre non seulement les caractères du plan multilingue de base (Basic Multilingual Plane, BMP), mais prend également en charge tous les autres plans Unicode (BMP, SMP, SIP, TIP, SSP, SPUA-A, SPUA-B) et donc permet à l'utilisateur de parcourir tous les caractères Unicode existants. De plus, il existe de nombreuses fonctions pour la recherche de caractères et l'analyse des polices concernant leur support pour les caractères ou les blocs de caractères qui font du programme un outil utile qui va bien au-delà des possibilités des cartes de caractères conventionnelles. Une explication de toutes les fonctionnalités peut être trouvée sur le site web de BabelMap.

Possibilité d'afficher des Caractères

Quelle que soit les méthodes présentées vous utilisez pour insérer des caractères Unicode, le résultat dépend toujours de la question de savoir si le caractère ou la lettre peut également être affiché avec la police utilisée. En particulier, les caractères inhabituels peuvent rapidement entraîner des problèmes à ce stade.

L'arrière-plan de cette problématique est que pour le dire simplement, chaque police est une collection d'images qui sont stockées dans le fichier de police respectif. Ces images sont appelées glyphes. Chacun de ces glyphes se voit attribuer un caractère, par exemple un glyphe pour le caractère "A", un autre glyphe pour le caractère "a", un glyphe pour le caractère "." et ainsi de suite. Si nous écrivons maintenant un caractère avec une police, le système d'exploitation ou le programme utilisé essaie pour obtenir le glyphe pour le caractère correspondant du fichier de police afin de le sortir. Donc, cela dépend toujours de la question de savoir s'il y a réellement un glyphe pour le caractère souhaité dans la police pertinente.

Si ce n'est pas le cas, il se peut que le programme essaie de présenter le caractère à l'aide d'une police différente (qui a un glyphe pour le caractère correspondant) ou un symbole de remplacement est affiché au lieu du caractère. Ce symbole de remplacement est également un glyphe qui est stocké dans un fichier de police (le glyphe .notdef). En règle générale, il s'agit d'une boîte vide, une boîte avec une X ou une boîte avec un point d'interrogation. Quelle police peut être utilisée comme remplacement dépend du système d'exploitation et du logiciel. Certains programmes n'utilisent que certaines polices comme substitution, d'autres peuvent rechercher un glyphe approprié dans toutes les polices installées.

Les formats de fichier de police communs tels que TrueType (TTF) ou OpenType (OTF) peuvent contenir un maximum de 65.536 glyphes. En revanche, il y a plus de 140.000 caractères Unicode. Cela signifie que même si un concepteur de police fait le travail pour produire une police avec le nombre maximal possible de glyphes, la police ne contiendra même pas la moitié de tous les caractères Unicode possibles. La plupart des polices disponibles contiennent beaucoup moins de caractères et ne supportent que quelques systèmes d'écriture, de nombreuses polices ne contiennent même qu'une sélection de caractères d'un système d'écriture. Vous pouvez déterminer quels glyphes pour quels caractères contiennent une police, par exemple, via des cartes de caractères.