Inuktitut Informatique

Le projet UQAILAUT

Transcodeur Inuktitut

Le Transcodeur Inuktitut du CNRC est un outil servant à transcoder (réécrire) du texte en Inuktitut d'une police à une autre ou d'un format à un autre. Nous supportons actuellement les polices et formats suivants :
Son utilisation est très simple :
  1. sélectionnez la police ou le format de départ,
  2. sélectionnez la police ou le format d'arrivée,
  3. écrivez le texte dans la boîte « Texte à transcoder », et
  4. cliquez sur le bouton « Transcoder ».

Chaque fois qu'un nouveau format de destination est sélectionné, le texte dans la boîte « Texte à transcoder » est automatiquement réécrit dans ce nouveau format ; pas besoin de cliquer à nouveau sur le bouton « Transcoder ».

Vous pouvez également choisir la police inuktitut Unicode qui sera utilisée dans les boîtes « Texte à transcoder » et « Texte transcodé à » lorsque le texte dans ces boîtes est dans le format « Unicode ».


Unicode \uxxxx

Dans ce format, un caract ère est écrit \u suivi immédiatement de 4 chiffres hexadécimaux représentant la valeur numérique du code Unicode de ce caractère. Par exemple, le mot de 7 caractères syllabiques  est écrit dans ce format comme la chaîne suivante de 7 éléments \uxxxx :  \u14c7\u14d7\u14c7\u1403\u1466\u1450\u1585. Ce format est utilisé par exemple en Java et en Javascript pour représenter des caractères Unicode dans une chaîne de caractères.

Unicode &#xxxx;

Ce format est celui de l'entité HTML numérique décimal, utilisé dans les documents HTML pour représenter un caractère par son code Unicode sans se soucier de l'encodage nécessaire (ISO, UTF, etc.). Ainsi, pour afficher les deux caractères inuktitut , on pourra utiliser la combinaison des 2 entités HTML ᕙᐃ plutôt que la séquence de 6 codes (3 par caractère syllabique) représentant les 2 caractères syllabiques avec l'encodage utf-8.

Unicode Encodage URL %xx

L'encodage URL est utilisé pour transmettre les codes non ASCII dans les URLs (adresses) des documents internet et dans les données des formulaires HTML. Dans cet encodage, l'espace est remplacé par le caractère « + » et chaque code non ASCII, par une séquence de %xx (1, 2, 3 ou plus) représentant les codes hexadécimaux de son encodage en utf-8. Par exemple, le caractère (unicode 5465), dont la représentation utf-8 est la séquence de codes hexadécimaux E1, 95 et 99, est écrit %E1%95%99 en encodage URL.

AiPai

Au Nunavik, on utilise les caractères AIPAI, qui transcrivent la diphtongue [ εj], le 'eil' du mot français « pareil ». Faute de place sur la boule de la machine à écrire électrique il y a de nombreuses dizaines d'années, ceux-ci ont été abandonnés pour être remplacés par la combinaison des caractères syllabiques en 'A' suivis du caractère syllabique 'I', qui représentent véritablement deux sons distincts : [ai].

Pour le transcodage à partir du format « Unicode », du format « Caractères latins », et des formats de police « Nunacom » et « ProSyl », il est possible de spécifier ce qui sera fait relativement aux caractères AIPAI et aux suites A+I pour tous les formats de destination « Unicode » :

Évidemment, dans la langue inuttitut du Nunavik, toutes les séquences A+I ne sont pas des AIPAI. A+I et AIPAI représentent des phonèmes différents. Étant donné que dans notre transcodage, ce sont tous les A+I (ou tous les AIPAI) qui sont affectés, les caractères en question produits dans la fenêtre de destination sont mis en relief, et il est possible, en cliquant dessus, de les faire passer d'une forme à l'autre, comme le démontrent les deux images suivantes.

       

 

Entrée au clavier des caractères syllabiques

Vous obtiendrez toute l'information n écessaire sur l'entrée au clavier des caractères syllabiques Unicode ICI.

Vous obtiendrez toute l'information nécessaire sur l'entrée au clavier des caractères syllabiques avec les polices archaïques Nunacom, ProSyl et AiPaiNunavik ICI.

Affichage des caractères syllabiques

Afin que vous puissiez voir correctement les caract ères syllabiques sur votre écran, il faut que les polices de caractères appropriées soient installées sur votre ordinateur. Toutes les polices de caractères dont vous aurez besoin avec le Transcodeur Inuktitut du CNRC sont disponibles ICI.


Suivez ce lien pour utiliser le
Transcodeur Inuktitut du CNRC.

Le contenu de ce site a été développé par Benoît Farley au Conseil national de recherches du Canada.