多言語処理
コンピュータで文字情報を処理する場合、既存のデジタルプラットフォームのアーキテクチャが、根本的に漢字のような多文字体系を扱う構造になっていない。例えば日本語だけに関して考えてみても、JIS補助漢字と呼ばれるJISX0212、第三、第四水準と呼ばれるJIS X0213、Unicodeの利用によって扱える文字は増えて来てはいるが、それでも、住民台帳、出版、古典・古文字研究などの分野で利用するには文字が足りず、外字の利用を余儀なくされているのが現状である。また、さまざまな国や時代の文字を情報化するためには、現存していないものも含めて、あらゆる文字、言語を統一的に処理できるようなデジタルプラットフォームが必要であるが、既存の文字コード体系、文字情報処理体系では対応することができない。
TRON多国語言語環境は、あらゆる文字をコンピュータで扱えるようにという方針でつくられたTRONプロジェクトの高水準データ交換規約TAD (TRONApplication Databus) の文字に関する規約と処理環境である。 文字コードの部分であるTRONコードは、48,400字入る面を31面持ち、これを切り替えて使う。合計約150万字の文字を収容でき、事実上あらゆる文字を収容するのに不足はないといえる。TRONコードでは、複数の文字セットを収容するという方針を取っていて、重複した文字を許している。これは文字セットごとに収集方針や包摂に対する考え方を独自にもっているため、ある二つの文字が同じなのか違うのかは客観的に決めることは事実上不可能であること、またこの考え方は、地域や時代により変化するためである。従って、TRONでは複数の文字セットの文字を別々の番号で割り付け、データベースにより管理する方式が優れていると考え、文字感データベースと命名してその整備を進めている。文字感データベースを使うことにより、二つの字を同じとして検索したり、区別して検索したりが可能となる。現在、BTRON仕様OSでは、およそ19万字の文字セットが利用可能である。
坂村研究室ではさらに、新たに「Tフォント」の作成を行った。これは、12万字の漢字セットに対して作成された、明朝体、ゴシック体、楷書体の3書体と、甲骨文字研究で用いられる文字フォントからなる、合計39万字のTrueTypeフォントであり、BTRON用のフォント、および、Windows用のフォントとして無償で提供される。

多言語処理に関しては、JavaでTRONコードを扱うためのフレームワークであるJava TRON code profileの仕様策定や、多漢字コンテンツの流通を支援するための仕組みである、多漢字コンテンツwebシステム、フォントトレーサビリティシステムに関する研究、また、多漢字コンテンツの入力を支援するためのシステムの研究などが行われている。