umsCodeGenerator

Page for mappingSchema in general

mappingSchema とは？

mappingSchema は、データの構造とデコード・エンコードの処理の対応関係(マッピング) を規定する汎用的なスキーマ言語です。このスキーマ言語とは、文書の集合を規定するための言語です。たとえば、XML 文書のスキーマ言語のひとつとして RELAX NG が用いられています。

われわれは、RELAX NG を基に、テキスト形式やバイナリ形式の文書のためのスキーマ言語 UMS の規定を進めています。 RELAX NG と UMS の仕様は、以下から入手することができます。

RELAX NG
UMS 仕様書 (2006/07/27) (pdf)

UMS とは？

UMS(Universal Mapping Schema)は、シーケンシャルデータの デコード・エンコードの処理を規定する文法です。

プログラムは一般にデータを入出力します。多くの場合データはシーケンシャルです。入力ではデータを書式に従いデコードする必要があります。出力ではデータを書式に従いエンコードする必要があります。例えば、以下の図では外側の箱がプログラムを、内側の箱がシーケンシャルデータを示しています。内側と外側の箱に挟まれた部分が、 デコード・エンコードの処理です。

シーケンシャルデータのデコードの例

シーケンシャルデータのエンコードの例

mapping definition とは？

mappingSchema の文法に従った記述を mapping definitionと呼んでいます。 mapping definitionは、XML で記述できます。今のところ XML でしか記述できません。 mappingSchema の文法の全体はまだ明文化されていません。文法のサブセット (umsCodeGenerator の処理系が処理できる範囲) は XML のスキーマ (RELAX NG) で記述され、処理系とともに配布されています。

mapping definition は シーケンシャルデータのスキーマ(書式の定義)と アプリケーションプログラムインターフェース を組み合わせたものです。 mapping definitionをどのように作り上げるかは、事例毎に選ぶことができます。 シーケンシャルデータのスキーマ を規定し、これを処理する プログラム を作るか、あるいは、逆に アプリケーションプログラムインターフェース に沿う形で シーケンシャルデータの書式を決めても構いません。例えば二つのシステム間でデータをやり取りする場合には、まず、受け渡される シーケンシャルデータのスキーマを双方の合意の下に規定し、次に、 アプリケーションプログラムインターフェース の部分を、別々に付与することで、それぞれの mapping definitionを得ることができます。

mapping definitionに従った デコード・エンコードの処理 プログラムを手作業で作ることができきます。しかし、この手作業の手間を省きたい場合、あるいは、定義どおり間違えず処理を作りこみたいのならば、umsCodegenerator のような mappingSchema の処理系に処理を任せると良いでしょう。 mappingSchema の処理系には、幾つかのタイプが考えられます。 mapping definitionからソースコードを生成するタイプのもの、あるいは mapping definitionを動的に読み込む汎用なライブラリなどです。ある mapping definition (デコード・エンコード) を実現するには多数の処理アルゴリズムが存在します。将来、事例の特性に応じ使い分けられるようになると良いですね。

Required knowledge

Knowledge of XML and its name space is required for usage of mappingSchema since mappingSchema is a schema language described in XML (sorry, no description is available at this moment). mappingSchema shares philosophy and some definition with an XML schema language RELAX NG. Knowledge of RELAX NG is helpful to understand mappingSchema. Altough XML version of mappingSchema is very similar with that of RELAX NG, there is some difference (see difference).

How To

In troduction of software development with mappingSchema is found here (sorry in Japanese).

develop program with mappingSchema (sorry, in Japanese). Note: Mapping definition and tools used in this document is somewhat older than the recent implementation of umsCodeGenerator.

Development

is now on-going by myself (KM) and few members. To accelerate our development, any contribution or collaboration is welcome.

Mailing Lists

Please send mail Mailing List itself if you want to join.

Users ML: ums_users@plain.isas.jaxa.jp
Developpers ML: ums_devel@plain.isas.jaxa.jp

文法の設計ポリシー

ツールの実装を隠蔽せよ。実装が見えてしまう場合、記述できていないパラメータが存在する。文法を再考せよ。例えば、ツール固有な内部 API の存在を意識させてはいけない。
極力自分たち (ums group) で考案しないこと。可能なら要素の定義そのもの。無理なら考え方を取り入れよ。
可能な限り少ない要素で構成せよ。利便性のための２次的なものは、１次的な定義に帰着できるようにする。
汎用なものを目指せ。文法がその分煩雑になって構わない。
Encode と decode の対称性に留意する。 XML - XML syntax はその実現を目指すが、 XML - language syntax はそもそも実現不能である。

(-KM-)

PDF版ドキュメントの制限事項

本ドキュメントは、Apache Forrestを利用して記述しています。 PDF版には以下の見苦しい点があります。ご了承下さい。

箇条書きの記号が「?」に文字化けして表示されてしまいます。
表中の文章の折り返しがずれることがあります。
図が挿入されません。

Specification of mapping definition

English

1. mapping definition の仕様

mapping definition は大きく分けて３つの部分の定義から構成されます。

データ構造
プログラミング言語の処理
データ構造とプログラミング言語の処理の対応(マッピング)

それぞれの部分を空間と呼びます。 mappingSchema の0.4版では、以下のURIをそれぞれの空間に割り当て、それぞれに対して接頭辞を対応させています。

定義		名前空間 URI	名前空間接頭辞
データ構造		http://ums.isas.jaxa.jp/0.4/dat	dat
	C言語	http://ums.isas.jaxa.jp/0.4/clng	clng
プログラミング言語の処理	Java	http://ums.isas.jaxa.jp/0.4/java	java
	Perl	http://ums.isas.jaxa.jp/0.4/perl	perl
マッピング		http://ums.isas.jaxa.jp/0.4	(接頭辞なし)

Note

このサイトに示す定義では、慣習に従い XML 名前空間 のプリフィクスの定義を省略します。

1.1 データ構造の定義

データ構造を定義するためには、 byte 要素、 bit 要素、 list 要素の子に、 data 要素または value 要素を記述します。

以下の定義は、1バイトの符号あり整数からなるデータ構造を表します。この定義に登場するいずれの XML 要素 もデータ構造の空間に属しています。

<dat:byte enocde="signed" length="1">
　<dat:data type="byte"/>
</dat:byte>

1.2 プログラミング言語の処理の定義

現在、プログラミング言語の処理の定義として二つの syntax が存在します。

XML-XML syntax
XML-language syntax

データ構造の記述に XML-XML syntax と XML-language syntax の区別はありません。

1.2.1 プログラミング言語の処理の定義(XML syntax)

XML syntax において、プログラミング言語の処理を定義するためには、 'lang:value-of'要素 の子に、 'lang:data'要素 または 'lang:value'要素 を記述します。

以下の定義は、1バイトのデータの値を持つ変数 var を表します。この定義に登場するいずれの XML 要素 も言語の空間に属しています。

<lang:value-of select="var">
　<lang:data type="byte"/>
</lang:value-of>

1.2.2 プログラミング言語の処理の定義(Language syntax)

Language syntax において、言語での処理を定義するためには、変数の代入式の形式で、 'lang:data'要素 または 'lang:value'要素 を記述します。

以下の定義は、1バイトのデータの値を持つ変数 var を表します。この定義に登場する XML 要素 、XML 要素の外側に書かれた部分のいずれも言語の空間に属しています。

var = <lang:data type="byte"/>;

<lang:data type="byte"/> = var;

1.3 データ構造とプログラミング言語の処理の対応の定義

データ構造の定義と、プログラミング言語の処理の定義を組み合わせ、両者の対応を定義します。

1.3.1 データ構造とプログラミング言語の処理の対応の定義(XML syntax)

XML syntax において、データ構造とプログラミング言語の処理の対応を定義するためには、 byte 要素、 bit 要素、 list 要素の子に lang:value-of 要素 を記述し、この要素の子に、 lang:data 要素 または lang:value 要素 を記述します。

以下の定義は、1バイトのデータの値を持つ変数 var に1バイトの符号あり整数からなるデータ構造を対応させています。この定義に登場する dat:byte 要素 はデータ構造の空間、 lang:value-of 要素 は言語の空間、 data 要素 はマッピングの空間に属しています。

<dat:byte enocde="signed" length="1">
　<lang:value-of select="a">
　　<data type="byte"/>
　</lang:value-of>
</dat:byte>

XML syntax の、デコード/エンコードについての mapping definition は以下のようになります。

定義	data	value
データ構造	<dat:byte enocde="signed" length="1"> <dat:data type="byte"/> </dat:byte>	<dat:byte enocde="signed" length="1"> <dat:value type="byte">1</dat:value> </dat:byte>
プログラミング言語の処理	<lang:value-of select="var"> <lang:data type="byte"/> </lang:value-of>	<lang:value-of select="var"> <lang:value type="byte">1</lang:value> </lang:value-of>
マッピング	<dat:byte enocde="signed" length="1"> <lang:value-of select="a"> <data type="byte"/> </lang:value-of> </dat:byte>	<dat:byte enocde="signed" length="1"> <lang:value-of select="a"> <value type="byte"></value> </lang:value-of> </dat:byte>

定義

data

value

データ構造

<dat:byte enocde="signed" length="1">
  <dat:data type="byte"/>
</dat:byte>

<dat:byte enocde="signed" length="1">
  <dat:value type="byte">1</dat:value>
</dat:byte>

プログラミング言語の処理

<lang:value-of select="var">
  <lang:data type="byte"/>
</lang:value-of>

<lang:value-of select="var">
  <lang:value type="byte">1</lang:value>
</lang:value-of>

マッピング

<dat:byte enocde="signed" length="1">
  <lang:value-of select="a">
    <data type="byte"/>
  </lang:value-of>
</dat:byte>

<dat:byte enocde="signed" length="1">
  <lang:value-of select="a">
    <value type="byte"></value>
  </lang:value-of>
</dat:byte>

Note

マッピング定義 をXSLで処理する場合は、 XML-language syntax に比べ XML-XML syntax の方が便利です。 XML-XML syntax の マッピング定義 は XML-language syntax による記述に変換することができます。

1.3.2 データ構造とプログラミング言語の処理の対応の定義(Language syntax)

Language syntax において、データ構造とプログラミング言語の処理の対応を定義するためには、 byte 要素、 bit 要素、 list 要素の子に変数の代入式の形式で、 lang:data 要素 または lang:value 要素 を記述します。

以下の定義は、1バイトのデータの値を持つ変数 var に1バイトの符号あり整数からなるデータ構造を対応させています。このパターンに登場する dat:byte 要素 はデータ構造の空間、 data 要素 はマッピングの空間、その他の部分が言語の空間に属しています。

<dat:byte enocde="signed" length="1">
　a = <data type="byte"/>;
</dat:byte>

<dat:byte enocde="signed" length="1">
　<data type="byte"/> = a;
</dat:byte>

Language syntax の、デコードについての mapping definition は以下のようになります。

定義	data	value
データ構造	<dat:byte enocde="signed" length="1"> <dat:data type="byte"/> </dat:byte>	<dat:byte enocde="signed" length="1"> <dat:value type="byte">1</dat:value> </dat:byte>
プログラミング言語の処理	<lang:data type="byte"/> = a;	<lang:value type="byte">1</lang:value> = a;
マッピング	<dat:byte enocde="signed" length="1"> <data type="byte"/> = a; </dat:byte>	<dat:byte enocde="signed" length="1"> <value type="byte">1</value> = a; </dat:byte>

定義

data

value

データ構造

<dat:byte enocde="signed" length="1">
  <dat:data type="byte"/>
</dat:byte>

<dat:byte enocde="signed" length="1">
  <dat:value type="byte">1</dat:value>
</dat:byte>

プログラミング言語の処理

<lang:data type="byte"/> = a;

<lang:value type="byte">1</lang:value> = a;

マッピング

<dat:byte enocde="signed" length="1">
  <data type="byte"/> = a;
</dat:byte>

<dat:byte enocde="signed" length="1">
  <value type="byte">1</value> = a;
</dat:byte>

エンコードについての mapping definition は以下のようになります。

定義	data	value
データ構造	<dat:byte enocde="signed" length="1"> <dat:data type="byte"/> </dat:byte>	<dat:byte enocde="signed" length="1"> <dat:value type="byte">1</dat:value> </dat:byte>
プログラミング言語の処理	a = <lang:data type="byte"/>;	<lang:value type="byte">1</lang:value> = a;
マッピング	<dat:byte enocde="signed" length="1"> a = <data type="byte"/>; </dat:byte>	<dat:byte enocde="signed" length="1"> a = <value type="byte">1</value>; </dat:byte>

定義

data

value

データ構造

<dat:byte enocde="signed" length="1">
  <dat:data type="byte"/>
</dat:byte>

<dat:byte enocde="signed" length="1">
  <dat:value type="byte">1</dat:value>
</dat:byte>

プログラミング言語の処理

a = <lang:data type="byte"/>;

<lang:value type="byte">1</lang:value> = a;

マッピング

<dat:byte enocde="signed" length="1">
  a = <data type="byte"/>;
</dat:byte>

<dat:byte enocde="signed" length="1">
  a = <value type="byte">1</value>;
</dat:byte>

Note

ある向きの動作を記述する場合 XML-XML syntax に比べ XML-language syntax の方が若干コンパクトです。また、プログラマには馴染みやすいかもしれません。 XML-language syntax を用いると、プログラミング言語の機能の一部を直接用いることができます。 XML-language syntax の マッピング定義 は必ずしも XML-XML syntax による記述に変換できるとは限りません。

2. RELAX NG との違い? - 2005/06/28追記

RELAX NG は XML 文書に "限定" して使用するものです。 mappingSchema は、より広い文書で使用するためのものです。第１に、このことにより差が生じます。

２つ目の違いは、"実装" をどう意識するかで生じます。複数の実装が存在する場合、その相互運用のために、適用範囲を絞りこむ必要が出てきます。 - 今のところ - mappingSchema には、そういう制約は設けておらず、適用範囲を明示するのはツールの義務であり、使用範囲を選択するのはユーザに任されています。

これらの違いの多くは "制約" の違いとなって現れます。 - 今のところ - mappingSchema の文法自身は"制約" を極力設けないないようにしています。以下には、mappingSchema では許容されるが RELAX NG では許容されないパターンの例を列挙します。

2.1 注釈 (外来の属性及び要素の取り扱い) - 2005/07/21追記

RELAX NG では外来の属性及び要素は取り除かれます (see RELAX NG 4.1)。 mappingSchema では外来の属性及び要素は「無視されます」。以下の例は

RELAX NG では

と、等価ですが mappingSchema では

と、等価になります。

2.2 難解な書式 - 2005/08/01更新

mappingSchema では下記の記述が「可能」です。

たとえば、これは '123456' という文字列にマッチします。 2 つのデータ項目がそれぞれどの部分文字列にマッチするかは一意に決まりません。以下の 5 通りの可能性があります。

'12345' 及び '6'
'1234' 及び '56'
'123' 及び '456'
'12' 及び '3456'
'1' 及び '23456'

このようなデータのデコードには労力がかります。そして、なにより、取り扱える処理系が限られてきてしまうため、使うべきではありません。

なお、下記のパターンは RELAX NG (see 7.2) でも mappingSchema でも許容されません (list の子として現れる場合を除く)。

3. 制約事項

umsCodeGenerator で処理するにあたり、mapping definition では以下の制約があります。

optional 要素、oneOrMore 要素、zeroOrMore 要素のネストの深さは、最大 32 です。
list 要素のネストの深さは、最大 32 です。
define/ref の再帰定義はできません。
define 要素の子孫に、optional 、oneOrMore、zeroOrMore を記述することはできません。
dat:*//ums:* という経路は許されません。
XML syntax において、デコード/エンコード関数のインターフェースは固定です。
Language syntax においてコード記述可能な部分は、XML syntax の <package>、<class>、<function>、<arg>、<return>、<var>、<array>、 <value-of>、<callFunction>の部分です。 $TABLETOOLS_HOME/sample/tutorial に含まれる Language syntax の例を参考にしてください。

userGuide

grammar 要素

スキーマのルート要素

通常、スキーマを記述する際のルート要素として用いられます。 start要素, define要素, include要素, ref要素を用いる際は、常に必須になります。
単純なスキーマを記述する際には、コンテナもしくはサブコンテナをルート要素に使えます。ただし、ref要素などでマクロを参照することが出来なくなるため、複雑なスキーマの記述には不向きです(ただし、externalRef要素により、外部ファイルを参照することは可能です)。
XML形式において最上位に配置できるコンテナは element要素のみです。サブコンテナは配置できません。

属性

xmlns 属性

スキーマ自体の名前空間を指定します。

RELAX NG の名前空間の URI は、http://relaxng.org/ns/structure/1.0 です。

ns 属性

スキーマで定義する要素／属性のデフォルトの名前空間を設定します。これにより、接頭辞無しで名前を使うことが出来ます。

xmlns:xxxx 属性

この形式でも、スキーマで定義する要素／属性の名前空間を設定出来ます( xxxx に、使用する接頭辞名を入れます)。定義する要素／属性に複数の名前空間が存在する際は、複数の xmlns:xxxx 属性が必要になります。また、ns 属性との併用も出来ます。

子ノード

一つ以上の start要素を子に持ちます。

使用例

例 1:

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/" xmlns:h="http://batz.org/">

<start>
 <element name="document">
   <ref name="para"/>
 </element>
</start>

<define name="para">
 <element name="h:para">
   <empty/>
 </element>
</define>

</grammar>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「grammar要素 @ ぽかぽか RELAX NG 工房」

start 要素

XML 文書のルート要素を定義

文書のルート要素を指定します(XML Schema や DTD では、「文書へのスキーマの埋め込み」を前提としているため、スキーマ内でルート要素を指定することは出来ません)。

属性

combine 属性

直上の grammar要素が複数の start要素を持つ場合の結合方法を指定します。とりうる値は choice もしくは interleave です。これらの start要素のうち一つは combine 属性を持たなくて (省略して) 構いませんがそれ以外は同一の属性値を持たなくてはなりません。

XML において属性値 interleave を指定できるのは grammar要素を入れ子にした場合のみです。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。とりうるコンテナの組み合わせは文書の形式によって制約を受けます。
ref要素でマクロを指定しても構いません(通常はこちらを用いることが多いでしょう)。
ただし、XML の場合、参照先の define要素の子要素が element要素である必要があります。
XML 文書では、最上位に要素を一つだけ持ちます(ルート要素)。最上位の grammar要素では、直下の子要素の element要素で指定された要素が、ルート要素となります。指定するルート要素は、複数あっても構いません。ただし、複数から択一になるので、choice要素を「かます」必要があります。その場合、実際に検証される文書では、スキーマ内で指定されたルート要素のいずれか一つをルート要素にすることが出来ます。

使用例

例 1: ref要素を用いる方法

ref要素を用いる方法

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/">

<start>
 <ref name="document"/>
</start>

<define name="document">
 <element name="document">
   <empty/>
 </element>
</define>
</grammar>

例 2: choice要素を用い、ルート要素を複数指定する方法

choice要素を用い、ルート要素を複数指定する方法

この例の場合、 doc1, doc2 いずれもルート要素とすることが出来る。ただし、内容の違いに注意。

<start>
 <choice>
  <element name="doc1">
   <text/>
  </element>
  <element name="doc2">
   <empty/>
  </element>
 </choice>
</start>

例 3: start要素を複数使用する方法

start要素を複数使用する方法

実質的には、上記と全く同一。

<start>
 <element name="doc1">
  <text/>
 </element>
</start>

<start combine="choice">
 <element name="doc2">
  <empty/>
 </element>
</start>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「start要素 @ ぽかぽか RELAX NG 工房」

file 要素

出力ファイルを指定する要素

出力するファイルの範囲と、ファイルの basename を指定します。
ums ファイルの basename を basename とした出力ファイルも、生成されます。
grammar 要素の直下には置いてはなりません。とりうるコンテナの組み合わせは文書の形式によって制約を受けます。

属性

basename 属性

ファイル名を指定します。必須です。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。

使用例

例 1: 1ファイルに出力

1ファイルに出力

以下の FileSample.ums から生成されたソースコードは、FileSample.java 、File.java に出力されます。

<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
    <file basename="File">
      <java:class scope="abstract" name="FileSample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
        ...
      </java:class>
      <java:class name="FileSampleRecord" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
        ...
      </java:class>
    </file>
  </start>
</grammar>

例 2: 複数ファイルに出力

複数ファイルに出力

以下の FileSample.ums から生成されたソースコードは、FileSample.java 、File.java 、FileRecord.java に出力されます。

<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
    <file basename="File">
      <java:class scope="abstract" name="FileSample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
        ...
      </java:class>
    </file>
    <file basename="FileRecord">
      <java:class name="FileSampleRecord" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
        ...
      </java:class>
    </file>
  </start>
</grammar>

例 3: ファイル要素の入れ子

ファイル要素の入れ子

以下の FileSample.ums から生成されたソースコードは、FileSample.java 、File.java 、FileRecord.java に出力されます。

<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
    <file basename="File">
      <file basename="File">
        <java:class scope="abstract" name="FileSample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
          ...
        </java:class>
      </file>
      <file basename="FileRecord">
        <java:class name="FileSampleRecord" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
          ...
        </java:class>
      </file>
    </file>
  </start>
</grammar>

注意事項

ファイルを出力する際は、ums ファイルの basename を basename とした出力ファイルも、生成されます。

include 要素

外部モジュールを取り込む要素

外部スキーマの定義を取り込むための要素です。
当然、取り込まれるスキーマは文法に則ったものでなければなりません。また、 grammar要素をルート要素としないスキーマは取り込めません。替わりに externalRef要素を用いてください。
必ず、 grammar要素の直下に記述しなければなりません。その条件さえ満たしていれば、どこに置いても構いません。
ref要素で、外部スキーマに記述されたマクロを参照出来ます。ただし、定義されていないマクロを参照してはなりません。
異なる名前空間を持つスキーマも取り込むことが出来ます。このことにより、既に提供されている異なる種類のモジュールを単に組み合わせるだけで、名前空間の違いを配慮せずとも独自のスキーマを簡単に作ることが出来ます(当然、文書インスタンスでは、名前空間を考慮しなければなりません)。

属性

href 属性

取り込む外部スキーマ名を指定します。値は URI です。

子ノード

単に取り込みたい場合は、空要素とします。
その他、start要素, div要素, define要素を子要素とすることが出来ます。
include要素直下の define要素は、 include要素で示される参照先のスキーマの定義の上書きをする場合にのみ用いられます。新たな定義をしたり、combine 属性を用いた定義の結合をしたりすることは出来ません。

使用例

例 1: 再定義を含める場合

再定義を含める場合

以下の一聯のファイルを例に挙げます。

ファイル1: schema1.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/">

<start>
 <element name="document">
   <ref name="para"/>
 </element>
</start>

<include href="schema2.rng">
 <define name="em-content"> <!-- "em-content" の再定義 -->
  <text/>
 </define>
</include>

</grammar>

ファイル2: schema2.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/">

<define name="para">
 <element name="em">
  <ref name="em-content"/>
 </element>
</define>

<define name="em-content">
  <empty/>
</define>

</grammar>

以上の場合、 schema1.rng の内容は、以下の内容と等価になります (マクロの展開はしておりません)。

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/">

<start>
 <element name="document">
   <ref name="para"/>
 </element>
</start>

<define name="para">
 <element name="em">
  <ref name="em-content"/>
 </element>
</define>

<define name="em-content">
  <text/> <!-- define 要素によって上書きされた -->
</define>

</grammar>

例 2: 異なる名前空間を有するスキーマの取り込み

異なる名前空間を有するスキーマの取り込み

以下の一聯のファイルを例に挙げます。

ファイル1: schema1.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://lena.org/">

<start>
 <element name="document">
   <ref name="para"/>
 </element>
</start>

<include href="schema2.rng"/>

</grammar>

ファイル2: schema2.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  ns="http://batz.org/">

<define name="para">
 <element name="em"><empty/></element>
</define>

</grammar>

以上の場合、 schema1.rng の内容は、以下の内容と等価になります。

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0"
  xmlns:lena="http://lena.org/" xmlns:batz="http://batz.org/">

<start>
 <element name="lena:document">
   <ref name="para"/>
 </element>
</start>

<define name="para">
 <element name="batz:em"><empty/></element>
</define>

</grammar>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「include要素 @ ぽかぽか RELAX NG 工房」

define 要素

マクロを定義する要素

一聯のパターンをマクロ(外部から参照させるための「部品」)として利用したい場合、そのパターン群を define要素の中身とします。いくつかのファイルに分けて「モジュール」を作りたい場合、必携の要素となります。
define要素の中身は、常に ref要素から参照されます。 externalRef要素, include要素などでは参照出来ません。
常に grammar要素もしくは include要素の子要素として記述しなければなりません。 define要素を入れ子にしたり、各種パターン要素の子要素としたりしてはなりません。
通常は、同一ファイル内で define要素と ref要素が対応します。ただし、include要素を用いて外部ファイルの取り込みを行っている場合は、参照元(ref要素) と参照先(define要素) が異なるファイル内に存在しても構いません。ただし、 ref要素の参照先が取り込みファイルの中に存在しない場合はエラーとなります。

同じ名前を持つ複数の define要素

grammar要素の子要素として記述する場合は、combine 属性で結合法則を明示しなければなりません。combine 属性には、 choice もしくは interleave どちらかの値を取ることが出来ます。
include要素の子要素として記述する場合は、「定義の上書き」のみが可能です。当然マクロの名前は、参照先の外部ファイルの中に含まれていなければなりません。新たなマクロの定義や、combine 属性を用いた「定義の結合」は出来ません。

属性

name 属性

マクロの名前を定義します。name 属性の属性値は NCName となっているため、名前空間が異なる要素／属性宣言の中でも、同じ名前を使って参照することが出来ます。ただし、接頭辞と名前を区切るための : は使用出来ません。ピリオドやハイフン、アンダースコアは利用できます。尚、大文字小文字は区別されるので、注意してください。

combine 属性

結合法則を明示します(詳しくは後述)。

子ノード

空の define要素はあまりよろしくないと思います。モジュールの組み込みにおいて「記述不可能」の旨の初期値を定義したい場合は、empty要素を子要素に入れるのが最適でしょう。ただし、ここで notAllowed要素を用いるとややこしいことになるので、注意が必要です (詳しくは「notAllowed要素の解説」にて)。
全てのパターン関聯要素もしくは element要素, attribute要素などを子要素にすることが可能ですが、してはいけないものもあります。例えば、要素／属性名の排他定義(◎◎と△△以外の全ての要素を中身にするような定義)の中では、 define, ref 各要素によるマクロの取り込みが出来ません。例えば、次のような記述は不可能です。
```
<element>
 <anyName>
 <except> 
 <ref name="exceptRule"/> 
 </except>
 </anyName>
....
</element>

<define name="exceptRule">
 <choice>
 <name>abc</name>
 <name>def</name>
 </choice>
</define>
```
ただし、ref要素, define要素を使わず、直截 define要素の中身を except要素の中に記述すれば、全く問題はありません。

使用例

例 1: define要素と include要素を用いた例

define要素と include要素を用いた例

ファイル1: schema1.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<start>
 <element name="document">
   <ref name="para"/> <!-- マクロの参照 -->
 </element>
</start>

<include href="schema2.rng"/> <!-- 外部ファイル取り込み -->

<define name="para" combine="choice">
 <element name="strong"><empty/></element>
</define>

</grammar>

ファイル2: schema2.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<define name="para"> <!-- 外部ファイル中の define 要素 -->
 <element name="em"><empty/></element>
</define>

</grammar>

例 2: 上記と等価なスキーマ

上記と等価なスキーマ

上記のスキーマをマクロを使用しないで記述した場合、以下のようになります。

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<start>
 <element name="document">
   <choice> <!-- define 要素の combine 属性による効果 -->
    <element name="strong"><empty/></element>
    <element name="em"><empty/></element>
   </choice>
 </element>
</start>

</grammar>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「define要素 @ ぽかぽか RELAX NG 工房」

ref 要素

マクロを参照する要素

define要素で定義されたマクロを、他のパターンの中で参照し、埋め込むための要素です。
include要素や externalRef要素を使って外部ファイルを取り込んでいる場合は、異なるファイル間で ref要素と define要素が対応していても構いません。
コンテナの属性 (XML 文書なら要素／属性名) の定義の中では使用できません。
つまり、XML の name要素, anyName要素, nsName要素の「置き換え」としては使えない、ということです。当然、要素や属性名の定義に関係した記述は「モジュール化」は出来ません。
入れ子の参照

自分自身が含まれるパターンを取り込んだり、参照先の定義に自分自身への参照先を記述したりすることも可能です。例えば、以下の記述では、 nest 要素が無限に入れ子可能であることが定義されています。


<define name="NestPattern">
 <element name="nest">
  <ref name="NestPattern"/>
 </element>
</define>

XML において、このような入れ子が可能であるのは、大抵は要素の中身の定義内のみに限られます。属性の定義を入れ子にすることなどはもともと不可能なので、上記のような記述は出来ません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

name 属性

マクロ名を指定します。 NCName なので、コロンは使えません。アンダースコア、ハイフン、ピリオドは使用できます。大文字小文字は区別されますので、注意してください。また、参照先が define要素で定義されていない場合はエラーになります。

ns,xmlns:xxx,datatypeLibrary 属性

共通属性 ns 属性 ,xmlns:xxxx 属性 , datatypeLibrary 属性が使用できます。例えば、外部ファイルへの参照を行う場合、名前空間やデータ型の再定義をしたい際に使用出来ます。

子ノード

常に空要素。子ノードを持ちません。

使用例

例 1:

define要素の説明を参照してください。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「ref要素 @ ぽかぽか RELAX NG 工房」

externalRef 要素

外部スキーマをマクロとして参照する要素

外部スキーマを、まるごとマクロとして参照、埋め込みを行うための要素です。
include要素が grammar要素を最上位要素としたスキーマを取り込むのに対し、externalRef要素は、主にそれ以外の要素が最上位要素であるスキーマを参照するのに用いられます。
コンテナの属性 (XML 文書なら要素／属性名) の定義の中では使用できません。
つまり、XML の name要素, anyName要素, nsName要素の「置き換え」としては使えない、ということです。当然、要素や属性名の定義に関係した記述は「モジュール化」は出来ません。
一応、最上位要素としても記述できます。意味があるのかどうかはともかく、取り敢えず可能です。
ref要素との違いは、define要素の中身を指定するか外部スキーマの内容を指定するかの違いだけで、原則として機能は全く同一です。つまり、externalRef要素で参照される外部スキーマの書式は、define要素の中身と成り得る書式と同一である必要があります。具体例に関しては後述します。

grammar 要素の直下には置いてはなりません。

属性

href 属性

取り込む外部スキーマ名を指定します。値は URI です。

ns,xmlns:xxx,datatypeLibrary 属性

共通属性 ns 属性 ,xmlns:xxxx 属性 , datatypeLibrary 属性が使用できます。例えば、外部ファイルへの参照を行う場合、名前空間やデータ型の再定義をしたい際に使用出来ます(ただし、参照先で既に定義されている場合は、そちらが優先されます)。

子ノード

常に空要素。子ノードを持ちません。

使用例

例 1: externalRef要素を使用した例

externalRef要素を使用した例

schema1.rng

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<start>
 <element name="drinkshop">
   <externalRef href="schema2.rng"/> <!-- 外部スキーマの参照 -->
 </element>
</start>

</grammar>

schema2.rng (最上位要素は大抵パターン関聯要素 ; ここでは choice 要素)

<?xml version="1.0"?>
<choice xmlns="http://relaxng.org/ns/structure/1.0">
 <element name="favoriteItem">
  <text/>
 </element>
 <element name="regularItem">
  <text/>
 </element>
</choice>

例 2: externalRef 要素を使わない場合

externalRef 要素を使わない場合

schema1.rng は、以下の記述と同一になります (強調部分は、 externalRef 要素によって取り込まれた記述)。

<?xml version="1.0"?>
<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<start>
 <element name="drinkshop">
  <choice>
   <element name="favoriteItem">
    <text/>
   </element>
   <element name="regularItem">
    <text/>
   </element>
  </choice>
 </element>
</start>

</grammar>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「externalRef要素 @ ぽかぽか RELAX NG 工房」

parentRef 要素

親階層のマクロを参照する要素

通常、マクロを参照するためには ref要素を用います。しかし、grammar要素が入れ子になっている場合には、参照元の属する grammar要素から外れた場所に存在するマクロは参照することが出来ません。
parentRef要素を用いることで、親階層に存在するマクロを参照することが出来ます。
grammar要素の入れ子や階層構造は、異る言語のスキーマを取り込むことによる「マクロのかち合わせ」を避けるための一つの方法です。しかし、記述が繁雑になるため、通常はあまり用いられません。

属性

name 属性

参照するマクロ名を明示します。

子ノード

(ref要素と同様)

常に空要素。子ノードを持ちません。

使用例

例 1: ref要素の場合

ref要素の場合

以下のスキーマを考えてみます。

<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<define name="想い出の品1">
 <value>卒業アルバム</value>
</define>

<start>
 <element name="僕">
  <choice>
   <ref name="想い出の品1"/>
			<grammar>
    <start>
     <element name="私">
      <ref name="想い出の品2"/>
     </element>
    </start>
    <define name="想い出の品2">
     <value>ビーズのネックレス</value>
    </define>
   </grammar>
  </choice>
 </element>
</start>

</grammar>

grammar要素が入れ子になっているため、僕要素にある想い出の品1のマクロは、私要素のそれとは「違う階層に属するもの」として扱われます。

ref要素は「同じ grammar要素の階層に存在するマクロ」しか参照しません。従って上記の例では、マクロそのものを移動させない限り、いかなるマクロ名を用いたとしても、以下の二種類の文書しか妥当として扱われません。

<僕>卒業アルバム</僕>
<僕><私>ビーズのネックレス</私></僕>

また、ref要素では、私要素内から想い出の品1 を参照することも出来ませんし、僕要素内から想い出の品2 を参照することも出来ません。

例 2: parentRef要素を用いた場合

parentRef要素を用いた場合

私要素内から親階層に存在する想い出の品1のマクロを参照する場合は、以下のように書き直します。

<grammar xmlns="http://relaxng.org/ns/structure/1.0">

<define name="想い出の品1">
 <value>卒業アルバム</value>
</define>

<start>
 <element name="僕">
  <choice>
   <ref name="想い出の品1"/>
   <grammar>
    <start>
     <element name="私">
      <parentRef name="想い出の品1"/>
     </element>
    </start>
    <define name="想い出の品2">
     <value>ビーズのネックレス</value>
    </define>
   </grammar>
  </choice>
 </element>
</start>

</grammar>

このようにすることで、私要素が取り得る中身は、想い出の品1、つまり「卒業アルバム」に変わります。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「parentRef要素 @ ぽかぽか RELAX NG 工房」

defineFuncitons 要素

関数宣言を行う要素

関数定義を行う際に用います。

属性

この要素に固有な属性はありません。

制約

start 要素、class 要素（java 名前空間の場合のみ）の子としてのみ現れることができます。

子ノード

function 要素を子に持ちます。

使用例

例 1:

<defineFunctions>
  <lang:function name="setValue">
    <lang:arg type="int" name="iValue" direction="in"/>
    <lang:return type="void"/>
  </lang:function>
  <lang:function name="getValue">
    <lang:return type="int"/>
  </lang:function>
</defineFunctions>

defineMapping 要素

マッピングを定義する要素

データのマッピングを記述する際に用います。
デコード・エンコード処理を行う関数が、マッピングにしたがって処理を行います。

属性

direction 属性

マッピングの方向を指定します。

decode : デコードを行います。
encode : エンコードを行います。

制約

function 要素の子としてのみ現れることができます。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。

使用例

例 1: decode

<defineMapping direction="decode" xmlns:txt="http://ums.isas.jaxa.jp/0.4/dat">
  <txt:list encode="txt">
  <txt:data type="token"/>
  <lang:value-of select="strData">
    <data type="token"/>
  </lang:value-of>
  <lang:callFunction expr="setStringValue( strData );"/>
  <lang:value-of select="iData">
    <data type="int"/>
  </lang:value-of>
  <lang:callFunction expr="setIntValue( iData );"/>
  </txt:list>
</defineMapping>

例 2: encode

<defineMapping direction="encode" xmlns:txt="http://ums.isas.jaxa.jp/0.4/dat">
  <txt:list encode="txt" delimiter=" ">
  <lang:callFunction expr="strData = getStringValue();"/>
  <lang:value-of select="strData">
    <data type="token"/>
  </lang:value-of>

  <lang:callFunction expr="iData = getIntValue();"/>
  <lang:value-of select="iData">
    <lang:data type="int"/>
  </lang:value-of>
  </txt:list>
</defineMapping>

defineVariables 要素

変数宣言を行う要素

変数の定義を行う際に用います。
start 要素の子として定義した場合は、グローバル変数、 fucntion 要素の子として定義して場合は、ローカル変数として扱われます。

属性

この要素に固有な属性はありません。

制約

start 要素、class 要素（java 名前空間の場合のみ）、function 要素の子としてのみ現れることができます。

子ノード

複数の array 要素、var 要素を持つことができます。

使用例

例 1:

<defineVariables>
  <lang:array size="4096">
  <lang:var type="char" name="strData"/>
  </lang:array>
  <lang:var type="int" name="iData"/>
</defineVariables>

group 要素

一聯のパターンを明示する要素

一聯の複数のパターンが切り離すことが出来ないものである場合、それらを group要素を用いて明示します。

コンテナやサブコンテナ (XMLなら要素属性値、要素の中身) など様々な定義の中で使うことが出来ます。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

この要素に固有な属性はありません。

子ノード

子ノードに様々なパターンを取り込み、choice要素などと組み合わせることで、複雑な選択肢を作成することが可能になります。
子ノードには、コンテナ (XMLなら要素や属性) やサブコンテナの宣言が混在していても構いません。
optional要素, choice要素, zeroOrMore要素など、様々なパターンを子孫要素に入れることが出来ます。
group要素が出現しても、パターン出現順序は保持されます。

ref 要素を中身にし、マクロを参照することが出来ます。

使用例

例 1: 親要素の属性値によって子要素の中身を変化させるスキーマ

親要素の属性値によって子要素の中身を変化させるスキーマ

<?xml version="1.0"?>
<element name="start" xmlns="http://relaxng.org/ns/structure/1.0">
 <choice>
  <group>
   <attribute name="myway">
    <value>1</value>
   </attribute>
   <element name="Japan-way"><empty/></element>
  </group>
  <group>
   <attribute name="myway">
    <value>2</value>
   </attribute>
   <element name="China-way><empty/></element>
  </group>
 </choice>
</element>

この場合、以下の文書は妥当な文書となります。

<?xml version="1.0"?>
<start myway="1">
 <Japan-way/>
</start>

<?xml version="1.0"?>
<start myway="2">
 <China-way/>
</start>

ただし、以下の文書は妥当ではありません。

<?xml version="1.0"?>
<start myway="lena"> <!-- myway 属性の属性値は1か2のみ -->
 <Japan-way/>
</start>

<?xml version="1.0"?>
<start myway="1">
 <China-way/> <!-- myway="1" のとき、許されるのは Japan-way 要素のみ -->
</start>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「group要素 @ ぽかぽか RELAX NG 工房」

interleave 要素

順位不同の必須パターンを定義する要素

子要素に記述される一聯のパターンに関し、順位不同で必須の記述であることを示す要素です。group要素が「順位を保持したグループ化」であるのに対し、interleave要素は「順不同のグループ化」を明示する要素であると言えます。
XML文書の属性の出現順位はもともと順位不同なので、attribute要素の親要素として使用しても意味がありません。ただし、モジュールを用いて属性を増やしたい場合には、この要素の利用価値があるかと思われます。

コンテナやサブコンテナ (XMLなら要素属性値、要素の中身) など様々な定義の中で使うことが出来ます。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

この要素に固有な属性はありません。

制約

interleave の直下に指定できる子要素の数は、最大「32」です。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。
choice要素, optional要素, zeroOrMore要素などを子に持つことも可能です。
interleave要素でグループ化すべきパターンが同一である (要素なら要素、属性なら属性など) 方が理解しやすいですが、必ずしもそのようにしなければならない決まりはありません。

ref 要素を中身にし、マクロを参照することが出来ます。

使用例

例 1:

例えば、以下のようなスキーマの記述があったとします。

<element name="doc">
 <interleave>
  <element name="a"><empty/></element>
  <element name="b"><empty/></element>
  <element name="c"><empty/></element>
 </interleave>
</element>

上記のスキーマに照らし合わせれば、以下の記述はいずれも妥当なものとなります。

<doc><a/><c/></doc>
<doc><a/><c/></doc>
<doc><a/><c/></doc>
<doc><c/><a/></doc>
<doc><c/><a/></doc>
<doc><c/><a/></doc>

例 2: group の interleave

group の interleave

以下のパターン

<interleave>
  <group>
    <element name="a"><text/></element>
    <element name="b"><text/></element>
  </group>
  <element name="c"><text/></element>
</interleave>

は、以下にマッチします。

<a/><c/>
<a/><c/>
<c/><a/>

考えてみよう！

その 1: 入れ子の interleave 要素

入れ子の interleave 要素

interleave要素直下に interleave要素を置いても効果はありません。つまり、以下の記述例は、全く同一の機能を有します。

記述例1

<interleave>
 <ref name="a"/>
 <interleave>
  <ref name="b"/>
  <ref name="c"/>
 </interleave>
</interleave>

記述例2

<interleave>
 <ref name="a"/>
 <ref name="b"/>
 <ref name="c"/>
</interleave>

その 2: empty要素を含んだ interleave要素

empty要素を含んだ interleave要素

interleave要素の子要素に1個以上の empty要素が存在した場合、それらの empty要素は、単に無視されます。

その 3: notAllowed要素を含んだ interleave要素

notAllowed要素を含んだ interleave要素

interleave要素の子要素に1個以上の notAllowed要素が存在した場合、interleave要素の内容そのものが無視され、1つの notAllowed要素として認識されます。

上記の現象は、

他の記述に混じって、「不許可」というパターンも適用させなければならない。
元のパターン (ここでは interleave要素) そのものが「不許可」扱いされる。
元のパターン自体が「不許可というパターンを適用させるもの」と認識される。

と説明附けられます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「interleave要素 @ ぽかぽか RELAX NG 工房」

choice 要素

選択肢を定義する要素

子要素に記述される一聯のパターンに関し、それらのうちの一つを選ばせるために用いる要素です。

コンテナやサブコンテナ (XMLなら要素属性値、要素の中身) など様々な定義の中で使うことが出来ます。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

この要素に固有な属性はありません。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。
同一選択肢の中に入れるパターンは、出来るだけ同じ性質のもの(要素なら要素、属性なら属性など)を入れるのが望ましいと思われます。しかし文法がおかしくならない限りは、異種のパターンを同じ選択肢に入れることは可能です。例えば、附加情報を属性でも子要素でも現せるようにしたい場合には、要素の宣言パターンと属性の宣言パターンを同列の選択肢の中に記述する必要があります。

ref 要素を中身にし、マクロを参照することが出来ます。

使用例

例 1: mapping の例 (XML-XML syntax)

mapping の例 (XML-XML syntax)

以下のパターンは、'A' もしくは '2' にマッチします。プログラミング言語では、これらをそれぞれ変数 id の値 '1'、'2'に、対応させています。

<choice>
  <group>
    <dat:byte><dat:value>A</dat:value></dat:byte>
    <lang:value-of select="id"><lang:value>1</lang:value></lang:value-of>
  </group>
  <group>
    <dat:byte>
      <lang:value-of select="id"><value>2</value></lang:value-of>
    </dat:byte>
  </group>
</choice>

例 2: mapping の例 (XML-language syntax)

mapping の例 (XML-language syntax)

例 1 は、以下のように書き直すことができます。しかし、記述方法については、まだ決定していません。

encode の例

<choice>
  <group>
    <lang:value>1</lang:value> = id;
    <dat:byte><dat:value>A</dat:value></dat:byte>
  </group>
  <group>
    <dat:byte>
      <value>2</value> = id;
    </dat:byte>
  </group>
</choice>

decode の例

<choice>
  <group>
    <dat:byte><dat:value>A</dat:value></dat:byte>
    id = <lang:value>1</lang:value>;
  </group>
  <group>
    <dat:byte>
      id = <value>2</value>;
    </dat:byte>
  </group>
</choice>

choice 直下の group の中に、通常はその他のデータ定義が含まれます。処理系に実装されたアルゴリズムは全ての文法を取り扱えるとは限りません。固定のための識別パターンは、先頭で定義することが好まれます。

考えてみよう！

その 1: 入れ子の choice要素

入れ子の choice要素

choice要素直下に choice要素を置いても効果はありません。つまり、以下の記述例は、全く同一の機能を有します。

記述例1

<choice>
 <ref name="a"/>
 <choice>
  <ref name="b"/>
  <ref name="c"/>
 </choice>
</choice>

記述例2

<choice>
 <ref name="a"/>
 <ref name="b"/>
 <ref name="c"/>
</choice>

その 2: empty要素を含んだ choice要素

empty要素を含んだ choice要素

要素の中身の定義に関し、empty要素と、それ以外のパターンを示す要素が同時に子要素である場合、 2個目以降の empty要素は効果がありません。notAllowed要素の場合と違い、「空の記述 = 何も書かない状態」も許されることに注意してください(つまり、選択肢がオプション扱いされる)。

その 3: notAllowed要素を含んだ choice要素

notAllowed要素を含んだ choice要素

notAllowed要素と、それ以外のパターンを示す要素が同時に子要素である場合、notAllowed要素が書かれていないことと変わりません。

このことは、モジュールを設計する際に役に立ちます。例えば、デフォルトでは「記述不可能」としておき、モジュールを結合させることで選択肢を設置もしくは増やす、といったことが出来ます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「choice要素 @ ぽかぽか RELAX NG 工房」

optional 要素

出現の有無を任意にする要素

子要素に記述される一聯のパターンに関し、それらのパターンの出現を任意にする要素です。具体的に言えば、0回もしくは1回の出現を指示する働きを持ちます。
とりわけ attribute要素の親要素として用いることで、属性をオプション扱いとして定義出来ます(DTD では #IMPLIED の宣言に相当)。
attribute要素の子孫要素としては用いることが出来ません。

コンテナやサブコンテナ (XMLなら要素属性値、要素の中身) など様々な定義の中で使うことが出来ます。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

lang:occurs 属性

名前空間 lang に属する属性です。optional 内の処理を実行するかどうかを、事前に設定してください。

decode : 「1」であれば、optional 内の処理を実行します。
encode : 「1」であれば、optional 内の処理を実行します(encode 時は必須です)。

lang:occured 属性

名前空間 lang に属する属性です。optional の処理の後に設定されます。

decode : optional 内の処理を実行できた場合は「1」、実行できなかった場合は「0」が、指定された変数に代入されます。
encode : 指定できません。

制約

optional、oneOrMore、zeroOrMore を入れ子にできる最大数は、「32」です。
ref 要素を中身にし、マクロを参照することが出来ます。ただし、ソースコードの生成前に、define/ref が展開されている必要があります。
lang:occurs 属性と、lang:occured 属性を同時に指定することはできません。どちらか一方を必ず指定してください。
occurs 属性に 0 または 1 以外の値を指定することはできません。エラーとなります。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。

考えてみよう！

その 1: 連続する optional要素

連続する optional要素

連続する optional要素の中身を、一つの optional要素の中身としてまとめることは出来ません。以下に、その例を示します。

例1

<optional>
  <ref name="a"/>
</optional>
<optional>
  <ref name="b"/>
</optional>

例2

<optional>
  <ref name="a"/>
  <ref name="b"/>
</optional>

例1では、「aとbそれぞれが任意出現パターン」であるのに対し、例2では、「aとbとの並びが任意出現」となります。それぞれのパターンを任意出現パターンとして定義したい場合は、面倒でも独立した optional要素の子要素として記述しなければなりません。

その 2: 出現順番に関して

出現順番に関して

choice要素, interleave要素の子要素でない場合、定義の出現順番は保持されます。例えば、以下のスキーマを考えます。

<element name="p">
  <optional>
    <element name="a"><empty/></element>
  </optional>
  <optional>
    <element name="b"><empty/></element>
  </optional>
</element>

上記のスキーマに則った場合、以下の文書は妥当とはなりません。

<p><b/><a/></p>

つまり「オプション扱い」になると言っても、順序まで任意になるわけではないので、注意してください(順序を任意にしたい場合は、choice要素, interleave要素の子要素とする必要があります)。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「optional要素 @ ぽかぽか RELAX NG 工房」

oneOrMore 要素

1回以上の繰り返しを定義する要素

子要素に記述される一聯のパターンに関し、それらのパターンが1回以上繰り返して出現することを指示する要素です。
XML では、主に要素の中身の定義に対して用います。
attribute要素の直截の親要素として用た場合、その属性は必須属性と見倣されます(attribute要素を element要素直下に記述した場合と同様)。ただし、複数の同名の属性を記述出来るわけではないので、注意してください。
attribute要素の子孫要素としては用いることが出来ません。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

要素名に大文字が混じっていますので、記述には注意してください。

属性

lang:occurs 属性

名前空間 lang に属する属性です。繰り返し処理の回数を、事前に設定してください。

decode : 指定された回数だけ、繰り返し処理を実行します。
encode : 指定された回数だけ、繰り返し処理を実行します(encode 時は必須です)。

lang:occured 属性

名前空間 lang に属する属性です。oneOrMore の処理の後に設定されます。

decode : 繰り返し数の解析結果が、指定された変数に代入されます。
encode : 指定できません。

制約

optional、oneOrMore、zeroOrMore を入れ子にできる最大数は、「32」です。
ref 要素を中身にし、マクロを参照することが出来ます。ただし、ソースコードの生成前に、define/ref が展開されている必要があります。
lang:occurs 属性と、lang:occured 属性を同時に指定することはできません。どちらか一方を必ず指定してください。
lang:occurs 属性に 1 未満の値を指定することはできません。エラーとなります。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。

使用例

例 1: mapping の例 (XML-XML syntax)

mapping の例 (XML-XML syntax)

以下のパターンは、1 バイト以上のバイナリデータにマッチします。変数 n に、バイト長を対応させています。

decode の例

<oneOrMore lang:occured="n">
  <dat:byte length="1">
    <lang:value-of select="i">
      <data type="int"/>
    </lang:value-of>
  </dat:byte>
  <callFunction expr="pushValue( i );"/>
</oneOrMore>

encode の例

<oneOrMore lang:occurs="n">
  <callFunction expr="i = popValue();"/>
  <dat:byte length="1">
    <lang:value-of select="i">
      <data type="int"/>
    </lang:value-of>
  </dat:byte>
</oneOrMore>

decode では、繰り返し数の解析結果が変数 n に代入されます。また、 encode では、変数 n で指定された回数分繰り返しが行われます。

例 2: mapping の例 (XML-language syntax)

mapping の例 (XML-language syntax)

例 1 は、以下のように書き直すことができます。しかし、記述方法については、まだ決定していません。

decode の例

<oneOrMore>
  <dat:byte length="1">
    <callFunction expr="pushValue( <data type="int"/> );">
  </dat:byte>
  n =
</oneOrMore>;

encode の例

<oneOrMore>
  = n;
  <dat:byte length="1">
    <data type="int"/> = <callFunction expr="popValue();"/>
  </dat:byte>
</oneOrMore>

例 3: JAVA での mapping の例 (XML-language syntax)

JAVA での mapping の例 (XML-language syntax)

JAVA には Interator や Collection など集合を取り扱うのに便利なクラスがそろっています。これらを使用することもできます。

Iterator を用いた encode

<oneOrMore>
  <lang:var class="Byte" name="b" interator="iterator">
    <dat:byte length="1">
      <data type="byte"/> = b.byteValue();
    </dat:byte>
  </lang:var>
</oneOrMore>

List を用いた encode

<oneOrMore>
  <lang:var class="Byte" name="b" collection="list">
    <dat:byte length="1">
      <data type="byte"/> = b.byteValue();
    </dat:byte>
  </lang:var>
</oneOrMore>

List を用いた decode

<oneOrMore>
  <dat:byte length="1">
    list.add( new Byte(<data type="byte"/>) );
  </dat:byte>
</oneOrMore>

が、美しい記法ではないですね。

考えてみよう！

その 1: 連続する oneOrMore要素

連続する oneOrMore要素

連続する oneOrMore要素の中身を、一つの oneOrMore要素の中身としてまとめることは出来ません。以下に、その例を示します。

例1

<oneOrMore>
  <ref name="a"/>
</oneOrMore>
<oneOrMore>
  <ref name="b"/>
</oneOrMore>

例2

<oneOrMore>
  <ref name="a"/>
  <ref name="b"/>
</oneOrMore>

例1では、「aが1回以上出現した後、bが1回以上出現するパターン (aa…bb…)」であるのに対し、例2では、「aとbが、この順番を保持したまま1回以上出現 (abab…)」となります。

その 2: 出現順番に関して

出現順番に関して

choice要素, interleave要素の子要素でない場合、定義の出現順位は保持されます。
oneOrMore要素の子要素の中で、choice要素, interleave要素が存在しない部分は、定義の出現順位は保持されます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「oneOrMore要素 @ ぽかぽか RELAX NG 工房」

zeroOrMore 要素

0回以上の繰り返しを定義する要素

子要素に記述される一聯のパターンに関し、それらのパターンが任意の回数(0回含む)繰り返して出現することを指示する要素です。
XML では、主に要素の中身の定義に対して用います。
attribute要素の直截の親要素として用いた場合、その属性はオプション属性と見倣されます (optional要素の子要素として記述した場合と同じ)。同名の属性を複数記述出来るようになるわけではありませんので、注意してください。
attribute要素の子孫要素としては用いることが出来ません。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

要素名に大文字が混じっていますので、記述には注意してください。

属性

lang:occurs 属性

名前空間 lang に属する属性です。繰り返し処理の回数を、事前に設定してください。

decode : 指定された回数だけ、繰り返し処理を実行します。
encode : 指定された回数だけ、繰り返し処理を実行します(encode 時は必須です)。

lang:occured 属性

名前空間 lang に属する属性です。zeroOrMore の処理の後に設定されます。

decode : 繰り返し数の解析結果が、指定された変数に代入されます。
encode : 指定できません。

制約

optional、oneOrMore、zeroOrMore を入れ子にできる最大数は、「32」です。
ref 要素を中身にし、マクロを参照することが出来ます。ただし、ソースコードの生成前に、define/ref が展開されている必要があります。
lang:occurs 属性と、lang:occured 属性を同時に指定することはできません。どちらか一方を必ず指定してください。
lang:occurs 属性に 0 未満の値を指定することはできません。エラーとなります。

子ノード

複数のコンテナもしくはサブコンテナを子要素に持つことが出来ます。

interleave

optional

zeroOrMore

考えてみよう！

その 1: 連続する zeroOrMore要素

連続する zeroOrMore要素

連続する zeroOrMore要素の中身を、一つの zeroOrMore要素の中身としてまとめることは出来ません。以下に、その例を示します。

例1

<zeroOrMore>
 <ref name="a"/>
</zeroOrMore>
<zeroOrMore>
  <ref name="b"/>
</zeroOrMore>

例2

<zeroOrMore>
  <ref name="a"/>
  <ref name="b"/>
</zeroOrMore>

例1では、「aが1回以上出現した後、bが0回以上出現するパターン (aa…bb…)」であるのに対し、例2では、「aとbが、この順番を保持したまま0回以上出現 (abab…)」となります。

その 2: 出現順番に関して

出現順番に関して

choice要素, interleave要素の子要素でない場合、定義の出現順位は保持されます。
zeroOrMore要素の子要素の中で、choice要素, interleave要素が存在しない部分は、定義の出現順位は保持されます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「zeroOrMore要素 @ ぽかぽか RELAX NG 工房」

text 要素

一般テキストの包含を指示する要素

要素の中身が子要素を含まない普通のテキスト(DTD の #PCDATA に相当)、もしくは属性値が普通のテキスト(DTD の CDATA に相当)であることを指示したい場合、それを (原稿が間違っています。用語が定義されていません!!) として明示します。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

この要素に固有な属性はありません。

子ノード

常に空要素。子ノードを持ちません。

考えてみよう！

その 1: パターン

パターン

連続する text要素は、一つの text要素と見倣されます(ただし、同じツリー内にあっても、何らかの要素を挟んで存在する場合は、また別の話になります)。
choice要素内に複数の text要素があった場合、それらは一つの text要素と見倣されます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「text要素 @ ぽかぽか RELAX NG 工房」

value 要素

特定値のテキストを要求する要素

ある要素の中身もしくは属性値において、ある特定の値を持つテキストのみを許すようにしたい場合、その値を value要素として明示します。
element要素もしくは attribute要素の子孫要素として主に用いられます。

grammar 要素の直下には置いてはなりません。

属性

type 属性

データ型を指定します。

type 属性が存在する場合、先祖(もしくは自分自身の)要素の datatypeLibrary 属性によるデータ型ライブラリに応じたデータ型が適用されます。当然ですが、value要素の中身は、そのデータ型に準じたものでなければなりません。
type 属性が存在しない場合は、 type="token" が(暗示的に)指定されたものと見倣され、先祖要素の datatypeLibrary 属性による指定は無視されます(RELAX NG 由来のデフォルトのデータ型になる)。

制約

value 要素は、 Mapping definition の以下の位置のみに現れることができます。

- lang:value-of - lang:value -
- dat:container - dat:value -
- dat:container - lang:value-of - ums:value -

ただし、ここで dat:container は dat:byte, dat:bit, rng:element, rng:attribute などを示しています。以下は obsolete です。

- lang:value-of - dat:container - ums:value -

子ノード

テキストノードを子に一つ持ち特定の値を定義します。

使用例

例 1: 要素の中身

要素の中身

例えば、好物要素の中身をステーキ、ショートケーキ、クリームシチューの三つからの択一にしたい場合は、以下のような記述が考えられます。

スキーマ(の一部)

<element name="好物">
 <choice>
  <value>ステーキ</value>
  <value>ショートケーキ</value>
  <value>クリームシチュー</value>
 </choice>
</element>

実際の XML 文書(の断片)の一例

<好物>ショートケーキ</好物>
<好物>ハンバーグ</好物>

例 2: 属性値

属性値

例えば、画像要素においてファイル属性と配置属性を定義し、ファイル属性は任意のテキスト、配置属性には右、左のどれかの値を入れられるようにしたい場合、以下のような記述が出来ます(要素は空要素とします)。

スキーマ(の一部)

<element name="画像">
 <empty/>
 <attribute name="ファイル">
  <text/>
 </attribute>
 <attribute name="配置">
  <choice>
   <value>右</value>
   <value>左</value>
  </choice>
 </attribute>
</element>

実際の XML 文書(の断片)の一例

<画像ファイル="RheineRiver.jpg" 配置="左"/>
<画像ファイル="ObiRiver.gif" 配置="中央"/>

以上の例のように、value要素は、choice要素と用いることが多いかと思われます。また、値を一つしか持ち得ないような場合は、choice要素を介さず、value要素を直截子要素として記述することが可能です。

DTD の如く「何も入れなかった場合の初期値」を決定することは出来ません。RELAX-NGはあくまで「XML文書の検証」をするための機構であり、何かしらの前提をスキーマ自身に盛りこむべきではない、との理念に基づいているからです。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「value要素 @ ぽかぽか RELAX NG 工房」

data 要素

特定のデータ型を明示的に指定する要素

普通のテキストではなく、数値(整数や実数)や URI, Base64 などといった、特殊な形のテキストのみを許容したい場合、それを data要素として明示します。
要素の中身としても、属性値としても使えます。それぞれ、element要素, attribute要素の中身として data要素を記述します。
先祖要素において、 datatypeLibrary 属性によって、取り込むデータ型ライブラリを明示する必要があります。

属性

type 属性

データ型を指定します(これは必須です)。取り得る値は、ライブラリに完全に依存します。

制約

data 要素は、 Mapping definition の以下の位置のみに現れることができます。

- lang:value-of - lang:data -
- dat:container - dat:data -
- dat:container - lang:value-of - ums:data -

ただし、ここで dat:container は dat:byte, dat:bit, rng:element, rng:attribute などを示しています。以下は obsolete です。

- lang:value-of - dat:container - ums:data -

以下の場合は、データが「不定」になります。

decode 時の lang:data
encode 時の dat:data

子ノード

空要素にした場合、データの制限は type 属性の内容のみに依存します。
param要素を中身に入れることで、データ型にさらなる制限を附加させることが出来ます。param要素を複数入れても構いません。

使用例

例 1: プロフィールの作成

プロフィールの作成

W3C XML Schema Part 2 のライブラリを用いた例を紹介致します。尚、param要素を併用した例に関しては、「param要素」の項を御覧ください。

プロフィールに、氏名, 年齢, 誕生日, サイトURI を入れたい場合は、以下のようなスキーマが作られるでしょう(簡単のため、要素の出現順序は固定とします)。

スキーマ例

<?xml version="1.0"?>
<element name="プロフィール" xmlns="http://relaxng.org/ns/structure/1.0"
  datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
 <element name="氏名">
  <data type="string"/> <!-- 通常の文字列 -->
 </element>
 <element name="年齢">
  <data type="integer"/> <!-- データは整数 -->
 </element>
 <element name="誕生日">
  <data type="date"/> <!-- データは日附(ISO 8601形式) -->
 </element>
 <element name="サイト">
  <data type="anyURI"/> <!-- データは URI -->
 </element>
</element>

妥当な XML 文書の一例

<?xml version="1.0"?>
<プロフィール>
 <氏名>真田ゆり子</氏名>
 <年齢>18</年齢>
 <誕生日>1985-05-11</誕生日>
 <サイト>http://www.sanada.org/</サイト>
</プロフィール>

妥当でない XML 文書の一例

<?xml version="1.0"?>
<プロフィール>
 <氏名>金子時男</氏名>
 <年齢>さんじゅうに</年齢> <!-- 整数でない -->
 <誕生日>昭和40年5月1日</誕生日> <!-- ISO 8601 形式でない -->
 <サイト>金子プロ</サイト> <!-- URI でない -->
</プロフィール>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「data要素 @ ぽかぽか RELAX NG 工房」

param 要素

データ型に附加情報を与える要素

特定のデータ型に関し、何らかの制限や情報を附加させるための要素です。
name 属性が制限を課す条件名、中身がその条件の値を、それぞれ示します。name 属性の属性値と param要素の中身は、データ型ライブラリの定義に依存します(RELAX-NG 内部では、特に定義されていません)。
常に data要素の直下に置かなければなりません。

属性

name 属性

制限を課す条件名を示します。とりうる条件名は、データ型ライブラリの定義に依存します(RELAX-NG 内部では、特に定義されていません)。

子ノード

子にテキストノードを一つ持ち条件のパラメタを示します。とりうる値は、データ型ライブラリの定義に依存します(RELAX-NG 内部では、特に定義されていません)。
中身は常にテキストです。空の param要素は望ましくないと思われます。

使用例

例 1: 「プロフィール」の例

「プロフィール」の例

data要素と同じ例。プロフィールには氏名, 年齢のみが入れられるとします。

制限すべき事項と具体的制限

氏名は通常の文字列で、文字数は1 〜 10 文字とします。
年齢は整数値で、範囲は0-150とします。

実際の記述例

スキーマ例

<?xml version="1.0"?>
<element name="プロフィール" xmlns="http://relaxng.org/ns/structure/1.0"
  datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
 <element name="氏名">
  <data type="string">
   <param name="minLength">1</param>
   <param name="maxLength">10</param>
  </data>
 </element>
 <element name="年齢">
  <data type="integer">
   <param name="minInclusive">0</param>
   <param name="maxExclusive">150</param>
  </data>
 </element>
</element>

妥当な XML 文書の一例

<?xml version="1.0"?>
<プロフィール>
 <氏名>真田ゆり子</氏名> <!-- 中身は5文字 -->
 <年齢>18</年齢> <!-- 数値は1-150の範囲内 -->
</プロフィール>

妥当でない XML 文書の一例

<?xml version="1.0"?>
<プロフィール>
 <氏名>寿限無寿限無海砂利水魚</氏名> <!-- 11文字! -->
 <年齢>250</年齢> <!-- 150より上! -->
</プロフィール>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「param要素 @ ぽかぽか RELAX NG 工房」

except 要素

排他法則を記述するための要素

特定の要素/属性名を対象から外したい場合や、特定のデータを排除したい場合は、 except要素を用いて排他法則を明記します。
要素/属性名の排他処理のための anyName要素, nsName要素各要素の子要素として記述します。
data要素の子要素にすることも出来ます。この場合、except要素の中身として、各種のパターンを記述することが可能です。ただし、テキストにそぐわない要素を記述することは出来ません。例えば、element要素, attribute要素は記述出来ません。

属性

この要素に固有な属性はありません。

子ノード

except要素の中身は、nsName要素, name要素, choice要素のみです。

使用例

例 1: 特定の名前を排除する

特定の名前を排除する

例えば、公開情報要素の中にはいかなる要素も複数個入れられる一方、極秘要素と機密要素のみを排除させるようにするには、以下のようにします。

<element name="公開情報">
 <zeroOrMore>
  <element>
   <anyName>
    <except>
     <name>極秘</name>
     <name>機密</name>
    </except>
   </anyName>
   <text/> <!-- いかなる要素においても、中身はテキストとする -->
  </element>
 </zeroOrMore>
</element>

属性名においても、同様に制馭が出来ます。

例 2: 要素の振り分け

要素の振り分け

記入欄要素にはいかなる要素も複数個入れられ、中身にはテキストが記入できるとします。また、記入が無い場合は、記入無し要素(空要素)を一つだけ含むようにしたいとします。この場合、choice要素を用いて、以下のようにスキーマを記述出来ます。

スキーマ(の断片)の例

<element name="記入欄">
 <choice>
  <zeroOrMore>
   <element>
    <anyName>
     <except>
      <name>記入無し</name> <!-- 記入無し 要素は特別扱い -->
     </except>
    </anyName>
    <text/>
   </element>
  </zeroOrMore>
  <element name="記入無し"> <!-- 記入無し 要素はこちらで定義 -->
   <empty/>
  </element>
 </choice>
</element>

妥当な XML 文書(の断片)1

<記入欄>
 <名前>ラーナ=シャルロット</名前>
 <年齢>16</年齢>
 <好きな食べ物>ショートケーキ、パイナップル</好きな食べ物>
</記入欄>

妥当な XML 文書(の断片)2

<記入欄>
 <記入無し/>
</記入欄>

妥当でない XML 文書

<記入欄>
 <name>Y. Imada</name>
 <記入無し/> <!-- 記入無し 要素以外には、何も入れられない !! -->
</記入欄>

例 3: 特定の名前空間に属する名前を排除する

特定の名前空間に属する名前を排除する

例えば、名前空間URI http://www.evil.com/ に属する要素だけを排除し、あとはいかなる要素も入れられるようにするためには、例えば以下のように記述します。

<element name="記入欄">
 <zeroOrMore>
  <element>
   <anyName>
    <except>
     <nsName ns="http://www.evil.com/"/>
    </except>
   </anyName>
   <text/> <!-- いかなる要素においても、中身はテキストとする -->
  </element>
 </zeroOrMore>
</element>

例 4: データの排他処理

データの排他処理

例えば、何らかのデータを扱っている中で、未定義のデータ(例えば undefined や未定義, none)を弾きたい場合には、以下のような記述が考えられます。

<element name="情報">
 <data type="string">
  <except>
   <choice>
    <value>undefined</value>
    <value>未定義</value>
    <value>none</value>
   </choice>
  </except>
 </data>
</element>

あるいは、怪しい記述が含まれているデータ(例えば押売, 強盗, 死を含むもの)を弾くのにも用いることが可能です。ここでは、データ型ライブラリとして W3C XML Schema のデータ型を使います。

<element name="活動内容">
 <data type="string" 
  datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <except>
   <data type="string">
    <param name="pattern">[.\s]*(押売|強盗|死)[.\s]*</param>
   </data>
  </except>
 </data>
</element>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「except要素 @ ぽかぽか RELAX NG 工房」

empty 要素

空の記述を定義する要素

XML文書の要素の中身など、ある箇所において「空の記述」を定義する要素です。
しかし大抵は、XML文書の空要素の定義もしくは属性セットの初期値の定義内で使われることが多いかと思われます。
ルート要素とすることが出来ます。利用価値の是非はともかく、一応可能です。

コンテナやサブコンテナ (XMLなら要素属性値、要素の中身) など様々な定義の中で使うことが出来ます。

grammar 要素の直下には置いてはなりません。

属性

この要素に固有な属性はありません。

子ノード

常に空要素。子ノードを持ちません。

考えてみよう！

その 1: パターン内での empty要素の振舞い

パターン内での empty要素の振舞い

複数の連続する empty要素は、一つの empty要素と見倣されます。
interleave要素, group要素, oneOrMore要素, zeroOrMore要素, optional要素内の子要素に empty要素が含まれていた場合、その empty要素は単に無視されます。ただし、empty要素しか存在しない場合は、そのパターンは、一つの empty要素と見倣されます。
choice要素内の empty要素に関しては、後述します。

その 2: choice要素内

choice要素内

choice要素の子要素が全て empty要素 (あるいはそれと見倣されるもの)であった場合、choice要素自体が一つの一つの empty要素と見倣されます。
choice要素の子要素に、他のパターンに混じって empty要素が存在した場合、「記述無し」という定義が選択肢の中に入ります。例えば、次のような記述を考えてみます。
```
<choice>
 <value>うどん</value>
 <value>そば</value>
 <value>ラーメン</value>
 <empty/>
</choice>
```
この場合、empty要素は無視されず、「うどん」「そば」「ラーメン」という値が記述出来るのに加え、「何も記述しない」パターンをも許してしまいます。とりわけ、必須記法を choice要素で選択させる場合には、気を附けなければなりません。

その 3: element要素内

element要素内

element要素の子要素が empty要素 (と属性宣言のパターン)のみである場合、その element要素で定義される要素は空要素と定義されます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「empty要素 @ ぽかぽか RELAX NG 工房」

notAllowed 要素

記述を不許可に設定する要素

記述を不許可にするための要素です。既にあるパターンの効果を打ち消すのにも使えます。
choice要素を用いた選択肢の「初期値」として使えなくもありませんが、取り扱いには注意が必要です。親要素への効果の波及が著しいため、非常に使いづらい要素の一つとなっております。
notAllowed要素を含んだ構造要素(choice要素など)の振舞いには、注意が必要です。詳しくは後述します。
一応、ルート要素としても記述可能です。そのようにして意味があるかどうかは知りませんが、取り敢えずは出来ます。
パターン中に記述された(もしくは参照先のマクロに含まれた) notAllowed要素は、親要素に対して著しい影響を及ぼします。

grammar 要素の直下には置いてはなりません。

属性

この要素に固有な属性はありません。

子ノード

常に空要素。子ノードを持ちません。

考えてみよう！

その 1: choice要素の中の notAllowed要素

choice要素の中の notAllowed要素

choice要素の子要素の中に一つ以上の notAllowed要素が含まれた場合、notAllowed要素は無視され、その他のパターンのみが適用されます。
ただし、choice要素の中に notAllowed要素もしくは notAllowed要素と見倣される記述 (notAllowed要素を子要素に持つ interleave要素など)のみが存在する場合、その choice要素自体が、一つの notAllowed要素と見倣されます。

その 2:

原則として、連続する notAllowed要素は、一つの notAllowed要素と見倣されます。
notAllowed要素が必然的に適用されるパターンでは、もとのパターンの効果は無視され、全て一つの notAllowed要素に置き換わります。例えば、notAllowed要素を一つ以上子要素に有する attribute要素, group要素, interleave要素, oneOrMore要素がこれに相当します。
zeroOrMore要素, optional要素の子要素に notAllowed要素が存在していた場合、これらのパターン自体が単に無視されます (notAllowed要素には置き換わりません)。
except要素の子要素の中に一つ以上の notAllowed要素が含まれた場合、 except要素そのものの効果が消えます。
notAllowed要素を一つ以上子要素に持つ element要素では、要素宣言そのものが破毀されます (の筈ですが、うまく検証プログラムで処理出来ないこともあります)。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「notAllowed要素 @ ぽかぽか RELAX NG 工房」

DATA

Text Binary

bit 要素

ビットストリームを表すコンテナ

スキーマのルート要素にすることが出来ます。このスキーマを単独で用いる場合、文書インスタンス全体に対応します。

属性

length 属性

長さをビット数で指定できます。省略した場合任意の長さが許されます。

encode 属性

データのエンコードを指定します。

テキストエンコード txt, バイナリエンコード signed, unsigned, ieee754single,ieee754double などを指定できます。
省略された場合は、直近の祖先の enocde 属性が用いられます。それで決まらない場合は txt が指定されたものとして扱われます。

子ノード

子として、複数のコンテナ (byte要素, bit要素) もしくは一つのサブコンテナを持つことができます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。
マッピング定義を行う場合は、value-of 要素を子孫に持ちます。

使用例

例 1: length 属性が指定された場合。

この例では、10 bit 分だけ処理が行われます。

<txt:bit length="10" encode="signed">
  <data type="int"/>
</txt:bit>

例 2: length 属性が指定されていない場合。

この例では、type が int であるため、32 bit 分、処理が行われます。

<txt:bit encode="signed">
  <data type="int"/>
</txt:bit>

例 3: bit 要素の入れ子。

bit 要素が入れ子になっている場合、length 属性が指定されていなければ、直近の祖先で指定された length 属性を元に、処理を行う bit 数が決められます。この例では、singned type のデータを 10 bit、unsigneInt type のデータを 6 bit 処理します。

<txt:bit length="16>
  <txt:bit length="10" encode="signed">
    <data type="int"/>
  </txt:bit>
  <txt:bit encode="unsigned">
    <data type="unsignedInt"/>
  </txt:bit>
</txt:byte>

byte 要素

バイトストリームを表すコンテナ

スキーマのルート要素にすることが出来ます。このスキーマを単独で用いる場合、文書インスタンス全体に対応します。

属性

length 属性

長さをバイト数で指定できます。省略した場合任意の長さが許されます。

encode 属性

データのエンコードを指定します。

テキストエンコード txt, バイナリエンコード signed, unsigned, ieee754single,ieee754double などを指定できます。
省略された場合は、直近の祖先の enocde 属性が用いられます。それで決まらない場合は txt が指定されたものとして扱われます。

子ノード

子として、複数のコンテナ (byte要素, bit要素) もしくは一つのサブコンテナを持つことができます。
interleave要素, optional要素, zeroOrMore要素などを子に持つことも可能です。
マッピング定義を行う場合は、value-of 要素を子孫に持ちます。

line 要素

1行データを定義する要素

データの最後に改行を付加する際に用います。

属性

encode 属性

データのエンコードを指定します。

テキストエンコード txt, バイナリエンコード signed, unsigned, ieee754single,ieee754double などを指定できます。
省略された場合は、直近の祖先の enocde 属性が用いられます。それで決まらない場合は txt が指定されたものとして扱われます。

制約

defineMapping 要素の子孫としてのみ現れることができます。

子ノード

子として、複数のコンテナ (byte要素, bit要素) を持つことができます。

使用例

例 1: line 要素の用いた記述

以下のパターンは、整数値のみが1行に書かれたデータにマッチします。

<txt:line>
  <txt:byte encode="txt">
    <lang:value-of select="iData">
      <data type="int"/>
    </lang:value-of>
  </txt:byte>
</txt:line>

例 2: line 要素を用いない記述

例 1 と同等のパターンを、line 要素を用いずに記述した場合、以下のようになります。改行文字を、直接 value 要素で指定します。

<txt:byte encode="txt">
  <lang:value-of select="iData">
    <data type="int"/>
  </lang:value-of>
</txt:byte>
<txt:byte encode="txt">
  <txt:value type="string">
</txt:value>
</txt:byte>

list 要素

空白区切りのデータ列挙を明示する

空白文字で区切られた一聯の列挙型データは、list要素で明示出来ます。
要素の中身としても、属性の値としても使用出来ます。区切りは通常のスペース, タブ文字, 改行文字などが使えます。当然ですが、全角空白は空白とは見倣されません。
XML では、通常、常に element要素, attribute要素, define要素の子孫でなければなりません。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

separator 属性

区切り文字を表します。

decode : 区切り文字が連続した場合、それらを1つの区切り文字として扱います。
encode : 終端の token の後に、指定した区切り文字を出力しません。

delimiter 属性

区切り文字を表します。

decode : 区切り文字が連続した場合、空データとして扱います。
encode : 終端の token の後に、指定した区切り文字を出力します。

属性の省略

separator 属性が指定された場合と同等の動きをします。その際、区切り文字は、" "、"\t"、"\n"、"\r"となります。

制約

区切り文字に、文字列を指定することはできません。

「A,,B」というように空文字がある際、数値の場合はエラーとして扱います。文字データの場合は、長さ 0 の文字として扱います。

子ノード

value要素, data要素を中身に置くことが出来ます。ただし、text要素など、それ自体に空白を含み得るデータを置くことは出来ません。区切りの関係が不明確になるためです。
XML では element要素, attribute要素を子孫に入れてはいけません。
子要素パターンの出現順位の関係は保たれます(要素の中身, 属性値いずれにも当て嵌まります)。順位不同にしたい場合は、interleave要素, choice要素どを適宜使う必要があります。

使用例

例 1: 地図中での進行順路

地図中での進行順路

ゲームマップなどで宝の在処を指し示したい場合に、入口からどのように進めば何が得られるかをデータ化したい場合があるかも知れません。その場合、空白区切りで一画面毎の順路を記述しておくと便利な場合があるでしょう。以下にスキーマと XML 文書(の断片)の一例を示します。

スキーマ断片の一例

<element name="宝">
 <attribute name="名前"><text/></attribute>
 <list>
  <oneOrMore>
   <choice>
    <value>上</value>
    <value>下</value>
    <value>左</value>
    <value>右</value>
   </choice>
  </oneOrMore>
 </list>
</element>

妥当な XML 文書の断片の一例

<宝 名前="エメラルドロッド">
上 上 左 下 左 上 上 右 下
</宝>

妥当でない XML 文書の一例

<宝 名前="黄金の兜">
上 上 左 下 左 中 上 右 下 <!-- "中" が含まれている -->
</宝>

例 2: 色の列挙

色の列挙

Cascading Style Sheets では、枠線の色指定は空白区切りで列挙します(上, 右, 下, 左の順)。この表記を XML の属性(ここでは色属性とします)で実現させるための一つの方法として、list要素を使うことを考えます。以下の例では、 RGB.datatype は既に定義済 (#RRGGBB のみの形を許す) とします。ついでに、基本的な色 (赤, 青, 黄色)に関しては、名前を使えるとします。

スキーマ断片の一例

<element name="枠線">
 <empty/>
 <attribute name="色">
  <list>
   <oneOrMore>
    <choice>
     <ref name="RGB.datatype"/>
     <value>赤</value>
     <value>青</value>
     <value>黄色</value>
    </choice>
   </oneOrMore>
  </list>
 </attribute>
</element>

妥当な XML 文書断片の例

<枠線色=" #222255 #ab7766 #00a3b1 #ff0022 "/>
<枠線色=" 黄色 #ab7766 赤 "/>

以上の例では、色指定の個数制限は設けられておりません。もう少し複雑な記述をすれば、ある程度の制限を設けることは可能です。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「list要素 @ ぽかぽか RELAX NG 工房」

XML

element 要素

要素を宣言するための要素

文書インスタンスの要素を定義する要素です。
XMLでは文書インスタンス内のルート要素が文書全体に一致します。

スキーマのルート要素にすることが出来ます。このスキーマを単独で用いる場合、文書インスタンス全体に対応します。

属性

name 属性

要素名を指定します。要素名は Qualified name なので、名前空間を考慮する必要があります。
name 属性を記述しない場合は、name要素で指定します。
もしくは、anyName要素を子要素にすることで、すべての要素を許容することが出来ます。その際、except要素を使うことで、適用すべきでない要素名を除去することも可能です。

ns 属性

指定する要素及びその子孫要素のデフォルトの名前空間 URI を指定できます。

xmlns:xxxx 属性

grammar要素と同様、xmlns:xxxx 属性を使用することもできます。

xmlns 属性

element要素をルート要素とする場合は、スキーマ自体の名前空間 (http://relaxng.org/ns/structure/1.0) を宣言しなければなりません。

子ノード

element要素 (及び element要素を子孫に持つ choice要素など) を入れ子にすることで、要素の包含関係を明示することが出来ます。
その他、element要素には、様々な要素を入れることが出来ます。通常は、choice要素, zeroOrMore要素などのパターン制馭要素と共に用いることが多いでしょう。
element要素 (あるいは、element要素を子孫要素に持つ choice要素など) を並べた場合、文書インスタンス中では、element要素の出現順序通りに要素が出現していなければなりません。
(同じ名前空間に属する)同じ要素名の element要素を複数異なる場所に設置することが可能です。これにより、同じ要素の入れ子を定義したり、要素の出現する場所によって異なる中身や属性を定義したりすることが出来ます。

ref 要素を中身にし、マクロを参照することが出来ます。

使用例

例 1:

名前空間 URI http://lena.com に属する p 要素をルート要素として宣言。中身は通常のテキストデータとする。

<?xml version="1.0"?>
<element name="p" ns="http:lena.com" xmlns="http://relaxng.org/ns/structure/1.0">
 <text/>
</element>

例 2:

p 要素を宣言。 p 要素の中身は、 a1, a2 要素が a1, a2 の順で各一つづつ出現しなければならない。

<element name="p">
 <element name="a1"><text/></element>
 <element name="a2"><text/></element>
</element>

例 3:

book 要素を除く任意の要素において、 book 要素が一つだけ出現する。 book 要素の中身はテキスト。

<element>
 <anyName>
  <except><name>book</name></except>
 </anyName>
 <element name="book"><text/></element>
</element>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「element要素 @ ぽかぽか RELAX NG 工房」

attribute 要素

要素の属性を定義する要素

lang や space の属性を定義する場合、名前空間を考慮する必要はありません。
複数の attribute要素を用いることで、一つの要素に複数の属性を定義出来ます。その際、element要素要素と異なり、実際の属性の出現順位は、attribute要素の出現順位に依存しません。つまり、定義さえされていれば、実際には任意の順番で属性を記述出来る、ということです。
element要素直下に記述された場合、その属性は必須属性となります(DTD では、 #REQUIRED の宣言に相当)。任意属性 (DTD で言う #IMPLIED) としたい場合は、optional要素の中に attribute要素を入れる必要があります。
oneOrMore要素, zeroOrMore要素を親要素とすることは可能ですが、同じ属性名を持つ属性を複数書けるようにはなりません。optional要素は普通に使用出来ます。

属性

name 属性

属性名を定義します。element要素と同様、このほかに name要素で定義、もしくは anyName要素を子要素とすることで、任意の名前の属性を入れられるように定義することも可能です。ここで定義される名前は「有修飾名(qualified name)」なので、名前空間を考慮する必要があります。

ns,xmlns:xxxx 属性

grammar要素, element要素と同様、ns 属性や xmlns:xxxx 属性を用いて、局所的に名前空間を変更することが出来ます。
要素に名前空間を指定したとしても、通例属性はローカルなままで用います。この場合 xmlns:xxxx 属性を、attribute要素で定義する必要はありません。

子ノード

子ノードにより、その属性の属性値が定義されます。
text要素を用いるのが一般的ですが、value要素, data要素や choice要素を子孫に持つことが出来ます。
element要素, attribute要素を子孫要素としてはなりません。
当然ですが、ref要素を子孫要素とする場合、その参照先に、上記の禁じられた要素が存在してはなりません。

ref 要素を中身にし、マクロを参照することが出来ます。

使用例

例 1:

item 要素において、 lang 属性と、xlink:href 属性を定義。 lang 属性は任意、 xlink:href 属性は必須とする。いずれも属性値は任意テキストとする。

<element name="p">
 <optional>
  <attribute name="lang">
			
    <text/>
  </attribute>
 </optional>
 <attribute name="xlink:href" xmlns:xlink="http://www.w3.org/1999/xlink">
			
  <text/>
 </attribute>
 <text/> <!-- p要素の中身はテキストとする -->
</element>

例 2:

color 属性を定義。属性値は、 red, blue, yellow いずれかの値を取り得る。

<attribute name="color">
 <choice>
  <value>red</value>
  <value>blue</value>
  <value>yellow</value>
 </choice>
</attribute>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「attribute要素 @ ぽかぽか RELAX NG 工房」

mixed 要素

テキスト(ノード)の混在を許す要素

要素と共に任意の位置にテキストの混在を許したい場合、そのパターンを mixed要素として明示します。いわゆる「インライン要素」を作るのに便利です。

grammar 要素の直下には置いてはなりません。

スキーマのルート要素に用いることが出来ます。ただし、そのスキーマは単独では用いることは出来ず、 externalRef 要素の参照先としてのみ利用できます。

属性

この要素に固有な属性はありません。

子ノード

子ノードを持つことが必須です。
指定が無い場合、子ノードの出現順位や出現回数そのものは保持されます。
子ノードに value要素, data要素を持つことが出来ます。ただし、text要素など、それ自体に空白を含み得るデータを持つことは出来ません。区切りの関係が不明確になるためです。
element要素, attribute要素を子孫に入れてはいけません。
子要素パターンの出現順位の関係は保たれます(要素の中身, 属性値いずれにも当て嵌まります)。順位不同にしたい場合は、interleave要素, choice要素などを適宜使う必要があります。

使用例

例 1:

説明要素の中に、インライン要素として名前, 所属, 場所各要素がこの順番で出現するようにさせるためには、以下のようなスキーマ(の断片)を作成します。実際の文書の例も示します。

スキーマ

<element name="説明">
 <mixed>
  <element name="所属"><text/></element>
  <element name="名前"><text/></element>
  <element name="場所"><text/></element>
 </mixed>
</element>

妥当な文書(の断片)例

<説明>
今日、<所属>テニス部</所属>の<名前>バッツ</名前>は、
 <場所>202号教室</場所>にて会合に参加している。
</説明>

例 2:

interleave要素, zeroOrMore要素などと組み合わせることにより、より高度な表現が可能になります。例えば、a要素と b 要素が任意のテキストを折り混ぜて任意の位置に任意の個数だけ並べられるようにするには、以下のように記述します。参考までに、mixed要素を使わない例も併せて示します。

mixed 要素を使った例

<element name="element">
 <mixed>
  <interleave>
   <zeroOrMore>
    <element name="a"><text/></element>
   </zeroOrMore>
   <zeroOrMore>
    <element name="b"><text/></element>
   </zeroOrMore>
  </interleave>
 </mixed>
</element>

choice 要素を使った例

<element name="element">
 <zeroOrMore>
  <choice>
    <element name="a"><text/></element>
    <element name="b"><text/></element>
    <text/>
  </choice>
 </zeroOrMore>
</element>

上記の例では、choice要素を用いた方がすっきりしたものが出来ます。ただし、「どれかを必須要素としたい」場合などは、choice要素を使うことは出来ません。

例えば、「インライン要素a, b要素があり、a 要素は0個以上、 b 要素は一つだけ必ず出現しなければならない」というパターンを作りたい場合は、 mixed要素と interleave要素を使う必要があるでしょう。以下にスキーマの例を示します。

<element name="element">
 <mixed>
  <interleave>
   <zeroOrMore>
    <element name="a"><text/></element>
   </zeroOrMore>
   <element name="b"><text/></element>
  </interleave>
 </mixed>
</element>

考えてみよう！

その 1:

empty要素, text要素もしくは attribute要素だけを含む mixed要素は、単一の text要素と見倣されます。

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「mixed要素 @ ぽかぽか RELAX NG 工房」

name 要素

要素, 属性の名前を宣言する要素

通常、要素や属性の名前を明示するためには、element要素, attribute要素の name 属性を用います。しかし、name要素を用いても等価な結果が得られます。
name要素を使うと、要素, 属性の名前の決め方を柔軟にすることが出来ます。

注意すべき点

name要素の中身は有修飾名(qname)です。デフォルトの名前空間を持たない要素には、常に接頭辞が必要です。
属性に使う場合は、常に「グローバルな属性」を想定しているため、常に接頭辞が必要になりますし、ローカルな属性の定義にも使えません。ただし、名前空間の宣言を全く行わない場合に限り、接頭辞が不要になります(と言うより、そもそも使えない)。
二つ以上並べて書いてはなりません。ただし、choice要素の子要素に複数記述し、名前の選択をさせることは可能です。
name要素を使った場合、element要素, attribute要素で name 属性を使ってはなりません。

属性

この要素に固有な属性はありません。

使用例

例 1: name要素と name 属性

name要素と name 属性

以下の二つのスキーマ(の断片)は、等価なものと見倣されます。接頭辞の有無には関係ありません。

例1

<element name="庭:植物">
 <text/>
</element>

例2

<element>
 <name>庭:植物</name>
 <text/>
</element>

例 2: 名前に選択肢を設ける

名前に選択肢を設ける

例えば、ルート要素が家屋要素でも田畑要素でも良く、かつこれらの要素の取り得る中身が同一(名前, 場所が書ける)である場合は、以下のようなスキーマが書けるでしょう。

スキーマ例

<?xml version="1.0"?>
<element xmlns="http://relaxng.org/ns/structure/1.0">
 <choice>
  <name>家屋</name>
  <name>田畑</name>
 </choice>
 <element name="名前"><text/></element>
 <element name="場所"><text/></element>
</element>

妥当な XML 文書の例1

<?xml version="1.0"?>
<家屋>
 <名前>牧野啓文宅</名前>
 <場所>山里市五丁目三番地</場所>
</家屋>

妥当な XML 文書の例2

<?xml version="1.0"?>
<田畑>
 <名前>ラベンダー牧場</名前>
 <場所>柏原郡海里町3-2-1</場所>
</田畑>

属性に関して

ns 属性でデフォルトの名前空間が明示されている場合、以下の二つは等価ではありません。名前空間の仕様により、「デフォルトの名前空間に属した属性」を表すことが出来ないためです。

例1

<element name="ゲーム" ns="http://www.sanada.org/">
 <attribute name="対象年齢">
  <text/>
 </attribute>
 <empty/>
</element>

例2

<element name="ゲーム" ns="http://www.sanada.org/">
 <attribute>
  <name>対象年齢</name>
  <text/>
 </attribute>
 <empty/>
</element>

ただし、xmlns:xxxx 属性による宣言がなされている場合、以下の二つは等価です。当然ですが、娯楽:対象年齢属性はグローバル属性になります。

例1

<element name="娯楽:ゲーム" xmlns:娯楽="http://www.sanada.org/">
 <attribute name="娯楽:対象年齢">
  <text/>
 </attribute>
 <empty/>
</element>

例2

<element name="娯楽:ゲーム" xmlns:娯楽="http://www.sanada.org/">
 <attribute>
  <name>娯楽:対象年齢</name>
  <text/>
 </attribute>
 <empty/>
</element>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「name要素 @ ぽかぽか RELAX NG 工房」

anyName 要素

任意の要素/属性の存在を許すための要素

ある特定の要素において、任意の名前を有する要素や属性の存在を許したい場面が存在するかも知れません(例えば、部分的な検証を行いたい場合などがそれに当たります)。そのような場合、その要素/属性の名前を anyName要素として明示します。
name 属性を持たない element要素, attribute要素の子要素として用いられます。逆に言えば、anyName要素を子要素に持つ element要素, attribute要素には、 name 属性を附属させてはいけません。

属性

この要素に固有な属性はありません。

子ノード

anyName要素を空要素にした場合、任意の要素もしくは属性の存在を許すことになります。
except要素を子要素に持つことが出来ます。その場合、except要素内に記述された名前を持つ要素や属性は対象外となります。

使用例

例 1:

自己紹介要素において、いかなる要素を複数個勝手に加えて良い(中身はテキスト)一方で、氏名要素を常に必須要素として記述させたい場合は、以下のようにスキーマを作れるでしょう。

スキーマ

<element name="自己紹介">
 <interleave> <!-- 氏名要素を含め、要素の並び方は順位不同とする。 -->
  <zeroOrMore>
   <element> <!-- 氏名要素以外の任意の要素 -->
    <anyName>
     <except>
      <name>氏名</name>
     </except>
    </anyName>
    <text/>
   </element>
  </zeroOrMore>
  <element name="氏名"><text/></element>
 </interleave>
</element>

正しい XML 文書(の断片)

<自己紹介>
 <氏名>鈴木栄作</氏名> <!-- 氏名は必須要素 -->
 <職業>総理大臣</職業>
 <趣味>スキー、テニス</趣味>
</自己紹介>

間違った XML 文書(の断片)

<自己紹介> <!-- 氏名要素が欠落 -->
 <好物>鰯の丸干し</好物>
 <特技>踊り</特技>
</自己紹介>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「anyName要素 @ ぽかぽか RELAX NG 工房」

nsName 要素

特定の名前空間に属する名前全てを指定する要素

ある特定の名前空間に属するあらゆる種類の要素, 属性名の存在を許可したい場合、その名前指定を nsName要素で明示します。
「あらゆる種類の名前」という意味で、anyName要素と類似の働きをします。しかし anyName要素が名前空間の内容に関わらず全ての名前を許可するのに対し、nsName要素では名前空間が特定されるという違いがあります。
(当然と言えば当然ですが) nsName要素を子要素に持つ element要素, attribute要素では、 name 属性は使えません。

属性

ns 属性

名前空間の明示は ns 属性で行います。スキーマ自体を接頭辞無しで用いている場合は、xmlns 属性は使えません(ただし、スキーマ自体の要素や属性に接頭辞が附属されている場合を除く)。
ns 属性が省略された場合は、先祖要素に記述された ns 属性の値が適用されます。

子ノード

anyName要素と同様、except要素を用いた排他パターンのみが許されます。except要素と name要素を使うことにより、特定の要素, 属性名を対象から除くことが出来ます。

使用例

例 1: 特定の名前空間に属する任意の属性を記述する

特定の名前空間に属する任意の属性を記述する

名前空間 http://www.garden.co.jp/ に属する任意の属性を埋め込みたい場合、以下のような記述が考えられます。

<element name="喫茶店">
 <zeroOrMore>
  <attribute>
   <nsName ns="http://www.garden.co.jp/"/>
   <text/>
  </attribute>
 </zeroOrMore>

 …

</element>

以上のスキーマで、以下の XML 文書(の断片)は妥当なものとなります。

<喫茶店 庭:種類="ローズガーデン" 庭:広さ="10m^2"
    xmlns:庭="http://www.garden.co.jp/">
 …
</喫茶店>

尚、複数の種類の名前空間を許したい場合は、異る ns 属性値を有する nsName要素を複数並べて書きます。以下に例を示します。

<element name="喫茶店">
 <zeroOrMore>
  <attribute>
   <nsName ns="http://www.garden.co.jp/"/>
   <nsName ns="http://www.address.co.jp/"/>
   <text/>
  </attribute>
 </zeroOrMore>

 …

</element>

例 2: 名前に制限を設ける

名前に制限を設ける

except要素を子要素に置いて、特定の名前を排除することを考えてみます。例1 のスキーマを、以下のように変えてみたとします。

<element name="喫茶店">
 <zeroOrMore>
  <attribute>
   <nsName ns="http://www.garden.co.jp/">
    <except>
     <name>広さ</name>
    </except>
   </nsName>
   <text/>
  </attribute>
 </zeroOrMore>

 …

</element>

このようにした場合、以下の記述は妥当でなくなります。庭:広さ属性の記述が許されなくなっているためです。

<喫茶店 庭:種類="ローズガーデン" 庭:広さ="10m^2"
    xmlns:庭="http://www.garden.co.jp/">
 …

例 3: 特定の名前空間のみを排除する

特定の名前空間のみを排除する

except要素の中に nsName要素を入れることで、特定の名前空間に属する名前を排除出来ます。例えば、名前空間 http://bad.com/ に属する要素のみを弾き、それ以外は全て許可したい場合は、以下のような記述が出来るでしょう。

<element name="例">
 <zeroOrMore>
  <element>
   <anyName>
    <except><nsName ns="http://bad.com/"/></except>
   </anyName>
  </element>
 </zeroOrMore>
</element>

参考文献

James Clark and Makoto Murata, ISO/IEC FDIS 19757-2 Document Schema Definition Language (DSDL) -- Part 2: Regular-grammar-based validation -- RELAX NG
古林寛, 「nsName要素 @ ぽかぽか RELAX NG 工房」

LANG

function 要素

関数を定義する要素

関数を定義する際に用います。
マッピング処理を行う関数の場合には、defineMapping 要素を子に指定します。
関数宣言のみにも利用することができます。その際は、defineMapping 要素を子に持ちません。

属性

name 属性

関数名を指定します。

制約

defineFunctions 要素の子としてのみ現れることができます。

子ノード

arg 要素、return 要素、exception 要素（java 名前空間のみ）defineMapping 要素、defineVariables 要素を子に持ちます。

使用例

例 1: マッピング処理を行う場合

<lang:function name="decodeData">
  <lang:arg type="char*" name="ums__buffer" direction="in"/>
  <lang:arg type="int"    name="ums__bitlen" direction="in"/>
  <lang:return type="void"/>

  <defineVariables>
    <lang:var type="int" name="iData"/>
  </defineVariables>
  <defineMapping direction="decode" xmlns:txt="http://ums.isas.jaxa.jp/0.4/dat">
    <txt:list encode="txt">
      <txt:data type="token"/>
      <lang:value-of select="iData">
        <data type="int"/>
      </lang:value-of>
      <lang:callFunction expr="setIntValue( iData );"/>
    </txt:list>
  </defineMapping>
</java:function>

例 1: 関数宣言のみの場合

<lang:function name="setIntValue">
  <lang:arg type="int" name="iData" direction="in"/>
  <lang:return type="void"/>
<lang:function>

arg 要素

関数の引数を指定する要素

関数の引数を定義する際に用います。
引数が複数ある場合は、複数定義してください。

属性

type 属性

引数の型（プリミティブ型）を指定します。

class 属性

引数の型（クラス型）を指定します。現在、class 属性を指定可能なのは、java の名前空間のみです。

name 属性

引数名を指定します。

direction 属性

引数の方向を指定します。in、out、inout 以外の値が指定された場合、エラーとなります。

in : 入力引数です。引数の値を参照する場合に指定します。
out : 出力引数です。引数の値を更新する場合に指定します。
inout : 入出力引数です。引数の値を参照し、値を更新する場合に指定します。

制約

function 要素の子としてのみ現れることができます。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<lang:function name="setValue">
  <lang:arg type="int" name="iData" direction="in"/>
  <lang:arg type="unsigned int" name="uiData" direction="in"/>
  <lang:return type="void"/>
</lang:function>

return 要素

関数の戻り値を指定する要素

関数の戻り値を指定する際に用います。

属性

type 属性

関数の戻り値の型を指定します。

制約

function 要素の子としてのみ現れることができます。
function 要素内に、複数定義することはできません。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<java:function scope="abstract" name="setIntValue">
  <java:arg class="int" name="iData" direction="in"/>
  <ava:return type="void"/>
</java:function>

var 要素

変数を定義する要素

変数を宣言する際に用います。

属性

type 属性

変数の型（プリミティブ型）を指定します。

class 属性

変数の型（クラス型）を指定します。現在、class 属性を指定可能なのは、java の名前空間のみです。

name 属性

変数名を指定します。

制約

defineVariables 要素、struct 要素（名前空間が clng の場合のみ）の子としてのみ現れることができます。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<defineVariables>
  <lang:var type="int" name="iData"/>
</defineVariables>

array 要素

配列を定義する要素

配列を定義する際に用います。

属性

size 属性

配列サイズを指定します。

制約

defineVariables 要素、struct 要素（名前空間が clng の場合のみ）の子としてのみ現れることができます。

子ノード

var 要素を子に持ちます。

使用例

例 1:

<defineVariables>
  <lang:array size="4096">
    <lang:var type="int" name="iData"/>
  </lang:array>
</defineVariables>

value-of 要素

変数を表すコンテナ

属性

select 属性

変数アクセスの方法 (C 言語で言うところの左辺値) を指定します。必須です。

制約

Mapping definition の以下の位置のみに現れることができます。

- lang:value-of - lang:data -
- lang:value-of - lang:value -
- dat:container - lang:value-of - ums:data -
- dat:container - lang:value-of - ums:value -

ただし、ここで dat:container は dat:byte, dat:bit, rng:element, rng:attribute などを示しています。以下は obsolete です。

- lang:value-of - dat:container - ums:data -
- lang:value-of - dat:container - ums:value -

子ノード

子にサブコンテナが一つだけ必要です（上記の制約を参照）。

使用例

例 1: mapping の例 (proposal for v0.4)

mapping の例 (proposal for v0.4)

以下は XML-XML syntax での mapping defition 中のパターンの例です。

<bin:byte length="1">
  <lang:value-of select="var">
    <data type="int"/>
  </lang:value-of>
</bin:byte>

このパターンは双方向 - つまり encode と decode の両方に使うことができます。 decode では、変数 var に値が読み込まれ encode では、変数 var に値が書き出されます。

これを XML-language syntax に書き直すと以下のようになります。まず、decode の例。

<bin:byte length="1">
  var = <data type="int"/>;
</bin:byte>

また、対応する encode のパターンは以下になります。

<bin:byte length="1">
  <data type="int"/> = var;
</bin:byte>

XML-language syntax の方が若干コンパクトです。また、プログラマには馴染みやすいかもしれません。一方、mapping definition を XSL の処理する場合、 XML-XML syntax の方が取り扱いやすいです。

謝罪

整備状況が悪くすいません(-KM-)。

callFunction 要素

関数呼び出しを指定する要素

関数を呼び出す際に用います。

属性

expr 属性

関数呼び出しを指定します。属性に指定されたそのままの形で、生成ソースコードに出力されます。

制約

defineMapping 要素の子孫としてのみ現れることができます。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<lang:callFunction expr="setValue( iData );"/>

synchronized 要素

同期を取る処理を指定する要素

処理の同期をとりたい場合に用います。
制御構造の処理において、"状態"を分岐させた際、関数呼び出しやデータの入出力の同期をとりたい場合に使用する要素です。すなわち、synchronized 要素を用いた際は、"状態"が1つである必要があります。

属性

この要素に固有な属性はありません。

制約

defineMapping 要素の子孫としてのみ現れることができます。

子ノード

callFunction 要素、value-of 要素を子に持つコンテナ要素を子に持ちます。

使用例

例 1: 関数呼び出しの同期をとる例

以下の例では、nextData() を実行する前に、他に分岐している"状態"がないことを確認します。

<lang:synchronized>
  <lang:callFunction expr="nextData();"/>
</lang:synchronized>

C

struct 要素

C言語の構造体を定義する要素

構造体を定義する際に用います。

属性

name 属性

構造体名を指定します。

制約

start 要素の子としてのみ現れることができます。

子ノード

複数の array 要素、var 要素を持つことができます。

使用例

例 1:

<clng:struct name="Record">
  <clng:array size="4096">
    <clng:var type="char" name="strData"/>
  </clng:array>
  <clng:var type="int32_t" name="iData"/>
  <clng:var type="uint32_t" name="uiData"/>
</clng:struct>

Java

class 要素

Java のクラスを定義する要素

クラスを定義する際に用います。
class 要素の子孫に定義し、inner class とすることもできます。
grammar 要素の直下には置いてはなりません。

属性

abstract 属性

抽象クラスであることを指定します。

name 属性

クラス名を指定します。

extends 属性

継承するクラス名を指定します。

制約

特にありません。

子ノード

implements 要素、defineFunctions 要素、defineVariables 要素を子に持ちます。

使用例

例 1:

<ava:class scope="abstract" name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
  <defineFunctions>
  <java:function scope="abstract" name="setStringValue">
    ...
  </java:function>
  <java:function scope="abstract" name="setIntValue">
    ...
  </java:function>
  </defineFunctions>
  <defineFunctions>
  <java:function name="decodeData">
    ...
    <defineVariables>
    ...
    </defineVariables>
    <defineMapping direction="decode" xmlns:txt="http://ums.isas.jaxa.jp/0.4/dat">
    ...
    </defineMapping>
  </java:function>
  <java:function name="encodeData">
    ...
    <defineVariables>
    ...
    </defineVariables>
    <defineMapping direction="encode" xmlns:txt="http://ums.isas.jaxa.jp/0.4/dat">
    ...
    </defineMapping>
  </java:function>
  </defineFunctions>
</java:class>

implements 要素

interface の実装を指定する要素

実装する interface を指定する際に用います。
intervace を複数実装する場合は、この要素を複数指定してください。

属性

name 属性

interface 名を設定してください。

制約

class 要素の子としてのみ現れることができます。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<java:class name="Sample" extends="Data" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
  <java:implements name="DataInterface"/>
  <java:implements name="DataInterface2"/>
  ...
</java:class>

exception 要素

例外情報を定義する要素

例外情報を定義する際に用います。

属性

type 属性

例外クラスを指定します。

制約

function 要素の子としてのみ現れることができます。
function 要素内で、複数指定することはできません。

子ノード

常に空要素です。子ノードを持ちません。

使用例

例 1:

<java:function scope="abstract" name="setIntValue">
  <java:arg class="int" name="iData" direction="in"/>
  <ava:return type="void"/>
  <ava:exception type="UMSException"/>
</java:function>

umsCodeGenerator

English

umsCodeGenerator とは？

umsCodeGenerator は、mappingSchema の処理系です。 mapping definition を入力として、 UMS の定義に従って書かれたデータとプログラミング言語とのマッピングを行い、データをencode／decodeするためのソースコードを生成します。

このツールは、 mappingSchema の文法体系を曖昧さなく策定する補助として UMS group 自身が開発を行っています。 mappingSchema の文法は、このツールの進化とともに、より汎用でシンプルなものに成長してきました。

umsCodeGenerator の処理系の全体像

Note

以前は umsCodeGenerator と tableTools が並存しており、それぞれで実現できる機能が異なっていましたが、 umsCodeGenerator の version 0.4 で双方の機能が統合されました。 UMS group 自身で作成してきた処理系の経緯は'Brief History' に書かれています。

対象とするデータ構造

tableToolsは、その名のとおり「テーブル構造のデータ」を扱うことを対象としています。具体的には、テキストでテーブル構造を表す形式として、次のような","（カンマ）を区切り文字とした CSV構造が広く利用されています。

csvdata1,11,1.2345

また、XMLでテーブル構造を表すと、例えば次のようになるでしょう。

<Record>
　<strData>xmldata1</strData>
　<intData>11</intData>
　<doubleData>1.2345</doubleData>
</Record>

以上のように、非常にシンプルな構造ですが、データ保存／交換など、多くの場面で利用されています。 tableToolsは、こうしたテーブル構造のデータと、各種プログラミング言語とのマッピング（将来的には、データ構造同士のマッピング）を行うことで、システム開発者が新たにプログラムを実装する際の負荷を軽減し、システム全体で開発効率の向上をはかることを目標としています。

データ−プログラミング言語間のマッピング

現在サポートされているマッピングは以下のとおりです。

	Java	C	C++	Perl
Text	○	○	--	--
Binary	○	○	--	--
XML	--	--	--	--

上のマトリックスにおいて、「○」になっているものが、マッピングがサポートされている組み合わせであることを示します。また、「○」とある組み合わせは、双方向（decode：データ→プログラミング言語、 encode：プログラミング言語→データ）の変換を行うことが可能です。

利用可能なコンテナ−シーケンシャルデータ

Mapping definition で、利用可能な要素のうちデータの空間に含まれるもの (コンテナ) は次のとおりです。

Text, Binary 文書

byte
bit

XML 文書

−

共通

list

利用可能なコンテナ−プログラミング言語

プロトタイプ宣言では以下が利用可能です。

Java: class / function / arg / return / exception / array / var
C: package / function / arg / return / struct / array / var
C++: −
Perl: −

また、マッピングでは以下の利用可能なコンテナが言語によらず利用可能です。今のところ言語固有なコンテナは実装されていません。

共通

value-of
callFunction

利用可能なコンテナ−共通部分

データ及び言語側から、共通に利用可能なコンテナは次のとおりです。

data
value (現バージョンでは、シーケンシャルデータ側のみ利用可能)

encodingLibrary

umsCodeGenerator では、以下の encode および W3C datatype のサブセットをサポートするライブラリ (encodingLibrary) がバンドルされています。

encode	W3C datatype	Language
encode	W3C datatype	Java	C	C++	Perl
txt	string	String	char *	--	--
	token	String	char *	--	--
	byte	byte	int8_t	--	--
	short	short	int16_t	--	--
	int	int	int32_t	--	--
	long	long	int64_t	--	--
	unsignedByte	short	uint32_t	--	--
	unsignedShort	int	uint32_t	--	--
	unsignedInt	long	uint32_t	--	--
	unsignedLong	BigInteger	uint32_t	--	--
	double	double	double	--	--
signed	byte	byte	int8_t	--	--
	short	short	int16_t	--	--
	int	int	int32_t	--	--
	long	long	int64_t	--	--
unsigned	unsignedByte	short	uint32_t	--	--
	unsignedShort	int	uint32_t	--	--
	unsignedInt	long	uint32_t	--	--
	unsignedLong	BigInteger	uint32_t	--	--
ieee754double	float	float	float	--	--
ieee754double	double	double	double	--	--

サンプルプログラム

サンプルプログラムやツールのソースコードは以下の標準に従うよう配慮しています。

JAVA: JAVA2 1.4
C言語: ISO9899 (C99)

umsCodeGenerator のインストール

English

必要なソフトウェア

umsCodeGenerator を使うためには、以下のソフトウェアが必要です。

Java 2 Platform, Standard Edition (J2SE)バージョン 1.4 以降
Java 実行環境。環境変数 JAVA_HOME を設定し、環境変数 PATH に $JAVA_HOME/bin を追加して下さい。

また、umsCodeGenerator には以下のソフトウェアが含まれています。これらについては、環境変数の設定は必要ありません。

Apache Antバージョン 1.6.5
Java ベースのソフトウェア build ツール。
msv
RELAX NG、RELAX Namespace、RELAX Core、TREX、XML DTDs、XML Schema Part 1のサブセットに対応したスキーマ検証ツール。
jing
RELAX NG に対応したスキーマ検証用ツール。
trang
スキーマコンバータ。
Xalan-Java Apache XML Project で開発されている XSLT プロセッサ。

インストール

以下のコマンドで、ダウンロードしたファイルを任意の場所（インストール先のディレクトリになります）に展開して下さい。 umsCodeGenerator/yyyymmddvv というディレクトリが作成されます。

$ tar zxvf umsCodeGenerator-yyyymmddvv.tar.gz

umsCodeGenerator/yyyymmddvv 配下に環境変数設定用シェルスクリプト（setup.sh と setup_cygwin.sh）を同梱しています。ご利用の環境に応じて、環境変数設定用シェルスクリプトを編集してください。以下のコマンドで、編集されました環境変数設定用シェルスクリプトを使用して、環境変数を設定することができます。

$ source setup.sh

以下のコマンドで、C Compiler を指定してください。

$ export CC="gcc -std=c99 -g"

以下のコマンドを実行すると、umsCodeGenerator が build されます。

$ cd $TABLETOOLS_HOME
$ ant

以下のコマンドで、サンプルが正常に動作するかチェックできます。
途中、実行ログ中にエラーメッセージが出力されますが、異常ケースの試験のためです。サンプルが全て正常に動作すると、実行ログの最後に "BUILD SUCCESSFUL" と表示されます。

$ ant test

ライセンス

Copyright 2005 Universal Mapping Schema group and ISAS/JAXA

Apache License Version 2.0（「本ライセンス」）に基づいてライセンスされます。あなたがこのファイルを使用するためには、本ライセンスに従わなければなりません。本ライセンスのコピーは下記の場所から入手できます。

http://www.apache.org/licenses/LICENSE-2.0

適用される法律または書面での同意によって命じられない限り、本ライセンスに基づいて頒布されるソフトウェアは、明示黙示を問わず、いかなる保証も条件もなしに「現状のまま」頒布されます。本ライセンスでの権利と制限を規定した文言については、本ライセンスを参照してください。

umsCodeGenerator の使い方

umsCodeGenerator のインストールを完了してください。
環境変数 UMS_THREAD に、"true" または "false" を設定します。
制御構造を含むデータを処理する場合は "true" を設定してください。制御構造を含まないデータを処理する場合は "true" でも "false" でもかまいません。
$ export UMS_THREAD="true"
または
$ export UMS_THREAD="false"
C 言語版は、以下のコマンドを実行します。
$ txt2clng ums_file -x|-l [output_directory] [-d]
Java 言語版は、以下のコマンドを実行します。
$ txt2java ums_file -x|-l [output_directory] [-d]

実行オプション

オプション	説明
ums_file	入力 UMS ファイルを指定します。
-x	XML syntax の UMS ファイルを元にソースコードを生成します。
-l	Language syntax の UMS ファイルを元にソースコードを生成します。
output_directory	生成ソースコードの出力ディレクトリを指定します。このオプションを省略した場合は、カレントディレクトリに生成ソースが出力されます。
-d	デバッグ情報を出力するソースコードを生成します。

チュートリアル

はじめに

umsCodeGenerator を用いたプログラム作成の流れを説明するために、ここでは簡単なサンプルを示します。このサンプルでは、 CSV データについて以下のステップで処理を行います。

読み込み：外部からデータを読み込み、umsCodeGenerator で生成されたデコード関数へデータを渡します。
デコード：デコード関数が mapping definition に従い、データをプログラム変数へ格納します。
エンコード：エンコード関数が mapping definition に従い、プログラム変数をデータへ格納します。
書き込み： umsCodeGenerator で生成されたエンコード関数からデータを受け取り、外部へデータを書き出します。

2番目と3番目のステップが umsCodeGenerator によって生成されたソースコードが処理する部分です。その他の部分は普通にプログラムを作成します。

チュートリアルを開始するまでに、umsCodeGenerator のインストールを完了しておいてください。

なお、以降で作成するサンプルは umsCodeGenerator/yyyymmddvv/sample/tutorial に含まれています。このディレクトリには、Java 版の XML syntax、Language syntax、C 版の XML syntax、Language syntax のサンプルが含まれています。

1. 入力データの作成

入力データと出力データの書式はどちらも同じで、"," を区切り文字とした CSV 形式とします。以下のデータを "sample.csv" という名前でファイルに保存してください。

A,100,1.1
B,200,2.2
C,300,3.3

今回、 mappingSchema で定義するデータの単位は、各行単位にします(ファイル全体を定義することもできます)。行の切り出しは外付けで処理し(ステップ 1、4)、各行の処理を mappingSchema で定義する(ステップ 2、3)ことにします。

2. mapping definition の作成

任意のエディタで mapping definition を作成します。 mapping definition は、XML syntax、Language syntax、C 版、Java 版ともに以下の記述が必要になります。 2.1 以降では、この記述に追記していく形で、Java 版の XML syntax の mapping definition を作成していきます。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4/dat" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
    :
   </start>
</grammar>

Note

XML syntax の mapping definition は XML 文書 です。そこで、XMLエディタを用いると良いでしょう。 Emacs + nxml-modeが推奨されます。

2.1 クラス名を決める

デコード・エンコード関数を持つクラス名を決めます。今回は、"Sample" というクラス名を用います。 (この定義は、C 言語版では不要です。) ソースコードでは以下のように表せます。

class Sample {
  :
}

これを、 mapping definition の XML 形式に書き直すと以下になります。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4/dat" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
    <java:class name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
      :
    </java:class>
  </start>
</grammar>

Warning

mapping definition において、クラス名、変数名、関数名は自由につけることができます。ただし、"ums"、"UMS" から始まる識別子は、umsCodeGenerator など mappingSchema の処理系で用いるために予約されており、使用できません。

2.2 エンコード関数、デコード関数の名前を決める

デコード処理、エンコード処理を行う関数の名前を決めます。今回は、デコード処理を行う関数を"decode"、エンコード処理を行う関数を"encode"という名前にします。

次に、エンコード関数、デコード関数のインターフェースを決めます。これらの関数のインターフェース(引数の型、引数の名前)は、umsCodeGenerator で以下のように固定です ( mappingSchema の決まりではありません)。

言語	関数種別	インターフェース
C言語	デコード関数	/** * デコード処理を行う。 * * @param ums__buffer 入力データ格納バッファ * @param ums__bitlen 入力データ長(bit) * ※入力データそのもののデータであり、入力格納バッファのサイズではない。 * @param ums__ex 例外情報 * @return デコードデータサイズ(bit) / ums__bitlen_t decode( ums__bitdata_t ums__buffer, ums__bitlen_t ums__bitlen, ums__exception_t *ums__ex )
	エンコード関数	/** * エンコード処理を行う。 * * @param ums__buffer 出力データ格納バッファ * @param ums__bitlen 出力データ格納バッファの長さ(bit) * @param ums__ex 例外情報 * @return エンコードデータサイズ(bit) / ums__bitlen_t encode( ums__bitdata_t ums__buffer, ums__bitlen_t ums__bitlen, ums__exception_t *ums__ex )
Java	デコード関数	/** * デコード処理を行う。 * * @param ums__buffer 入力データ格納バッファ * @param ums__bitlen 入力データ長(bit) * ※入力データそのもののデータであり、入力格納バッファのサイズではない。 * @return デコードデータサイズ(bit) * @exception UMSException デコード処理エラー */ int decode( byte[] ums__buffer, int ums__bitlen ) throws UMSException
	エンコード関数	/** * エンコード処理を行う。 * * @param ums__buffer 出力データ格納バッファ * @param ums__bitlen 出力データ格納バッファの長さ(bit) * @return エンコードデータサイズ(bit) * @exception UMSException エンコード処理エラー */ int encode( byte[] ums__buffer, int ums__bitlen ) throws UMSException

ソースコードでは以下のように表すことができます。

class Sample {
    :
  int decode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
    :
  }

  int encode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
    :
  }
}

これを、 mapping definition の XML 形式に書き直すと以下になります。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>

    <java:class name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
      :
      <defineFunctions>
        <java:function name="decode">
          <java:arg       type="byte[]" name="ums__buffer" direction="in"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>
            :
        </java:function>

        <java:function name="encode">
          <java:arg       type="byte[]" name="ums__buffer" direction="out"/>
          <java:arg       type="int"  name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>
            :
        </java:function>

      </defineFunctions>
    </java:class>
  </start>
</grammar>

2.3 データ構造の定義

以下のデータについて、データ構造を mappingSchema の文法に沿った XML 形式で定義します。

A,100,1.1

以下の定義は、セパレータ "," で区切られたリスト形式で、順に"トークン型"、"整数型"、"浮動小数点型"のデータ構造であることを示しています。

<byte>
  <list separator=",">
    <data type="token"/>
    <data type="int"/>
    <data type="double"/>
  </list>
</byte>

2.4 プログラミング言語の処理の定義

次に、プログラミング言語の処理を決めます。ここでは、処理対象のデータ全てを変数に保持する処理を採用します。そこで、これを保持するための変数を用意することにします。ソースコードでは以下のように表せます。

class Sample {

  String sData;
  int    iData;
  double dData;
 
  int decode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
    :
  }

  int encode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
    :
  }
}

これを、 mappingSchema の XML 形式に書き直すと以下になります。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>

    <java:class name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">

      <defineVariables>
        <java:var class="String" name="sData"/>
        <java:var type="int"     name="iData"/>
        <java:var type="double"  name="dData"/>
      </defineVariables>

      <defineFunctions>
        <java:function name="decode">
          <java:arg       type="byte[]" name="ums__buffer" direction="in"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>
            :
        </java:function>

        <java:function name="encode">
          <java:arg       type="byte[]" name="ums__buffer" direction="out"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>
            :
        </java:function>

      </defineFunctions>
    </java:class>
  </start>
</grammar>

2.5 データ構造と言語での処理の対応の定義

次に、データ構造と、プログラミング言語の処理の対応を定義します。ここでは、データを順に変数と対応させます。ソースコードでは以下のように表せます。

class Sample {

  String sData;
  int    iData;
  double dData;
 
  int decode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
      :
    sData = ... ; // 1項目目のデコード
      :
    iData = ... ; // 2項目目のデコード
      :
    dData = ... ; // 3項目目のデコード
      :
  }

  int encode( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
      :
    ... = sData ; // 1項目目のエンコード
      :
    ... = iData ; // 2項目目のエンコード
      :
    ... = dData ; // 3項目目のエンコード
      :
  }
}

これを、 mapping definition の XML 形式に書き直すと以下になります。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4" datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>

    <java:class name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">

      <defineVariables>
        <java:var class="String" name="sData"/>
        <java:var type="int"     name="iData"/>
        <java:var type="double"  name="dData"/>
      </defineVariables>

      <defineFunctions>
        <java:function name="decode">
          <java:arg       type="byte[]" name="ums__buffer" direction="in"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>

          <defineMapping direction="decode">
            <dat:byte encode="txt" xmlns:dat="http://ums.isas.jaxa.jp/0.4/dat">
              <dat:list separator=",">
                <java:value-of select="sData">
                  <data type="token"/>
                </java:value-of>
                <java:value-of select="iData">
                  <data type="int"/>
                </java:value-of>
                <java:value-of select="dData">
                  <data type="double"/>
                </java:value-of>
              </dat:list>
            </dat:byte>
          </defineMapping>
        </java:function>

        <java:function name="encode">
          <java:arg       type="byte[]" name="ums__buffer" direction="out"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="int"/>
          <java:exception type="UMSException"/>

          <defineMapping direction="encode">
            <dat:byte encode="txt" xmlns:dat="http://ums.isas.jaxa.jp/0.4/dat">
              <dat:list separator=",">
                <java:value-of select="sData">
                  <data type="token"/>
                </java:value-of>
                <java:value-of select="iData">
                  <data type="int"/>
                </java:value-of>
                <java:value-of select="dData">
                  <data type="double"/>
                </java:value-of>
              </dat:list>
            </dat:byte>
          </defineMapping>
        </java:function>

      </defineFunctions>
    </java:class>
  </start>
</grammar>

以上で mapping definition の作成は終了です。この mapping definition を、Sample.ums という名前でファイルに保存してください。

3. その他のソースコードの作成

デコード関数、エンコード関数以外のソースコードを通常の方法で作成します。ここでは、以下の処理を行う main メソッドを作成します。

入力データをファイルから読み込み、バッファに格納する。
入力バッファの内容を表示する。
デコードメソッドを呼び出す。
エンコードメソッドを呼び出す。
出力バッファの内容を表示する。

3.1 デコード関数・エンコード関数使用時に必要な処理

デコード関数、エンコード関数を使用するにあたって、次の処理を行う必要があります。

ライブラリクラスの include(C 言語) / import(java)
初期化関数の呼び出し
終了関数の呼び出し

各プログラミング言語において、ライブラリ、初期化関数、終了関数は、それぞれ以下のようになります。

言語	ライブラリ	初期化関数	終了関数
C言語	ums.h	tableTools_init()	tableTools_end()
Java	jp.jaxa.isas.ums.runtime.*	UMSLibrary.tableTools_init()	UMSLibrary.tableTools_end()

main 関数は以下のようになります。

import java.io.*;
import jp.jaxa.isas.ums.runtime.*;

class Main {

  private static final int BUFFER_SIZE = 4096;

  public static void main( String[] args ) {

    String inString     = null;
    byte[] inBuffer     = null;
    int    inBitlen     = 0;
    int    decodeBitlen = 0;

    byte[] outBuffer    = new byte[BUFFER_SIZE];
    int    outBitlen    = 0;
    int    encodeBitlen = 0;

    BufferedReader br   = null;

    UMSLibrary.tableTools_init();

    try {

      Sample sample = new Sample();
      br = new BufferedReader( new FileReader( args[0] ) );

      while ( ( inString = br.readLine() ) != null ) {

        inBitlen = inString.length() * 8;
        inBuffer = inString.getBytes( "US-ASCII" );
        System.out.println(
            "input(" + inBitlen/8 + "*8+" + inBitlen%8 + "):<" + inString + ">" );

        /* call decode method */
        decodeBitlen = sample.decode( inBuffer, inBitlen );

        outBitlen = BUFFER_SIZE * 8;

        /* call encode method */
        encodeBitlen = sample.encode( outBuffer, outBitlen );

        String outString = new String( outBuffer, 0, encodeBitlen/8, "US-ASCII");
        System.out.println(
            "output(" + encodeBitlen/8 + "*8+" + encodeBitlen%8 + "):<" + outString.trim() + ">" );
      }

    } catch ( IOException ex ) {
      ex.printStackTrace( System.err );

    } catch ( Throwable th ) {
      th.printStackTrace( System.err );

    } finally {
      try {
        if ( br != null ) {
          br.close();
        }
      } catch ( Exception ex ) {}
    }

    UMSLibrary.tableTools_end();
  }
}

3.2 例外機構の使い方

エンコード関数・デコード関数は、データが定義にマッチしなかった場合などに例外を発生します。例外機構を使用するにあたって、次の処理を行う必要があります。

ライブラリクラスの include(C 言語) / import(java)
例外情報保持変数の宣言(C言語のみ)
例外情報初期化関数の呼び出し(C言語のみ)
例外情報の出力

各プログラミング言語において、ライブラリ、初期化関数、終了関数は、それぞれ以下のようになります。

言語	ライブラリ	例外情報保持変数型	例外情報初期化関数	例外情報出力関数
C言語	umsException.h	ums__exception_t	ums__exception_init	ums__exception_print
Java	jp.jaxa.isas.ums.runtime.UMSException	不要	不要	print

main 関数は以下のようになります。

import java.io.*;
import jp.jaxa.isas.ums.runtime.*;

class Main {

  private static final int BUFFER_SIZE = 4096;

  public static void main( String[] args ) {

    String inString     = null;
    byte[] inBuffer     = null;
    int    inBitlen     = 0;
    int    decodeBitlen = 0;

    byte[] outBuffer    = new byte[BUFFER_SIZE];
    int    outBitlen    = 0;
    int    encodeBitlen = 0;

    BufferedReader br   = null;

    UMSLibrary.tableTools_init();

    try {

      Sample sample = new Sample();
      br = new BufferedReader( new FileReader( args[0] ) );

      while ( ( inString = br.readLine() ) != null ) {

        inBitlen = inString.length() * 8;
        inBuffer = inString.getBytes( "US-ASCII" );
        System.out.println(
            "input(" + inBitlen/8 + "*8+" + inBitlen%8 + "):<" + inString + ">" );

        /* call decode method */
        decodeBitlen = sample.decode( inBuffer, inBitlen );

        outBitlen = BUFFER_SIZE * 8;

        /* call encode method */
        encodeBitlen = sample.encode( outBuffer, outBitlen );

        String outString = new String( outBuffer, 0, encodeBitlen/8, "US-ASCII");
        System.out.println(
            "output(" + encodeBitlen/8 + "*8+" + encodeBitlen%8 + "):<" + outString.trim() + ">" );
      }

    } catch ( UMSException ex ) {
      ex.print( outBuffer, outBitlen );
      ex.printStackTrace( System.err );

    } catch ( IOException ex ) {
      ex.printStackTrace( System.err );

    } catch ( Throwable th ) {
      th.printStackTrace( System.err );

    } finally {
      try {
        if ( br != null ) {
          br.close();
        }
      } catch ( Exception ex ) {}
    }

    UMSLibrary.tableTools_end();
  }
}

上記の main メソッドを、"Main.java" という名前で保存してください。

4. umsCodeGenerator の実行

mapping definition からソースコードを生成するため、以下のコマンドで umsCodeGenerator を実行してください。カレントディレクトリに、"Sample.java" というファイルが生成されます。

$ txt2java -x Sample.ums

Warning

この時、mapping definition の記述が正しくないと、umsCodeGenerator がエラーメッセージを出力します。エラーメッセージに従って mapping definition を修正し、umsCodeGenerator を再度実行してください。

5. コンパイル・実行

これ以降は普通のプログラム開発と同じです。これまで作成、生成したファイル(sample.csv、Main.java、Sample.java)をカレントディレクトリに格納し、以下のコマンドを実行してください。

C言語
$ gcc -std=c99 -ggdb -o main -Wall -I${TABLETOOLS_HOME}/build/include -I. *.c -L${TABLETOOLS_HOME}/build/lib/ -lums -lumstt
$ ./main < sample.csv
Java
$ javac -classpath .:$TABLETOOLS_HOME/build/classes Main.java Sample.java
$ java -cp .:$TABLETOOLS_HOME/build/classes Main sample.csv

正しく処理ができていれば、以下が表示されます。

input(9*8+0):<A,100,1.1>
output(9*8+0):<A,100,1.1>
input(9*8+0):<B,200,2.2>
output(9*8+0):<B,200,2.2>
input(9*8+0):<C,300,3.3>
output(9*8+0):<C,300,3.3>

Tips

1. Emacs + nxml-mode

Emacs + nxml-mode で編集すると、 mapping definition の validation をリアルタイムに行ってくれます。 nxml-mode が読み込む rnc ファイルは、以下のコマンドによって $TABLETOOLS_HOME/schema/rnc 配下に生成されます。

$ ant rnc

mapping definition が正しい文法で書かれているか、msCodeGenerator がサポートしている範囲に収まっているかをチェックすることができます。 datatypeLibrary の URI と type もチェックの対象です。ただし、両者が正しい組み合わせで使われているかはチェックされません。

2. 改行コードにマッチする value 要素

本当に改行コードを埋め込むしかないのです。

... <txt:value>
</txt:value>

以下ではありません。

<txt:value>\n</txt:value>

3. サンプルで用いるファイルを自動で生成する方法

サンプルで用いるファイルを、以下のコマンドにより、自動で生成することもできます。

$ createsample -lang -type ums_file output_directry

これにより、以下の構造のサンプルディレクトリに、サンプルで用いるファイルが自動で生成されます。

    + Sample

      + clng
        - SampleMain.c
        - SampleTest.c
        - Makefile
        - schemas.xml
        - Sample.ums

      + java
        - SampleMain.java
        - SampleTest.java
        - build.xml
        - schemas.xml
        - Sample.ums

      + data

設計メモ：サンプル自動生成ツール

4. validation プログラム

マッピング定義 を用いて簡単に validation プログラムを書くことができます。以下は、１行に ':' で区切られた８項目のデータが並ぶファイルを検証する例です。 JAVA では、以下のようになります。

<?xml version="1.0" encoding="utf-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4"
         datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>
import jp.jaxa.isas.ums.runtime.*;
import jp.jaxa.isas.ums.m3.*;

class ValidateSample {

  static void validate( byte[] ums__buffer, int ums__bitlen ) throws UMSException {
    <defineMapping direction="decode">
      <dat:byte encode="txt" xmlns:dat="http://ums.isas.jaxa.jp/0.4/dat">
        <dat:list separator=":">
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
        </dat:list>
      </dat:byte>
    </defineMapping>
  }

  /* 行データ用定型プログラム */
  public static void main(String[] args) {

    UMSLibrary.tableTools_init();

    String fileName = args[0];
    String inputBuffer;
    byte[] buffer = null;
    int inBitlen = 0;

    try {
      java.io.BufferedReader br
        = new java.io.BufferedReader( new java.io.FileReader( fileName ) );

      while( ( inputBuffer = br.readLine() ) != null ) {

        inBitlen = inputBuffer.length() * 8;

        try {
          buffer = inputBuffer.getBytes( "US-ASCII" );
          validate( buffer, inBitlen );
        } catch ( UMSException ex ) {
          ex.print( buffer, inBitlen );
          ex.printStackTrace( System.err );
        }
      }
      br.close();

    } catch ( java.io.IOException ex ) {
      ex.printStackTrace( System.err );
    }
    UMSLibrary.tableTools_end();
  }
}
  </start>
</grammar>

また、C言語では以下のようになります。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4"
         datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>

void validate( char *ums__buffer, int ums__bitlen, ums__exception_t *ums__ex ) {
    <defineMapping direction="decode">
      <dat:byte encode="txt" xmlns:dat="http://ums.isas.jaxa.jp/0.4/dat">
        <dat:list separator=":">
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
          <dat:data type="string"/>
        </dat:list>
      </dat:byte>
    </defineMapping>
}

/* 行データ用定型プログラム */
int main() {

  char in_buffer[BUFFER_SIZE];
  int  in_bitlen;
  ums__exception_t ums__ex;

  tableTools_init();

  while ( fgets( in_buffer, BUFFER_SIZE, stdin ) != NULL ) {

    in_bitlen = strlen( in_buffer ) * 8 - 8;

    in_buffer[in_bitlen/8] = 0;
    printf( "input(%d*8+%d):<%s>\n", in_bitlen / 8, in_bitlen % 8 , in_buffer );

    initException( &ums__ex );

    validate(input_buffer, in_bitlen, &ex);

    if ( ums__ex.occured != UMS__STATE_OK ) {
      ums__exception_print( &ums__ex, in_buffer, in_bitlen );
      continue;
    }
  }

  tableTools_end();

  return 0;
}
  </start>
</grammar>

5. enocde と decode で同じデータ定義を参照する方法

'define'要素 、及び 'ref'要素 を用いて、共通部分を定義、参照することができます。チュートリアルの例は、以下のように書き直すことができます。

<?xml version="1.0" encoding="UTF-8"?>
<grammar xmlns="http://ums.isas.jaxa.jp/0.4"
         datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
  <start>

    <java:class name="Sample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">

      <defineVariables>
        <java:var class="String" name="sData"/>
        <java:var type="int"     name="iData"/>
        <java:var type="double"  name="dData"/>
      </defineVariables>

      <defineFunctions>
        <java:function name="decode">
          <java:arg       type="byte[]" name="ums__buffer" direction="in"/>
          <java:arg       type="int"    name="ums__bitlen" direction="in"/>
          <java:return    type="void"/>
          <java:exception type="UMSException"/>

          <defineMapping direction="decode">

            <ref name="mapping">

          </defineMapping>
        </java:function>

        <java:function name="encode">
          <java:arg       type="byte[]" name="ums__buffer" direction="out"/>
          <java:arg       type="int[]"  name="ums__bitlen" direction="inout"/>
          <java:return    type="void"/>
          <java:exception type="UMSException"/>

          <defineMapping direction="encode">

            <ref name="mapping">

          </defineMapping>
        </java:function>

      </defineFunctions>
    </java:class>
  </start>

  <define name="mapping">
    <dat:byte encode="txt" xmlns:dat="http://ums.isas.jaxa.jp/0.4/dat">
      <dat:list separator=",">
        <java:value-of select="sData">
          <data type="token"/>
        </java:value-of>
        <java:value-of select="iData">
          <data type="int"/>
        </java:value-of>
        <java:value-of select="dData">
          <data type="double"/>
        </java:value-of>
      </dat:list>
    </dat:byte>
  </define>

</grammar>

6. define/ref の機能のみ使いたい

"resolveRef.xsl" を使用し、 define/ref の展開を行いたい XML ファイルを XSLT プロセッサにかけてください。

[参照ファイル]
src/xslt/raw/resolveRef.xsl

umsCodeGenerator 0.4

Major Versions

umsCodeGenerator version 0.4

Capability of

choice
repeat
optional
zeroOrMore
oneOrMore.

has been recovered from this version with new processing algorithms

Method 3: - One pass processing which supports XML, interleave (recurse of self is prohibited), recursive ref-define within finite depth. Sample is shown here.

Supported Data Structure and Processing Language is the same with tableTools version 0.4.

tableTools version 0.4

This version can only handle simple table type structure. Both decoding and encoding of sequential data are supported. On the other hand, following capability was tentatively descoped

choice
repeat
optional
zeroOrMore
oneOrMore.

Supported Data Structure
- Sequential Data in Text and Binary format - http://ums.isas.jaxa.jp/0.4/dat
Supported Processing Language
- C - http://ums.isas.jaxa.jp/0.4/clng
- JAVA - http://ums.isas.jaxa.jp/0.4/java

umsCodeGenerator version 0.3

Most of processing in 'umsCompiler' has been moved into the XSL stylesheet of 'umsCodeGenerator' version 0.3. Since XSLT has limited capability in handling of strings, small portion of processing is still written in JAVA. This version of umsCodeGenerator supports generation of decoding library of serial data. C, JAVA and PERL version was available. Only Method 2 type processing was supported in this version.

Supported Data Structure
- Sequential Data in Text and Binary format - http://ums.isas.jaxa.jp/0.3/dat
Supported Processing Language
- Perl - http://ums.isas.jaxa.jp/0.3/perl
- C - http://ums.isas.jaxa.jp/0.3/clng
- JAVA - http://ums.isas.jaxa.jp/0.3/java

umsCompiler version < 0.2

Oldest version of this program written in JAVA language. This version supported two decoding algorithms

Method 1 (only for input of text data): Converts mapping definition into a regular expression and use regular expression library.
Method 2: Two pass proccessing for both text and binary data.

Minor Releases

2006年11月22日:20061122 版リリースノート

デコード/エンコード関数のインタフェースを変更しました。
Xalan、MSV、Jing、Trangを同梱しました。
W3C datatype の hexBinary 型に対応しました。

2006年10月20日:20061020 版リリースノート

value 要素の制約ファセットをスキーマに追加しました。
生成ソースコードを最適化しました。

2006年10月06日:20061006 版リリースノート

umsCodeGenerator として未サポートのタグをチェックする機能を追加しました。
例外発生時のメッセージを分かりやすくしました。

2006年09月13日:20060913 版リリースノート

環境変数 UMS_THREAD の設定が必要になりました。
umsCodeGenerator によって生成されるソースコードの処理に用いるデータ構造を変更しました。

2006年08月16日:20060816 版リリースノート

入力ファイル (mapping definition file) のチェック機能を充実させました。

2006年07月28日:20060728 版リリースノート

20060714 版 UMS 仕様に対応するよう、処理の変更、制約の追加を行いました。
Java 版の package 指定に対応させました。

2006年07月14日:20060714 版リリースノート

20060419 版 UMS 仕様に対応するよう、処理の変更、制約の追加を行いました。
group, interleave, choice, optional, zeroOrMore, oneOrMore, empty について、「dat」名前空間に対応しました。

2006年06月23日:20060623 版リリースノート

pre 処理のステップを無くし、umsCodeGenerator 生成時の build 速度を改善しました。

:

2005年10月25日: umsCodeGenerator-2005102501.tar.gz

内部処理を全面的に見直し無駄な処理を省きました。 interleave を組み込みました。全般的にタグを入れ子にした場合の試験ケースが甘いので包括的な試験を今後実施します。(-KM-)

2005年9月19日:

スキーマの仕様のドラフトを作成しました( see http://ums.isas.jaxa.jp/ )。 umsCodeGenerator の最新版とほとんど一致していますが、 line タグの代わりに lines タグが導入され、ツール側とは不一致になっています。(-KM-)

2005年9月17日: umsCodeGenerator-2005091701.tar.gz

エラーメッセージを充実させました。同梱の encodingLibrary がサポートする型を増やしました。(-KM-)

2005年8月3日: umsCodeGenerator-2005080301.tar.gz

tableTools を umsCodeGenerator に統合しました。 file タグを実装し、mapping definition ファイルから明示的に出力先ソースファイルの名称を規定できるようにしました。(-KM-)

2005年8月1日:

tableTools/umsCodeGenerator 双方に line タグ、param タグが実装されました。 line タグは、「テキストファイルの１行」に対応するものです。また、umsCodeGenerator に optional, choice, zeroOrMore, oneOrMore の機能が実装されました。サンプルに残っていたロケールの依存性を排除し、環境変数 CC を参照し使用するコンパイラを決めるなど各種プラットホームへの対応への準備を進めています。(-KM-)

2005年7月29日: tableTools-2005072953.tar.gz umsCodeGenerator-2005072953.tar.gz

ロケール非依存化
環境変数 CC を参照
line のサポート
optional のサポート (umsCodeGenerator のみ)

2005年7月23日: tableTools-2005072305.tar.gz umsCodeGenerator-2005072305.tar.gz

従来の syntax (XML-XML syntax) に加え、 XML-language syntax をサポートしました。プログラムの中にスキーマを埋め込む形で使えるので便利です。 oneOrMore, zeroOrMore, choice のサポートしました(umsCodeGenerator)。 (-KM-)

2005年7月2日: tableTools-2005070253.tar.gz

XSL の記述を整理圧縮。
pre XSL の処理を追加。 XSL をメタに記述しておき論理関係をすっきりさせる。コメント出力の取り扱い、コンテナの取り扱いなど
post xsl の処理を追加。言語固有性はここで吸収。

2005年6月26日: tableTools-2005062653.tar.gz umsCodeGenerator-2005062653.tar.gz

例のディレクトリ構造を整理。
list の実装を変更。 separator 属性、delimiter 属性に対応。ネストへの対応。
umsCodeGenerator (制御構造あり向け) と tableTools (制御構造なし向け) を分離。処理ロジックは可能な限り共通化。ただし、今のところどちらも制御構造には対応していない。 C 言語版もコンパイル可能に。

2005年6月24日: tableTools-2005062451.tar.gz

JAVA 版において <list/> 要素の処理に対応。 CSV 対応のための separator 属性が導入されました。が、separator 属性、delimiter 属性とし再定義の予定であり、これを用いる場合 mapping 定義の re-write が必要になります。
マッピング定義ファイルを検証するための RELAX NG ファイルを作成しました。
例外処理の考え方を整理しました。

2005年6月21日:

本体とは切り離した encodingLibrary の拡張を始めました (ここに書くべきことではないかもしれません)。

2005年4月25日: tableTools-2005042504.tar.gz

C 版において <list/> 要素の処理に対応しました。 encodingLibrary (RELAX NG の datatypeLibrary の機能を包含) を tableTools の本体部分と切り分けました。これにより、tableTools 本体に手を加えずに、新たな encodingLibrary を追加することが可能になりました。

これにより発覚した、サンプル中の datatypeLibrary の誤記を訂正。その他、ヘッダファイルの指定誤りを訂正。
(C 版のみ) W3C_typeConversionLibrary において、int 型の値域に含まれない場合、txt エンコードの unsignedInt 型を正しくデコードできないバグを訂正。

2005年4月18日:

tableTools version 0.4 をリリースしました。 mappingSchema の文法 (version 0.4) は、これをもとにフリーズします。今後は、曖昧さを解消するための、記述の追加など、コンパチビリティを保ちつつ進化させていきます。(-KM-)

2005年4月16日: tableTools-20050416.tar.gz

(C 版のみ) typeConversionLibrary 全面見直し。 <data/> 要素、<value/> 要素と datatype の組み合わせによって生じる潜在バグを訂正。
<value/> - string, token 型の encode 処理のリテラル生成で \ 記号が使われた場合の処理誤りを訂正。
<defineMapping/> - 文法変更。

2005年4月15日: tableTools-2005041501.tar.gz

2005年4月13日: tableTools-2005041301.tar.gz

2005年03月以前の開発の履歴・記録

制約事項

<value-of>要素の select 属性で使用できる書式に制限があります。 a.b.c などというように、変数名、構造体メンバアクセスを空白を入れず列挙することしかできません。例えば、<value-of select="(a).a"/>という記述はできません。
C言語の typedef はサポートされていません。
現在は、Java 版のみエラーメッセージの多言語対応（英語メッセージと日本語メッセージ）を行っています。 C版については、英語メッセージしか出力できません。今後対応を行っていく予定です。
Java 版の typeConversionLibrary 関数において、文字列処理の encode が、現在は "US-ASCII" となっています。
dataTypeLibrary の URI と type のチェックは、完全ではありません。

既知のバグ

See Bugzilla.

umsCodeGenerator

開発規約

ディレクトリ構成

開発時のディレクトリ構成は以下のようにしてください。 archive ディレクトリには、testAndTar.sh を実行時に作成される tar/gz ファイルが格納されます。 ums ディレクトリは、本ページを構成する forrest ドキュメントを格納します。

isas/archive
isas/umsCodeGenerator/yyyymmddvv
isas/ums

Note

普段から umsCodeGenerator/yyyymmddvv というディレクトリで作業しておくと良いです。こうしておくのは、umsCodeGenerator が複数の版を一つのマシンに抱えて使うことがありうるツールだからです。つまりミドルウエアを使用する場合、プロジェクトの途中でバージョンをあげるのは決断が必要です。多分、バージョンは固定して使い、上げませんが、複数のプロジェクトが一つのマシンで走ることは考えられます。

開発言語

C 言語

大雑把に言うと、C 言語の方言を使ってはなりませぬ。 ISO C 1999 に従うべきです。その全ての機能を使ってよいわけではなく、拡張された機能の使用は極力避けるべきです。 ISO C 1999 の機能のうち明示的に用いていて良いのは以下の機能です。

各種ビット長の整数型
可変長配列を持つ構造体 (TBD)

より具体的には gcc -fstd=c99 -Wall にて処理できるソースをコンパイルすることが要求条件です。また、int_least16_t と int16_t の違いを意識してください。単発の関数呼び出しのパラメータの場合は前者で、巨大な配列をメモリに確保する場合は後者を用いるべきです。

Java

以下で動作すること。

Java2 1.4
Java5

2005051901：Java、C、XSL についてのコーディング規約

設計メモ：不要な UMS__ ums__ 接尾辞の削除 (例外名称, 制御条件)
設計メモ：C・Java 命名規約
設計メモ：オブジェクト指向

文字コード

ファイルの文字コードは以下に従ってください。

ファイル	文字コード	改行コード	備考
.c .h .java .sh	EUC-JP	LF	vi でも emacs でも日本語表示が可能なため。
.xml .xsl	UTF-8	LF	XMLプロセッサはすべて、UTF-8 と UTF-16 をサポートすることが保障されているため。

２次的な関連情報

開発方針

改修は一度にまとめて実施せず、可能な限り細かい単位で行ってください。
ソースコードの改修を行う際は、まず設計メモを作成してください。
なるべく説明の文書は軽く、ソースコード自身が説明になるようなものを作成してください。

リビジョン管理

変更を行った際は以下の情報を、変更を行ったファイルの先頭と $TABLETOOLS_HOME/changes.xml に記述してください。

バージョン(yyyymmddvv)
変更者
変更内容

変更を行った際は、$TABLETOOLS_HOME/tool/testAll.sh を実行し、デグレがないことを確認してください。なお、試験パターンが全て通ると、isas/archive ディレクトリに umsCodeGenerator-yyyymmddvv.tar.gz が作成されます。

ソースコードの管理は、Subversion で行っています。

Warning

testAll.sh の実行が成功したものだけを commit するようにしてください。

設計メモ：変更履歴のつけ方

文書管理

改修を行った時点で、この forrest ドキュメントの関連する部分を改版してください。

forrest ドキュメントの管理もソースコードと同様、Subversion で行っています。

Warning

forrest コマンドの実行が成功したものだけを commit するようにしてください。

不具合管理

現在、不具合や機能拡張の管理は ToDo と Bugzilla で行っています。両者は、以下のように使い分けます。

ToDo：長期の要対応点
Bugzilla：短期の要対応点

リリースノートの書き方

Releases ページに載せるリリースノートには、以下の内容を記述してください。

仕様・性能・インターフェースなど、ユーザビリティに関わる情報。
ヘルプ情報など、ユーザにとって必要な情報。
ユーザに必要な bugfix の情報(Bugzilla 番号、Bug の概要)。

2006年06月23日以降のリリースノートは、 pod を使用して作成しています。 pod を使用してリリースノートを作成する際は、pod 形式の yyyymmddvv_ums_release.pod ファイルを作成し、 pod2html が使用可能な環境で以下のコマンドを実行してください。

$ pod2html --css=ums.css --title="yyyymmddvv umsCodeGenerator release" < yyyymmddvv_ums_release.pod > yyyymmddvv_ums_release.html

ソースコード生成

ソースコード生成の概要

umsCodeGenerator は、シェル、Java、XSLT で実装されています。各実装の処理内容は以下の通りです。

実装	処理内容	備考
シェル	コード生成処理全体を実行する Java プログラムを呼び出す	Bourne シェルを使用。C シェルは使用しない。
Java	コード生成処理全体を実行(バリデータの実行、XSLT 変換など) ファイル出力 XSLT を生成変数定義 XSLT を生成
XSLT	mapping definition のチェック mapping definition の編集 mapping definition からソースコードへ変換	XSLT プロセッサは Xalan-Java を使用する。実装 XSLT 一覧

ソースコードの生成は、以下のステップで行います。

コード生成を行うJava プログラムの呼び出し
実行パラメタの解析
作業用ディレクトリの作成
mapping definition の妥当性検証
mapping definition にファイル名・行番号埋め込み
UMS の単純化
define/ref の展開
UMS の単純化、define/ref 展開後の妥当性検証
mapping definition に対応した XSLT の生成・マージ
mapping definition のチェック処理
mapping definition を Language syntax へ変換
ソースコード生成

Note

このページの記述は開発者の意識をすり合わせるためのものであり、ソースコードのリリースより遅れるかもしれませんし、逆に進んでいるかもしれません。現在のソースコードがどうなっているかは最新版のソースコードを読んでください。

設計メモ：build〜コード生成までの流れ

1. コード生成を行うJava プログラムの呼び出し

コード生成時に使用する各種ライブラリをパスに設定し、コマンドラインオプションを引数にしてコード生成を行う Java プログラムを呼び出します。

[参照ファイル]
src/txt2clng.tmpl
src/txt2java.tmpl

2. 実行パラメタの解析

"txt2lang" の実行オプションの解析を行います。実行オプションの指定が不適切な場合は、USAGE を表示します。

パラメタの解析には、Jakarta-Commons プロジェクトで提供されている、コマンドラインオプション解析ライブラリである CLI を使用しています。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/GeneratorMain.java

3. 作業用ディレクトリの作成

コード生成時に作成される一時ファイルを格納する一時ディレクトリを作成します。作成するディレクトリ名は以下になります。

"$TABLETOOLS_TEMP/yyyyMMddHHmmssSSS乱数(0.0 以上 1.0 未満の double 値)"

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/WorkDirectory.java

4. mapping definition の妥当性検証

MSV と Jing を使用して、mapping definition がスキーマ通り記述されているかどうかの妥当性を検証します。コマンドラインオプションに指定された組み合わせに応じて、妥当性検証をかけるスキーマを選択します。各 mapping definition に対応するスキーマの組み合わせは以下の通りです。

mapping definition	スキーマ
XML syntax(C 言語)	dat_xml-clng.rng
XML syntax(Java)	dat_xml-java.rng
Language syntax(C 言語)	dat_lang.rng
Language syntax(Java)	dat_lang.rng

この時、value 要素の type 属性に指定された値に応じた制約 facet についても妥当性を検証します。現在サポートしているデータ型については、 encodengLibrary を参照してください。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/XmlValidator.java

設計メモ：value 要素の制約 facet

5. mapping definition にファイル名・行番号埋め込み

mapping definition の記述ミスチェック時や、エラー情報の出力時に mapping definition ファイルの以下の情報を出力します。

ファイル名
行番号
列番号

mapping definition の記述ミスのチェックや、エラー情報を出力するコードの生成は XSLT で行います。そのため、XSLT でこれらの情報を取得できるよう、要素の属性値として mapping definition に埋め込みます。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/XmlEditor.java

6. UMS の単純化

ここでは、UMS 仕様書の「4.3. datatypeLibrary 属性」と「4.4. value 要素の type 属性」についての単純化を実施します。それぞれの項目に対して、以下の処理を行います。

項目	処理
4.3. datatypeLibrary 属性	datatypeLibrary 属性を持たない data 要素、value 要素に対して、 datatypeLibrary 属性を持つ直近の祖先要素の datatypeLibrary 属性の値を付与する。 data 要素、value 要素以外に付属している datatypeLibrary 属性を取り除く。
4.4. value 要素の type 属性	type 属性を持たない value 要素に対して、値が token である type 属性を付与し、 datatypeLibrary 属性の値を空文字に置き換える。

[参照ファイル]
src/xslt/raw/simplify.xsl

7. define/ref の展開

umsCodeGenerator での処理を簡略化するため、mapping definition で定義されている define 要素と ref 要素の展開を行います。

[参照ファイル]
src/xslt/raw/resolveRef.xsl

設計メモ：XML ファイルの再帰的なコピー

8. UMS の単純化、define / ref 展開後の妥当性検証

UMS の単純化、define /ref の展開を行った後も、スキーマに対して妥当性であるかを検証します。各 mapping definition に対応するスキーマの組み合わせは以下の通りです。

mapping definition	スキーマ
XML syntax(C 言語)	simple_dat_xml-clng.rng
XML syntax(Java)	simple_dat_xml-java.rng
Language syntax(C 言語)	simple_dat_lang.rng
Language syntax(Java)	simple_dat_lang.rng

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/XmlValidator.java

9. mapping definition に対応した XSLT の生成・マージ

9.1 ファイル出力テーブル XSLT の生成

生成されるソースコードのファイル名は、*.ums の拡張子を変更したものになります。しかし、file タグを用い、特定の部分を指定したファイルに出力することも可能です。

ファイル名の定義は mapping definition 内に記述されるため、mapping definition に応じたファイルの切り分け処理を行う XSLT を生成します。ファイルの切り分け処理は、Xalan-Java の拡張機能を使用します。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/FileOutputTableCreator.java

設計メモ：出力ファイルの振り分け

9.2 変数変換テーブル XSLT template の生成

マッピングの定義は、mapping definition の defineMapping 要素内に記述されます。 defineMapping 要素内には、変数名のみが記述されますが、変数の型定義は defineMapping 要素の外部で定義されます。そのため、XSLT 変換を行う際に defineMapping 要素内に現れる変数がどのような型であるかを、処理系が知っている必要があります。

そこで、defineMapping 内で使用される変数名と型との対応情報を取得可能な XSLT の template を生成します。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/VarTypeTableCreatorForClng.java
src/java/jp/jaxa/isas/ums/codeGenerator/VarTypeTableCreatorForJava.java

設計メモ：変数変換テーブル

9.3 XSLT template のマージ

XSLT 形式に変換した変数変換テーブルを基本のスタイルシートにマージし、今回処理用のスタイルシートを作成します。これは、単純に、基本スタイルシート内に、XSLT の template を挿入する処理です。

"pre_txt2lang.xsl" 中の <xsl:template name="varTypeDefinition"/> という部分を、 9.2 で生成した template に置き換えます。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/Generator.java

10. mapping definition のチェック処理

mapping definition の制約と、 UMS 仕様書の制限のチェックを行います。チェックする項目は、以下の通りです。

define 要素の子孫に、optional 、oneOrMore、zeroOrMore が記述されていないか。
loop のネストが 32 を超えていないか？
byte 要素、list 要素の祖先に bit 要素が記述されていないか？
bit 要素の encode 属性の値に "txt" が指定されていないか？
method の値として、"2"、"3"、"4" 以外が指定されていないか？
umsCodeGenerator がサポートしているタグ以外のタグが記述されていないか？
環境変数 UMS_THREAD に "true" 以外の値が設定されている際に、制御構造のタグが指定されていないか？
UMS 仕様書「7.1.5. start 要素」に記述された、禁止されているパスを含んでいないか？

[参照ファイル]
src/xslt/raw/check_mappingdef.xsl
src/xslt/raw/check.xsl

11. mapping definition を Language syntax へ変換

9.3 でマージされた XSLT を使用し、 XML syntax の mapping definition を、Language syntax へ変換します。入力 mapping definition が Language syntax だった場合は、mapping definition の内容は変化しません。

[参照ファイル]
src/xslt/raw/pre_txt2clng.xsl
src/xslt/raw/pre_txt2java.xsl

設計メモ：XML-language Syntax の処理の実装方法に関して

12. ソースコード生成

以下のステップでソースコードを生成します。

<post:* /> と file 要素を含んだソースコードへ変換
<post:* /> を展開し file 要素を含んだソースコードへ変換
file 要素に応じて出力ファイルを振り分け

設計メモ：XSLT デザインパターン（preタグの展開）
設計メモ：スタイルシートの整理
設計メモ：ソースコードに mapping definition をコメントとして出力
設計メモ：tableTools と umsCodeGenerator を切り分ける XSLT template

12.1 <post:* /> と file 要素を含んだソースコードへ変換

ソースコードへ変換するスタイルシートは、言語ごとに用意されています。トップのスタイルシートは言語ごとに別物が用意されており以下のようになっています。

ファイル名	役割
txt2clng.xsl	テキスト/バイナリデータとC 言語のマッピング用
txt2chdr.xsl	テキスト/バイナリデータとC 言語のマッピング用(ヘッダファイル生成)
txt2java.xsl	テキスト/バイナリデータとJAVAのマッピング用

"txt2lang.xsl" は処理が多岐にわたります。そのため、mapping definition に記述する要素ごとに、それぞれの処理を行う XSLT を作成しています(ファイル名の多くは "要素名.xsl")。

これらの XSLT は "txt2clng.xsl"、"txt2java" の両方から呼び出されるため、 C言語とJAVAの共通部分にどちらか固有なコードを記述してはいけません。言語毎に異なる処理が必要な場合は、それぞれ専用のテンプレートを用意するか、後述する post 処理で内容を選択するかのいずれかの方法を用います。 "txt2lang.xsl" では、それぞれの XSLT を xsl:include で含めます。

[参照ファイル]
src/xslt/raw/txt2clng.xsl
src/xslt/raw/txt2chdr.xsl
src/xslt/raw/txt2java.xsl

12.2 <post:* /> を展開し file 要素を含んだソースコードへ変換

C 言語と Java の文法の記述を吸収し、XSLT を共通化するために、マクロを使用します。しかし、XSLT には標準でマクロの機能がないため、"post" 名前空間の要素を定義し、マクロの機能を実現します。

post マクロで定義するものは、以下になります。

例外処理
構造体/クラス変数のアクセス
関数/メソッドのインターフェース

この他、強力な以下の2つのマクロがあります。しかし、使用する頻度は必要最低限にしてください。

マクロ	役割
<post:clng/>	子ノードに任意の C言語のみのソースコードを記述する
<post:java/>	子ノードに任意の JAVA のみのソースコードを記述する

[参照ファイル]
src/xslt/m2/secondTransform_clng.xsl
src/xslt/m2/secondTransform_java.xsl
src/xslt/m3/secondTransform_java.xsl
src/xslt/m4/secondTransform_clng.xsl
src/xslt/raw/post_clng.xsl
src/xslt/raw/post_java.xsl

設計メモ：post 処理による XSLT 変換

12.3 file 要素に応じて出力ファイルを振り分け

9.1 で生成された XSLT を使用し、最終的に出力ファイルを振り分けます。

以上でソースコードの生成は終了です。

[拡張機能] デバッグ情報の出力

umsCodeGenerator 実行時に "-d" オプションを付与することにより、デコード/エンコード処理時に以下の情報を出力するコードを生成する。

mapping definition の処理位置（行番号、要素名）
稼動中のスレッド数
稼動中のスレッド番号
タスク制御関数の実行状況

設計メモ：デバッグ情報の出力

[拡張機能] 生成ソースコードの最適化

「最適化しないオプション」を、umsCodeGenerator 実行時に指定できるようにする案が出たが、オプションを追加するかどうかは 2006/10/27 現在保留中。 2006/10/27 現在の実装としては、最適化しないオプションを "false" の状態で保持し、コード生成処理を行っている。

[参照ファイル]
src/java/jp/jaxa/isas/ums/codeGenerator/GeneratorMain.java

設計メモ：生成コードの最適化

デコード / エンコード処理

処理ロジック

umsCodeGenerator は、2種類のロジックのソースコードを生成することができます。「スレッド処理を行うロジック」と、「スレッド処理を行わないロジック」です。 2つのロジックの特徴は、以下の通りです。

処理ロジック	制御構造を持たないデータ	制御構造を持つデータ
スレッド処理を行う	処理可能	処理可能
スレッド処理を行わない	処理可能	処理不可能

Note

ここで使用する "スレッド" という言葉は、一般に使用される "スレッド" とは異なります。 umsCodeGenerato が生成するソースコードでは、制御構造の処理を実現するために、"状態" を brunch、sleep、awake、sync させます。それら一連の処理をまとめて、"スレッド" と呼んでいます。

設計メモ：制御構造の取り扱い
設計メモ：制御構造の処理（Java版）
設計メモ：（C言語版）
設計メモ：case ラベルの命名法
設計メモ：例外に関わる辺りの生成コードイメージ

データモデル

umsCodeGenerator が扱うデータは、以下に分類されます。

データ種別	要素
dat	bit、byte、data、value のみで構成
list	list + dat データ
loop	oneOrMore、zeroOrMore、optional + dat データ
interleave	interleave + dat データ

umsCodeGenerator が生成するソースコードでは、dat、list、loop、interleave を、 thread クラスの変数が束ねる形で状態を保持しています。

[参照ファイル]
src/clng/umsDat.h
src/clng/umsDat.c
src/clng/umsList.h
src/clng/umsList.c
src/clng/umsLoop.h
src/clng/umsLoop.c
src/clng/umsInterleave.h
src/clng/umsInterleave.c
src/clng/umsThread.h
src/clng/umsThread.c
src/java/jp/jaxa/isas/ums/runtime/UMSDat.java
src/java/jp/jaxa/isas/ums/runtime/UMSList.java
src/java/jp/jaxa/isas/ums/runtime/UMSLoop.java
src/java/jp/jaxa/isas/ums/runtime/UMSInterleave.java
src/java/jp/jaxa/isas/ums/runtime/UMSThread.java

設計メモ：データモデルの再設計
設計メモ：クラス図

要素ごとの処理

設計メモ（旧版）

mapping function 2005062651:mapping function の引数名の仕様変更 (固定)
2005062451: 例と本体の切り分け
2005062452: tableTools と umsCodeGenerator 並存
2005080301: umsCodeGenerator, tableTools の統合
2005072953: もろもろ作業メモ (txt:line タグ、encodingLibrary の新インターフェース。param タグの設計メモを含む)

2005070251: XSL を XSL で XSL する方法
2006062201: pre 処理による XSL 変換

例外処理

ここで述べる例外には、以下の2種類があります。

mapping definition からのソースコード生成時の例外
デコード/エンコード処理時の例外

1. ソースコード生成時の例外

ソースコード生成時は、 XSLT で例外を検出します。例外を検出した際は、エラーメッセージを出力すると共に、コード生成を行う Java プログラムへ例外を通知します。

エラーメッセージの出力形式を統一するために、エラーメッセージ出力用の <xsl:template name="error"> を使用します。この template を使用して出力するエラーメッセージは以下のようになります。

# Error - mapping definition ファイル名 line:行番号 column:列番号 element:<要素名> "エラーメッセージ."

XSLT が検出する例外は限られたものです。原理的には XSLT で判定可能な項目でも、実装が複雑になるような項目はランタイムで検出します。

[参照ファイル]
src/raw/common.xsl
src/raw/check.xsl

設計メモ：XSLT で検出した例外の処理

2. デコード/エンコード処理時の例外

umsCodeGeneratotr が生成するデコード/エンコード処理では、各種のランタイムエラーを検出します。デコード/エンコード処理中に例外を検出した際には、次の情報を収集します。

例外発生の有無
エラーコード
例外の詳細情報
例外検出時の mapping definition ファイル名
例外検出時の mapping definition 行番号
例外検出時の mapping definition 列番号
例外検出時の mapping definition 要素名
データの処理位置(bit)
スタックトレース情報

なお、例外情報は、デフォルトでは次のフォーマットで出力します。

エラーメッセージ

-- input data --
　　at line 行番号, column 列番号
　　at byte バイト数, bit ビット数

　　Address| 00 01 02 03 04 05 06 07 08 09 0a 0b 0c 0d 0e 0f
　　-------+------------------------------------------------
　　　xxxx | 入出力データのバイナリ表示
　　　　　 |
　　　　　　　　　　　　~　エラー発生箇所の指定

-- mapping definition --
　　mapping definition ファイル名

　　at line:行番号, column:列番号, element:<要素名>, "エラーメッセージ"
　　詳細情報
　　at line:行番号, column:列番号, element:<要素名>, "エラーメッセージ"
　　詳細情報
　　　:

Note

例外の詳細情報(マッチしなかった文字列や型などの情報)は、ユーザーが独自に行う必要があります。

2.1 言語ごとの例外処理

デコード/エンコード処理時に検出した例外の処理機構は、C 言語と Java で異なります。 Java では、標準の例外処理機構を用いて処理しますが、C 言語は例外処理機構を備えていません。そこで、Java と同様な処理になるように、例外処理機構を設けています。

設計メモ：ユーザのためのエラーメッセージ・開発者のためのデバッグメッセージ

2.1.1 C 言語での例外処理

C言語では、構造体 "ums__exception_t" を用いて例外情報を保持します。

[参照ファイル]
src/clng/umsException.h

Java の例外処理機構を模擬するために関数形式マクロを定義し、例外処理を行います。使用する関数形式マクロは以下の通りです。

なお、本マクロを使用する際には、関数名を格納する変数 "FUNCTION" に、ユーザーがあらかじめ関数名を格納しておく必要があります。

マクロ	役割
throw	例外を検出した際に、例外情報を送出する。戻り値が void 型の関数で用います。
throwWithValue	例外を検出した際に、例外情報を送出する。戻り値がvoid型以外の関数で用い、指定された値で return する。
catchAndThrow	受け取った例外情報を、そのまま送出する。戻り値が void 型の関数で用いる。
catchAndThrowWithValue	受け取った例外情報をそのまま送出する。戻り値が void 型以外の関数で用い、で指定された値で return する。
catch	例外を受け取る。

[参照ファイル]
src/clng/umsException.h

2.1.2 Java での例外処理

Java では、Exception クラスを継承した UMSException クラスを定義し、例外情報を保持します。

[参照ファイル]
src/java/jp/jaxa/isas/ums/runtime/UMSException.java

Java では、例外処理機構を用いて例外処理を行います。

設計メモ：JAVA の例外及び clone() に関して

2.2 エラーコード体系

例外の種別ごとに、10進6桁のエラーコードを対応させています。エラーコードの各桁は、次のルールに基づいて数値を割り振ります。

WWXYZZ

WW: 例外種別
　X ：ツール
　Y ：検出箇所
　ZZ：通番

以下の番号は、umsCodeGenerator で使用しています。

桁	エラーコード	説明
WW	10	ソースコード生成エラー
	20	致命的エラー
	30	データが定義とマッチしない
X	1	umsCodeGenerator
Y	1	datatypeLibrary関数
	2	decode・encode関数
	3	生成ソースコード
	4	ユーザーが作成するソースコード

umsCodeGeneratorに標準で定義されている、例外検出場所、エラーコード、エラーメッセージは以下の通りです。

例外種別	例外検出ファイル	エラーコード	エラー種別
ソースコード生成エラー	datatypeLibrary関数	101101	データのbit長が定義と一致しない
ソースコード生成エラー	datatypeLibrary関数	101103	データのbit長が定義を超える
ソースコード生成エラー	decode・encode関数	101209	コンテナのネストが深すぎる
ソースコード生成エラー	decode・encode関数	101211	ループのネストが深すぎる
致命的エラー	datatypeLibrary関数	201104	書き込みバッファを超過する
致命的エラー	decode・encode関数	201204	書き込みバッファを超過する
致命的エラー	decode・encode関数	201205	読み込みバッファを超過する
致命的エラー	decode・encode関数	201206	配列のサイズを超過する
致命的エラー	decode・encode関数	201900	内部エラー
データが定義とマッチしない	datatypeLibrary関数	301100	バイトのアライメントが不適切
データが定義とマッチしない	datatypeLibrary関数	301102	データが定義されたパターンとマッチしない
データが定義とマッチしない	datatypeLibrary関数	301105	データの型が定義とマッチしない
データが定義とマッチしない	datatypeLibrary関数	301172	バッファの読み込み開始位置が不適切
データが定義とマッチしない	decode・encode関数	301200	バイトのアライメントが不適切
データが定義とマッチしない	生成ソースコード	301300	bit長が不適切

2.3 エラーメッセージの多言語対応

多言語対応を実現するため、日本語メッセージと英語メッセージを各国言語用プロパティファイルに用意します。ファイルには、次のようにエラーコードとエラーメッセージを記述します。メッセージの取得は、エラーコードをキーに行います。

エラーコード=エラーメッセージ

各国言語用メッセージファイルは、次のようになります。これらのファイルは、各プログラミング言語共通で使用します。

言語	ファイル名	ファイルの記述
日本語	UMSException_jp.properties	101101=コンテナのlengthに指定されたビット長(bitlen)がencodeに指定されたデータ型の固定ビット長(typelen)と等しくありません。コンテナのlengthに指定した値を修正してください。 101103=コンテナのlengthに指定されたビット長(bitlen)がデータ型の最大ビット長(maxlen)を超えています。コンテナのlengthに指定した値を修正するか、データ型を変えてください。　　　　　：
英語	UMSException_en.properties	101101=It is not equal to fixed bit length (typelen) of the data type from which bit length (bitlen) specified for length of the container is specified for encode. Please correct the value specified for length of the container. 101103=Bit length (bitlen) specified for length of the container exceeds maximum bit length (maxlen)of the data type. Please correct the value specified for length of the container or change the data type. 　　　　　：

[参照ファイル]
lang/UMSException_en_US.properties
lang/UMSException_ja_JP.properties

Note

デフォルト（環境変数 LANG の設定がない場合）では、英語版プロパティファイルを読み込みます。

Type Conversion Library

1. Type Conversion Library (共通処理)

UMS では、RELAX NG 同様、データ型に関する処理が言語そのものから切り離されています。つまり、各プログラミング言語ごとに、

encodeと、datatype
datatypeと、プログラミング言語のデータ型

の変換ルール（処理ロジック）を決める必要があり、各々の組み合わせごとに変換のルールを決めておく必要があります。これを Type Conversion Library と呼んでいます。 umsCodeGenerator では、これを言語本体とは別の XSLT で定義します。

共通処理は umsCodeGenerator 本体の XSLT から直接呼び出される Type Conversion Library の入り口です。 umsCodeGenerator 本体の XSL は、datatypeLibrary 属性やその他の値を、パラメータ 'library' などを用いて、template に引き渡します。共通処理の template は、'library' の値を用いて、各 Type Conversion Library 用の XSLT を呼び出します。未定義の Type Conversion Library が指定された場合、エラーメッセージを出力します。

新たな Type Conversion Library を、組み込む場合、この XSLT を変更します。

設計メモ：ソースコードのメタな記述 (添付資料)

1.1 typeConversion_lang.xsl

<stylesheet>
  <include href="file://localhost/W3C_typeConversion_lang.xsl" />
					
  <template name="initLibrary" />
					
  <template name="encode2valuetypeConversion"
               param="library, datatype, encode, cont10, cont20, constant"/>
  <template name="encode2datatypeConversion"
               param="library, datatype, encode, cont10, cont20"/>
  <template name="datatype2langtypeConversion"
               param="library, datatype, langtype, varname"/>
  <template name="langtype2datatypeConversion"
               param="library", datatype, langtype, varname"/>
  <template name="datatype2encodeConversion"
               param="library, datatype, encode, cont10, cont20"/>
  <template name="valuetype2encodeConversion"
               param="library, datatype, encode, cont10, cont20, constant"/>
</stylesheet>

1.2 typeConversion_chdr.xsl

<stylesheet>
  <include href="file://localhost/W3C_typeConversion_chdr.xsl" />
					
  <template name="useLibrary" />
</stylesheet>

2. Type Conversion Library (個別処理)

実際に、どのような処理を行うかは、各々の Type Conversion Library 毎に個別に指定します。 umsCodeGenerator に同梱のサンプルでは W3C のデータ型の一部が作りこまれています。

いずれの template も、パラメータ datatype を持っています。これは、もともとマッピング定義の data 要素や、 value 要素の type 属性の値を umsCodeGenerator 本体の XSL が読み取ったものです。使用可能なデータ型の名前は各 type conversion library にて定義します。未定義の datatype が指定された場合、エラーメッセージが出力されます。

この XSL ファイルに記載される関数呼び出しは対応するライブラリで定義された関数のみです。

<value /> 要素で指定される固定パターンをプログラミング言語のリテラルに置き換えるのはこのスタイルシートです。と、いうのは、どのような変換が必要かは type によって決まるからです。これは、文字列の処理なので XSL のみでは解決できず、 JAVA のソースコードを呼び出しています。

2.1 W3C_typeConversion_lang.xsl

<stylesheet>

  <template name="W3C_initLibrary"/>

  <template name="W3C_dataTypeDefinition"
    param="datatype"/>
  <template name="W3C_encode2valuetypeConversion"
    param="datatype, encode, cont10, cont20, constant"/>
  <template name="W3C_encode2datatypeConversion">
    param="datatype, encode, cont10, cont20"/>
  <template name="W3C_datatype2langtypeConversion">
    param="datatype, langtype, varname"/>
  <template name="W3C_langtype2datatypeConversion">
    param="datatype, langtype, varname"/>
  <template name="W3C_datatype2encodeConversion">
    param="datatype, encode, cont10, cont20"/>
  <template name="W3C_valuetype2encodeConversion">
    param="datatype, encode, cont10, cont20, constant"/>

</stylesheet>

2.2 W3C_typeConversion_chdr.xsl

<stylesheet>
  <template name="W3C_useLibrary"/>
</stylesheet>

3. Type Conversion Library (Library Function)

エンコードされたデータを言語から読み書きする作業は、直接書き下すことで、最も最適化された処理を行うことができます。しかし、種々の場合に対応しようとすると、直接ソースコードを書き出すよりも、ライブラリ関数として切り出しておく方が検証とソースコードの可読性が向上します。そこで、umsCodeGenerator に同梱のサンプルでは、殆どの処理がプログラミング言語そのもので記述された typeConversionLibrary を呼び出す形式を採用しています。

3.1 W3C_typeConversionLibrary.{h,c}

void ums__W3C_typeConversionLibrary_init(void);
void ums__W3C_typeConversionLibrary_end(void);

char *ums__W3C_txtEncode_stringType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
char *ums__W3C_txtEncode_tokenType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
int32_t ums__W3C_txtEncode_intType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
uint32_t ums__W3C_txtEncode_unsignedIntType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
double ums__W3C_txtEncode_doubleType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
int32_t ums__W3C_signedEncode_intType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
uint32_t ums__W3C_unsignedEncode_unsignedIntType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);
double ums__W3C_ieee754doubleEncode_doubleType
    (ums__dat_t *dat, int epos, ums__exception_t *ex);

void ums__W3C_stringType_txtEncode
    (char * str, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_tokenType_txtEncode
    (char * str, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_intType_txtEncode
    (int32_t num, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_unsignedIntType_txtEncode
    (uint32_t num, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_doubleType_txtEncode
    (double num, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_intType_signedEncode
    (int32_t num, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_unsignedIntType_unsignedEncode
    (uint32_t num, ums__dat_t *dat, int epos, ums__exception_t *ex);
void ums__W3C_doubleType_ieee754doubleEncode
    (double num, ums__dat_t *dat, int epos, ums__exception_t *ex);

void ums__W3C_txtEncode_stringValue
    (ums__dat_t *dat, int epos, char *literal, ums__exception_t *ex);
void ums__W3C_txtEncode_tokenValue
    (ums__dat_t *dat, int epos, char *literal, ums__exception_t *ex);
void ums__W3C_txtEncode_intValue
    (ums__dat_t *dat, int epos, int32_t literal, ums__exception_t *ex);
void ums__W3C_txtEncode_unsignedIntValue
    (ums__dat_t *dat, int epos, uint32_t literal, ums__exception_t *ex);
void ums__W3C_txtEncode_doubleValue
    (ums__dat_t *dat, int epos, double literal, ums__exception_t *ex);
void ums__W3C_signedEncode_intValue
    (ums__dat_t *dat, int epos, int32_t literal, ums__exception_t *ex);
void ums__W3C_unsignedEncode_unsignedIntValue
    (ums__dat_t *dat, int epos, uint32_t literal, ums__exception_t *ex);
void ums__W3C_ieee754doubleEncode_doubleValue
    (ums__dat_t *dat, int epos, double literal, ums__exception_t *ex);

3.2 Type Conversion Library (Library Function)

public class W3C_TypeConversionLibrary {

  public static String txtRead(UMSDat dat, int epos)
      throws UMSException;
  public static String txtEncode_stringType(UMSDat dat, int epos)
      throws UMSException;
  public static String txtEncode_tokenType(UMSDat umsDat, int epos)
      throws UMSException;
  public static int txtEncode_intType(UMSDat umsDat, int epos)
      throws UMSException;
  public static double txtEncode_doubleType(UMSDat umsDat, int epos)
      throws UMSException;
  public static int signedEncode_intType(UMSDat umsDat, int epos)
      throws UMSException;
  public static double ieee754doubleEncode_doubleType(UMSDat umsDat, int epos)
      throws UMSException;
  public static void bitWrite(long num, UMSDat umsDat, int epos)
      throws UMSException;
  public static void stringType_txtEncode(String str, UMSDat umsDat, int epos)
      throws UMSException;
  public static void tokenType_txtEncode(String str, UMSDat umsDat, int epos)
      throws UMSException;
  public static void intType_txtEncode(int num, UMSDat umsDat, int epos)
      throws UMSException;
  public static void doubleType_txtEncode(double num, UMSDat umsDat, int epos)
      throws UMSException;
  public static void intType_signedEncode(int num, UMSDat umsDat, int epos)
      throws UMSException;
  public static void doubleType_ieee754doubleEncode(double num, UMSDat umsDat, int epos)
      throws UMSException;
  public static void txtEncode_stringValue(UMSDat dat, int epos, String literal)
      throws UMSException;
  public static void txtEncode_intValue(UMSDat dat, int epos, int literal)
      throws UMSException;
  public static void txtEncode_doubleValue(UMSDat dat, int epos, double literal)
      throws UMSException;
  public static void signedEncode_intValue(UMSDat dat, int epos, int literal)
      throws UMSException;
  public static void ieee754doubleEncode_doubleValue(UMSDat dat, int epos, double literal)
      throws UMSException;
}

開発の流れ

開発の流れの概要

(-- 現在の開発体制の陣容では --)

umsCodeGeneratorの実装は、ボトムアップで進める方が効果的です。すなわち、最初からスタイルシートを作成し始めるのではなく、まずは、mapping definition に従った入力データを処理するソースプログラム（umsCodeGeneratorのアウトプットのイメージ）を作成し、両者を結び付けるためのスタイルシートを完成させていく、というアプローチを取っています。実装の流れを整理すると、次のようになります。

入力データの作成
mapping definition の作成
ソースプログラムの作成
スタイルシートの作成
動作確認

この作業を、徐々に mapping definition の記述を（UMS文法仕様に従って）リッチにしながら、イテレーティブに実施していきます。これにより、仕様の漏れがないこと、かつ、正常に動作することを確認しながら作業を進めていくことができます。また、この作業で作成した mapping definition と入力データとは、そのままテストデータとして利用します。

1. 入力データの作成

入力データの作成は、mapping definition の作成と同時並行的に行います。下の例では、入力データを持たないUMSを定義しているため、入力データは不要になります。

2. mapping definition の作成

次に、mapping definition を作成します。簡単のため、入力データを持たない次のような mapping definition を考えます。

<grammar xmlns="http://ums.isas.jaxa.jp/0.4">
  <start>
    <java:class scope="abstract" name="XmlSample" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
      <defineVariables>
        <java:var name="rec" class="Record"/>
      </defineVariables>
    </java:class>
  </start>
</grammar>

Note

この時、trang により、schema/*.rng のcompact syntax を作成しておくと便利です。 Emacs/nxml-mode を用いて、リアルタイムで mapping definition の validate を行うことができます。

3. ソースプログラムの作成

上で作成した入力データを decode／encode するためのソースプログラムを作成します。このとき、mapping definition との関係を意識するため、mapping definition 上の要素名、属性名をコメントとして残しながら実装します。これにより、XSLT 変換を意識しながら実装することができます。データ変換に関するところは、datatypeLibraryの関数を呼び出すように記述します。

同時に、これを呼び出すための main 関数と、この中から呼び出されるユーザ関数を作成します。

スタイルシートの作成前に、実際にソースプログラムをコンパイル、実行し、入力データを正しく処理できることを確認しておきます。本章では、ソースプログラムの添付は省略します。

4. スタイルシートの作成

スタイルシートの作成の前に、上で作成した mapping definition のスキーマを考えます。一般的な mapping definition の文法ではなく、今回作成するプロセッサが処理できる範囲に限った文法とします。これは、XSLT の作成をスムーズに行うためだけでなく、mapping definition を XSL 変換にかける前に、処理系がこれを正しく処理できるかどうか、文法チェックを行うためのものとしても利用できます。

このようにして作成した RELAX NG の構造を保ったまま、以下のような置き換えを行い、 XSLT を完成させていきます。

<element name="a"/>
→ <xsl:foreach select="a"/>
※スキーマ上、a要素は複数出現することはできないが、XSLT はa要素を複数許容してしまうので注意。事前にvaridationではじく方が良い。

<optional>
　<attribute name="@a"/>
</optional>
→ <xsl:if test="@a">出力する文</xsl:if>

<define name="xxx"/> と <ref name="xxx"/> の組
→ <template name="xxx"/> と <call-template name="xxx"/> の組

これにより、以下のような XSLT を作成します。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:ums="http://ums.isas.jaxa.jp/0.4" xmlns:java="http://ums.isas.jaxa.jp/0.4/java">
  <xsl:output method="text"/>
  <xsl:template match="/">
    <xsl:for-each select="ums:grammar">
      <xsl:for-each select="ums:start">
        <xsl:for-each select="java:class"><xsl:text></xsl:text>
          <xsl:if test="@scope">
            <xsl:value-of select="@scope"/>
            <xsl:text> </xsl:text>
          </xsl:if>class <xsl:value-of select="@name"/> {
          <xsl:for-each select="ums:defineVariables">
            <xsl:for-each select="java:var">
              <xsl:choose>
                <xsl:when test="@type">
                  <xsl:value-of select="@type"/>
                </xsl:when>
                <xsl:when test="@class">
                  <xsl:value-of select="@class"/>
                </xsl:when>
              </xsl:choose>
              <xsl:text> </xsl:text>
              <xsl:value-of select="@name"/>;
            </xsl:for-each>
          </xsl:for-each>
}
        </xsl:for-each>
      </xsl:for-each>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

5. 動作確認

作成した XSLT を使用して XSLT 変換を行い、mapping definition からソースコードを作成します。生成されたソースプログラムをコンパイル、実行し、入力データを正しく処理できることを確認します。

Todo List

To do

See http://eda.plain.isas.jaxa.jp/bugzilla for bug tracking.

Following tasks are listed in lower priority.

medium

[code] チェックをしていない、固定長バッファによる処理
[code] List 処理のライブラリをスッキリさせる(epos を Thread に持たせる、pushContainer 等の機能分割)
[code] Interleave 処理のライブラリをスッキリさせる

low

[code] XML version
[code] Support C++
[code] Support Perl
[code] Recursive version
[docs] Support of restriction of output only element
[docs] howto のサンプル作り、第２節書き換え、その他チェック
[code] バイトオーダ、ビットオーダって何？
[code] バイトアラインされていない場合の取り扱い
[code] 配列はあれでよかったのか？
[code] Relax NG文法の継承の記述方法(なんだっけ、これ？)

保留事項

ツールの分際で ums__ あるいは UMS__ という予約語を使うのは如何なものかと。あと、umsCodeGenerator, tableTools の双方が tableTools_init() などという関数名を使っている。命名規約の整理はある段階で必要。
異なる開発者が作成したtypeConversionLibraryのエラー番号は、衝突する可能性があります。
どの例外をユーザ側に戻せば良いか自明でない。
encodingLibrary の XSL において、template 内で param を直接参照すると実行環境により、エラーになることがあります。一度別の変数に代入し、参照すれば大丈夫です。原因は不明なので、現在はこの処理のままにしています。
ant から ant が呼べません(cygwin)。現在は、ant から ant を呼ばないようにしています。

Related Information for usage and development of mappingSchema

SSH

SSH における RSA 認証

Subversion

Subversion によるバージョン管理(Japanese)
Subversion によるバージョン管理(Japanese)

XML Editor

nxml mode in Emacs

Emacs/nXML(Japansese)
nxml-mode(Japanese)

psgml mode in Emacs

Usage of PSGML mode(Japansese)
psgml-mode(Japanese)

XMLspy

Altova
Toshiba Solutions(Japansese)

Others

Sibling of mappingSchema under discussion

Timing

Requirement of a data processor

Design Results of this data processor

Example of Parallel Processing (Variable period processing + constant period processing)

Mail Archive

20040125

xml2fits

Page for XML2FITS Developers and Users

What is XML2FITS

XML2FITS is a configurable format conversion tool from XML format to FITS format with binary extensions (Figure 1). Structure of input data of this tool is specified by an XML schema language -- RELAX NG –and that of output is also specified by a schema described in XML. This tool is configured by a file named Mapping Schema created from the input schema and the output schema.

Figure 1

ADASS2004

Installation of XML2FITS

Installation

.

Required Softwares

Following software is required for usage of the program.

J2SE 1.4.2 (J2SE) (Environment Variable: JAVA_HOME; installation memo)
Apache Ant 1.6 (Environment Variable: ANT_HOME; installation memo)
CFITSIO 2.5 (installation memo)
JUnit 3.8 (installation memo)
Jakarta log4j 1.2 (included in the distribution, no individual install need)
Jakarta Commons Logging 1.0 (included in the distribution, no individual install need)
msv
jing

All of the executable of the software above should be included into the command path (eg. Environment Variable: PATH of shell).

Sample usage of umsCodeGenerator

Sample Files

Schema of Input	xmlfits-input-20040825.rng	Input Data	xmlfits-input-20040825.xml
mapping definition	xmlfits-input-20040825.ums
Schema of Output	xmlfits-input-20040825-fits.ums	Output Data	xmlfits-input-20040825.head(only FITS header)

A mapping definition file can be created from schema of input and schema of output. On the other hand, mapping definition file can be split into schema of input (description of external data) and schema of output (description of interface with program language).

Referrence

FITS

Tutrial in Japanese http://www.fukuoka-edu.ac.jp/~kanamitu/fits/tebiki2/1-gaiyou.html

umsCodeGenerator

mappingSchema

Page for mappingSchema in general

mappingSchema とは？

UMS とは？

mapping definition とは？

Required knowledge

How To

Development

Mailing Lists

文法の設計ポリシー

PDF版ドキュメントの制限事項

Specification of mapping definition

1. mapping definition の仕様

1.1 データ構造の定義

1.2 プログラミング言語の処理の定義

1.2.1 プログラミング言語の処理の定義(XML syntax)

1.2.2 プログラミング言語の処理の定義(Language syntax)

1.3 データ構造とプログラミング言語の処理の対応の定義

1.3.1 データ構造とプログラミング言語の処理の対応の定義(XML syntax)

1.3.2 データ構造とプログラミング言語の処理の対応の定義(Language syntax)

2. RELAX NG との違い? - 2005/06/28追記

2.1 注釈 (外来の属性及び要素の取り扱い) - 2005/07/21追記

2.2 難解な書式 - 2005/08/01更新

3. 制約事項

userGuide

grammar 要素

スキーマのルート要素

属性

xmlns 属性

ns 属性

xmlns:xxxx 属性

子ノード

使用例

例 1:

参考文献

start 要素

XML 文書のルート要素を定義

属性

combine 属性

子ノード

使用例

例 1: ref要素 を用いる方法

例 2: choice要素 を用い、ルート要素を複数指定する方法

例 3: start要素 を複数使用する方法

参考文献

file 要素

出力ファイルを指定する要素

属性

basename 属性

子ノード

使用例

例 1: 1ファイルに出力

例 2: 複数ファイルに出力

例 3: ファイル要素の入れ子

注意事項

include 要素

外部モジュールを取り込む要素

属性

href 属性

子ノード

使用例

例 1: 再定義を含める場合

例 2: 異なる名前空間を有するスキーマの取り込み

参考文献

define 要素

マクロを定義する要素

属性

name 属性

combine 属性

子ノード

使用例

例 1: define要素 と include要素 を用いた例

例 2: 上記と等価なスキーマ

参考文献

ref 要素

マクロを参照する要素

属性

name 属性

ns,xmlns:xxx,datatypeLibrary 属性

例 1: ref要素を用いる方法

例 2: choice要素を用い、ルート要素を複数指定する方法

例 3: start要素を複数使用する方法

例 1: define要素と include要素を用いた例

例 1: externalRef要素を使用した例

例 1: ref要素の場合

例 2: parentRef要素を用いた場合

その 2: empty要素を含んだ interleave要素

その 3: notAllowed要素を含んだ interleave要素