http://www.sw.it.aoyama.ac.jp/2012/PB1/lecture2.html
© 2006-12 Martin J. Dürst 青山学院大学
<?xml version="1.0" ?> <Letter date="2012-04-09"> <to>Students</to> <from>Martin</from> <Title>Reminder</Title> <Text>Please don't forget your homework.</Text> </Letter>
(element)
例: <to>Students</to>
<to>
)
で始まり、「終了タグ」(end tag, </to>
)
で終わる<
で始まり、>
で終わる</
で始まり、>
で終わるto
) がある<to>Students</from>
)Students
) がある<Title>Reminder</Title>
<Title>
</Title>
Title
Reminder
<i>abc<b>def</i>ghi</b>
良い例:
<p>abc<s>def</s>ghi</p>
<Letter date="2012-04-09">
date
) と属性値 (attribute
value, 2012-04-09
) の間に「=
」が入る"
」もしくは「'
」で囲むdate='2012-04-09'
又は
date="2012-04-09"
date="2012-04-09'
、date='2012-04-09"
、date=2012-04-09
<Letter date="2012-04-09">
date="2012-04-09"
date
2012-04-09
要素に内容がない場合、
<example></example>
は
<example/>
に省略可能
属性がある場合:
<example type='simple'></example>
⇒ <example type='simple' />
<to>Students</To>
)少々長くても分かりやすい名前がとても大事
<?xml version="1.0"?>
文字符号化の指定の場合:
<?xml version="1.0"
encoding="
文字符号化" ?>
encoding
で指定したものと実際の符号化が合わないといけない!
(バージョンが 1.0 で、符号化が UTF-8 (又は UTF-16 か別途指定) の場合には XML 宣言が無くてもよい)
(綴りに注意: encording)
(Character encoding)
encoding
では必ず正式なラベルを使用
(大文字・小文字は問わない)US-ASCII
:
ローマ字と一部の特殊文字だけ。ほぼ世界全体で使用Shift_JIS
(シフト JIS、SJIS): PC や MacIntosh
で伝統的な日本語用の符号化EUC-JP
(EUC): UNIX/Linux
などで伝統的な日本語用の符号化iso-2022-jp
(JIS):
電子メールなどで伝統的に使われている日本語用の符号化UTF-8
: ユニコードに基づく世界の文字を
(ほぼ) すべて扱える符号化; US-ASCII と互換UTF-16
: UTF-8 と似ているが、US-ASCII
と互換でないXML では文字符号化と関係なくテキスト (要素の内容と属性値) でユニコードのすべての文字を、数字を使って表せる (要素名などを抜く)
書き方:
ꯍ
〹
;
&#x
の x
は小文字でないといけない (正: ꯍ
, 誤:
ꯍ
)&
そのものは &
で表す。他に <
(<
),
>
(>
), '
('
), "
("
) がある文字コード | 対応するエディター | 使える文字 | 使えない文字 |
US-ASCII |
メモ帳、notepad2 | abc..., ABC..., 123... | その他の多くの文字 |
UTF-8 |
メモ帳、notepad2 | 世界「すべて」の文字 | 一部の歴史的な文字 |
Shift_JIS |
メモ帳 (最新の notepad2) | 漢字第一、第二水準など | ü など日本語以外の文字 |
注 1: 1 から 5 までの演習が段階的に進む
注 2: 途中経過 (エラーを含む) をよく確認する
<?xml version="1.0" encoding="shift_jis"?>
<from>
要素の内容を「Martin J.
Dürst」に変更する (ヒント: 名前の書き方の「MS
IME」参照).xml
に)<?xml version="1.0" encoding="UTF-8" ?>
<to>
要素の内容を「Students」から自分の名前に変更U+ABCD
などの番号が出る。これを
ꯍ
として XML 文書に入れる)<from>
の内容以外)
を日本語にする締切: 2012 年 4月 20日 (金曜日) 22:00
提出方法: Moodle にアップロード
確認点:
<to>
に相当する要素の内容が数字で表した自分の名前<from>
に相当する要素の内容が「Martin J.
Dürst」