プログラミング基礎 I

第二回 (2006年 5月 1日)

日本語など世界の文字の扱い方

http://www.sw.it.aoyama.ac.jp/2006/PB1/lecture2.html

Martin J. Dürst

duerst@it.aoyama.ac.jp, O 棟 529号室

AGU

© 2006 Martin J. Dürst 青山学院大学

目次

先々週の宿題

自分のパソコンにソフトをインストールする:

先々週の XML の例

<?xml version="1.0" ?>
<Letter date="2006-04-17">
    <to>Students</to>
    <from>Martin</from>
    <Title>Reminder</Title>
    <Text>Please don't forget
        your homework.</Text>
</Letter>

XML 宣言

(XML declaration)

<?xml version="1.0" ?>

文字符号化の指定の場合:

<?xml version="1.0" encoding="文字符号化" ?>

バージョンが 1.0 で、符号化が UTF-8 (又は UTF-16 か別途指定の場合) の場合には XML 宣言が無くてもよい

encoding で指定したものと実際の符号化が合わないといけない!

文字の符号化

(Character encoding)

文字をコンピュータの中で表すやり方が複数ある。このやり方は(文字) 符号化という。

符号化の種類:

括弧内は通称、encoding では必ず正式なラベルを使う (大文字・小文字は問わない)

要素

(element)

例: <to>Students</to>

属性

(attribute)

要素名と属性名

文字を数字で表す

XML では文字符号化と関係なくテクストのところでユニコードのすべての文字を、数字を使って表せる (要素名などを抜く)

書き方:

演習 1: XML 文書に日本語を入れる

演習 2: 特殊文字の追加

演習 3: 文字を数字で表す

演習 4: 要素名、属性名も日本語にする

次回のための準備