プログラミング基礎 I

第二回 (2012年 4月16日)

XML の部品、日本語など世界の文字の扱い方

http://www.sw.it.aoyama.ac.jp/2012/PB1/lecture2.html

Martin J. Dürst

AGU

© 2006-12 Martin J. Dürst 青山学院大学

今日の予定

先週からの準備と宿題

先週の XML の例

<?xml version="1.0" ?>
<Letter date="2012-04-09">
    <to>Students</to>
    <from>Martin</from>
    <Title>Reminder</Title>
    <Text>Please don't forget
        your homework.</Text>
</Letter>

XML の主な部品

XML の部品: 要素

(element)

例: <to>Students</to>

要素の例の分解:

要素:
<Title>Reminder</Title>
開始タグ:
<Title>
終了タグ:
</Title>
要素名:
Title
内容:
Reminder

要素の入れ子構造

XML の部品: 属性

(attribute)

属性の例の分解:

要素の開始タグ:
<Letter date="2012-04-09">
属性:
date="2012-04-09"
属性名:
date
属性値:
2012-04-09

空の要素の書き方

要素に内容がない場合、
<example></example>
<example/> に省略可能

属性がある場合:

<example type='simple'></example>
<example type='simple' />

要素名と属性名

少々長くても分かりやすい名前がとても大事

XML 宣言

(XML declaration)

<?xml version="1.0"?>

文字符号化の指定の場合:

<?xml version="1.0" encoding="文字符号化" ?>

encoding指定したものと実際の符号化が合わないといけない!

(バージョンが 1.0 で、符号化が UTF-8 (又は UTF-16 か別途指定) の場合には XML 宣言が無くてもよい)

(綴りに注意: encording)

文字コード

(Character encoding)

文字符号化の種類

文字を数字で表す

XML では文字符号化と関係なくテキスト (要素の内容と属性値) でユニコードのすべての文字を、数字を使って表せる (要素名などを抜く)

書き方:

文字コードの関係

文字コード 対応するエディター 使える文字 使えない文字
US-ASCII メモ帳、notepad2 abc..., ABC..., 123... その他の多くの文字
UTF-8 メモ帳、notepad2 世界「すべて」の文字 一部の歴史的な文字
Shift_JIS メモ帳 (最新の notepad2) 漢字第一、第二水準など ü など日本語以外の文字

演習

注 1: 1 から 5 までの演習が段階的に進む

注 2: 途中経過 (エラーを含む) をよく確認する

  1. メモ帳で XML 文書に日本語を入れる
  2. 特殊文字の追加
  3. 文字を数字で表す
  4. 要素名、属性名も日本語にする
  5. 演習結果の確認と Moodle へのアップロード

演習 1: XML 文書に日本語を入れる

演習 2: 特殊文字の追加

演習 3: 文字を数字で表す

演習 4: 要素名、属性名も日本語にする

演習問題・宿題のアップロード

締切: 2012 年 4月 20日 (金曜日) 22:00

提出方法: Moodle にアップロード

確認点:

次回のための準備