差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
programming:バイトオーダーの変換_バイトスワップ [2013-04-09 11:39] Decomo Page moved from プログラミング:programming:programming:バイトオーダーの変換_バイトスワップ to programming:バイトオーダーの変換_バイトスワップ |
programming:バイトオーダーの変換_バイトスワップ [2021-03-05 09:32] (現在) Decomo |
||
---|---|---|---|
行 5: | 行 5: | ||
バイナリデータを扱うプログラムを書く上で、避けて通る事の出来ないバイトオーダーの問題。 | バイナリデータを扱うプログラムを書く上で、避けて通る事の出来ないバイトオーダーの問題。 | ||
- | 結構頻出な問題だと思うのだが、軽くググってみただけではまとまった解説が見つからなかったので、自分用も兼ねてここにまとめて見る。 | + | それなりに頻出問題だと思うのだが、軽くググってみただけではまとまった解説が見つからなかった。自分用も兼ねてここにまとめて見る。 |
===== バイトオーダーとは何ぞや ===== | ===== バイトオーダーとは何ぞや ===== | ||
- | バイトオーダーとは、多バイトデータをメモリに格納する際の配置方法の種類のことで、エンディアンやエンディアンネスとも呼ばれる。 | ||
- | バイトオーダーはコンピュータシステムごとに異なり、現在ではx86系などで使用される**リトルエンディアン(LE)**と、PowerPC((ビッグエンディアンなのはG5のみ。G4まではバイエンディアン。))/ | + | バイトオーダーとは多バイトデータのメモリへの配置順のことで、エンディアンやエンディアンネスとも呼ばれる。 |
- | 例えば「0x1234CDEF」という32bitの数値のメモリ配置は、LE/BEでそれぞれ以下のようになる。 | + | バイトオーダーはコンピュータシステムごとに異なり、現在では、x86系などで使用される**リトルエンディアン(LE)**と、PowerPC((ビッグエンディアンなのはG5のみ。G4まではバイエンディアン。))/MC68000/ |
- | ^メモリ番地 ^LE ^BE | | + | 例えば「0x< |
- | | 0000 | EF | | + | |
- | | 0001 | CD | | + | |
- | | 0002 | 34 | | + | |
- | | 0003 | 12 | | + | |
- | LEの方はデータの下位バイトから、BEはデータの上位バイトから、それぞれメモリに順次格納する。人間から見ればBEの方が分かりやすいが、コンピュータ的にはLEの方が処理しやすいらしい。 | + | ^ 番地 |
+ | |0000|< | ||
+ | |0001|< | ||
+ | |0002|< | ||
+ | |0003|< | ||
+ | |||
+ | リトルエンディアンはデータの下位バイト、ビッグエンディアンはデータの上位バイトから、それぞれメモリの下位番地より順次配置される。人間から見ればビッグエンディアンの方が分かりやすいが、コンピュータ的にはリトルエンディアンの方が都合がいいらしい。また、データの下位バイトをメモリの下位番地に配置する、という意味ではリトルエンディアンの方が理にかなっているとも考えられる。 | ||
===== バイトオーダーの違いによる問題 ===== | ===== バイトオーダーの違いによる問題 ===== | ||
- | ここで上表のLEのメモリ番地0000〜0003の内容をそのままファイルに書き出したとしよう(つまりはデータの保存)。ファイルの内容は「EFCD3412」となるはずだ。 | ||
- | 次に、そのファイルからメモリの状態を復元する事を考える(データの読み込み)。 | + | ではここで、データの保存について考えてみる。データの保存とは、とどのつまりメモリの内容をファイルに書き出すことである。 |
- | ファイル内容をそっくりメモリに展開すると、番地0000から上位番地へ向かって EF CD 34 12 の順で書き込まれる。このメモリ内容は、LE環境ならば元のデータ**0x1234CDEF**となるが、BE環境だと**0xEFCD3412**と解釈され保存した値とは違う値に化けてしまう。 | + | 0x1234CDEFの例でいえば、メモリ番地0000~0003をファイルに書き出すことになり、リトルエンディアン環境ではファイルの内容は「EFCD3412」となる。 |
+ | |||
+ | 次に、そのファイルからメモリの状態を復元、つまりデータの読み込みを考える。 | ||
+ | |||
+ | ファイル内容を先頭から順にメモリに展開すると、番地0000から上位番地へ向かって EF CD 34 12 の順で配置される。このメモリ内容は、リトルエンディアン環境ならば**0x1234CDEF**と正しく解釈される一方、ビッグエンディアン環境では**0xEFCD3412**と解釈され元の値とは異なってしまう。 | ||
このように、データ保存環境のエンディアンとデータ読込環境のエンディアンが異なれば、保存時に意図したデータとは異なるデータになってしまう。これでは宜しくない。 | このように、データ保存環境のエンディアンとデータ読込環境のエンディアンが異なれば、保存時に意図したデータとは異なるデータになってしまう。これでは宜しくない。 | ||
===== バイトスワップ ===== | ===== バイトスワップ ===== | ||
+ | |||
異なるエンディアンで保存されたデータを正しく読み込むには、データの並び順を変えてやらなければならない。これがバイトスワップである。 | 異なるエンディアンで保存されたデータを正しく読み込むには、データの並び順を変えてやらなければならない。これがバイトスワップである。 | ||
行 42: | 行 47: | ||
という処理を施せばよい。 | という処理を施せばよい。 | ||
- | |||
- | 通常はメモリ上のデータのエンディアンを入れ替える | ||
この処理を行うC言語のマクロは、以下のようになる。一応、1バイト = 8ビットが前提の実装となっているが、それ以外の環境に触れている方はこのページを読まないと思うので気にしない事にする。 | この処理を行うC言語のマクロは、以下のようになる。一応、1バイト = 8ビットが前提の実装となっているが、それ以外の環境に触れている方はこのページを読まないと思うので気にしない事にする。 |