無料体験

【情報Ⅰ#83】高校情報で学ぶ「データの圧縮」とは?|情報1の授業動画【高校・共通テスト対策】データの圧縮率・効率化

  • 前回は、文字のデジタル表現についてお話ししました。 コンピュータ上で文字を扱うときに用いられる、文字に対応づけられた番号のことを「文字コード」と言います。 世界には様々な文字コードができましたが、文字化けが起こりにくく多国籍に対応した世界統一の文字コードができ、その総称を「Unicode」と言うとお話ししましたね。 さて本日は、データの圧縮について詳しく解説していきますよ。

①圧縮と展開

  • これまで習った通り、画像や動画、音声、文字は沢山の情報でできています。それらの情報の余分な部分を減らして、全体の情報量を小さくすることを圧縮と言います。 例えると、布団圧縮袋が分かりやすいでしょう。 布団圧縮袋を利用することで、布団を使わないときはコンパクトに収納することができ、またそれを元の状態の布団に戻すことも可能です。 デジタルでは、コンパクトにすることを「圧縮」、元に戻すことを、「展開」や「解凍」、もしくは「伸張」と言いますので、この言い方も覚えておきましょう。 また、どのくらい余分な情報を減らしたのかを示す数値として、圧縮率というものがあります。 この圧縮率の計算式はこちらです。
    圧縮率=圧縮後のデータ量/圧縮前のデータ量
    例えば、8MBのデータを圧縮して、2MBとなった場合の圧縮率は、25%ということになります。

②可逆圧縮と非可逆圧縮

  • データを圧縮した後に、圧縮前のデータに戻すことができる圧縮を「可逆圧縮」と言うのに対し、圧縮前のデータに戻すことができない圧縮を「非可逆圧縮」と言います。
  • えっ!なにそれ!戻せないなら意味ないじゃん!
  • 先程の布団圧縮袋の場合、圧縮したままの布団では使い物になりません。 一方で、リサイクルで使う空き缶は、一旦潰してしまうと元の形には戻せませんよね? ただ、空き缶に関しては、缶の原料の金属を取り出すことが目的なので、元の形に戻せなくても問題ないわけです。 デジタルも一緒で、利用用途に応じて、元に戻せないと困る場合と、戻せなくても問題ない場合があり、それに応じて使い分けをしているのです。
  • なるほどね。
  • 文字やプログラミングコード、画像などを圧縮する際には可逆圧縮がよく利用されます。 文字やプログラミングコードを使わないときは圧縮しておき、それを読んだり、プログラム実行する際に展開することで、使わないときは容量を削減することができます。まさしく布団圧縮袋のようなものですね。 また、複数のファイルを一つにまとめてコンパクトにするZIP形式の圧縮、あれも可逆圧縮の一つです。 ZIP形式にすることで、データの送受信をスムーズに行うことができますし、受け取る側も無駄な通信容量を使わなくて済みますので、非常に便利です。

③圧縮のファイル形式

  • 画像や音声、動画では様々な圧縮の方式があり、それを識別するために専用の拡張子が付けられています。 順番に紹介していきましょう。まずは画像からです。
  • ■JPEG(ジェイペグ)拡張子:.jpg または .jpeg
    約1,677万色のフルカラーを表現できる非可逆圧縮方式のファイル形式です。主に写真に利用されていて、スマホのカメラやデジカメで撮影するとJPEG形式で保存されることがほとんどです。
    また、透過処理ができないため、jpegに変換すると、透明色の部分は白色になります。
    ここで画像をjpegにすることで、どのくらい圧縮できるのか、例を挙げてご紹介します。
    左が圧縮する前の画像です。この画像をビットマップ画像と呼び、拡張子は.bmpが使われます。
    右がその画像をjpegに変換した画像です。いかがでしょうか?2つの画像の違いは見た目ではほぼ分かりませんよね?
    一方で、画像サイズは90KBと900KBとなっており、10%に圧縮できていることがお分かりいただけるかと思います。

    ■GIF(ジフ)拡張子:.gif
    色数が256色なので、表現できる色数は少ないですが、圧縮率が高いことが特徴です。ですので、Webバナーやロゴなどに使われます。また、複数の画像を1ファイルにまとめ、パラパラ漫画のようにアニメーションにすることができるという特徴も持ち合わせています。また、背景に透明色を設定することも可能です。

    ■PNG(ピング)拡張子:.png
    約1,677万色のフルカラーを表現できる圧縮方式のファイル形式です。最大の特徴は可逆圧縮であるため、圧縮後に元の状態に戻してまた編集してから圧縮するといったことが可能です。またgifと同様に透明色を設定することも可能です。
  • 次は、音声や動画です。
    ■MP3(エムピースリー)拡張子:mp3
    国際標準規格であるMPEG(エムペグ)の音声専用のファイル形式のことです。音声専用のファイル形式がMPEG3なので、それを略してMP3と呼んでいます。
    情報量が多い動画や高解像度動画を格納することが可能です。
    MP3プレーヤーを持っていたり、知っているという方も多いかと思いますが、本来容量が多くなる音声データを効率良く圧縮できるため、MP3の誕生とともに、インターネットで音楽をダウンロードするという文化が広まりました。

    ■MP4(エムピーフォー)拡張子:mp4
    MPEGの動画専用のファイル形式がMPEG4、それを略してMP4と呼んでいます。
    このYouTube上の動画もmp4形式で保管されています。
    音声と同様に、本来容量が多くなる動画データを効率良く圧縮できるため、MP4の誕生により、インターネットで動画を視聴するという文化が広まりました。
    さて、今回ご紹介したファイル形式を、動画内でマトリクス表にまとめました。これでもほんの一部の形式ですが、まずはこれらのファイル形式や特徴などをしっかりとおさえておいてください。

まとめ

  1. デジタルデータの余分な情報を減らして、全体の情報量を小さくすることを圧縮と言い、圧縮したデータを元に戻すことを展開や解凍、伸張と言う。
  2. 圧縮前のデータに戻すことができる圧縮を「可逆圧縮」と言うのに対し、圧縮前のデータに戻すことができない圧縮を「非可逆圧縮」と言う。
  3. 画像や音声、動画では様々な圧縮の方式があり、用途によって使い分けられている。