なぜ英語の文字は、他のアルファベットの文字よりも少ない文字バイトを表現する必要がありますか?

私たちのほとんどはおそらくそれについて考えることをやめたことはありませんが、アルファベット文字はそれらを表現するのに必要なバイト数ですべて同じサイズではありません。しかし、それはなぜですか?今日のスーパーユーザQ&Aの投稿には、興味深い読者の質問に対する回答があります。

今日の質疑応答セッションは、Q&Aウェブサイトのコミュニティ主導型のグループである、スタック交換の細分化であるスーパーユーザーからの礼儀です。

ウィキペディアの部分ASCIIチャートスクリーンショット

スーパーユーザの読者khajvahは、保存時に異なるアルファベットが異なる量のディスク容量を占める理由を知りたい

テキストファイルに ‘a’を入れて保存すると、2バイトのサイズになります。しかし、「ա」(アルメニア語アルファベットの手紙)のような文字を入れると、3バイトのサイズになります。

コンピュータ上のアルファベットの違いは何ですか?保存すると英語のスペースが少なくなるのはなぜですか?

手紙は手紙ですよね?そうでないかもしれない!このアルファベットの謎に対する答えは何ですか?

スーパーユーザの投稿者Doktoro Reichardとernieが私たちの答えを持っています。最初に、Doktoro Reichard

主流のコンピュータで使用するために開発される最初のコード化スキームの1つは、ASCII(American Standard Code for Information Interchange)標準です。それは1960年代に米国で開発されました。

英語のアルファベットはラテンアルファベットの一部を使用しています(たとえば、英語ではアクセントのついた単語がほとんどありません)。そのアルファベットには26の個別の文字があり、大文字と小文字は区別されません。また、英語のアルファベットをエンコードするふりをするスキームには、個々の数字と句読点が存在する必要があります。

1960年代は、コンピュータのメモリ容量やディスク容量が今まではなくなった時代でもありました。 ASCIIは、すべてのアメリカのコンピュータで機能的なアルファベットを標準的に表現するために開発されました。当時、すべてのASCII文字を8ビット(1バイト)長さにするという決定は、時間の技術的詳細のために行われました(Wikipediaの記事では、穴あきテープが一度に8ビットの位置に保持されていたということを言及しています)。実際、元のASCII方式は7ビットを使用して送信でき、8ビットはパリティチェックに使用できます。後の開発では、元のASCIIスキームを拡張して、アクセント付き、数学的、ターミナル文字をいくつか追加しました。

近年のコンピュータ使用量の世界的な増加に伴い、異なる言語の人々がコンピュータにアクセスしています。これは、各言語について、異なる言語端末から読み取った場合に衝突する、他の方式とは独立して新しい符号化方式を開発しなければならないことを意味する。

ユニコードは、可能性のあるすべての意味のある文字を単一の抽象的な文字セットにマージすることによって、異なる端末の存在に対する解決策になった。

UTF-8は、Unicode文字セットをエンコードする1つの方法です。これは可変幅のエンコーディングです(つまり、異なる文字のサイズが異なる可能性があります)。以前のASCIIスキームとの下位互換性を考慮して設計されています。そのため、ASCII文字セットは1バイトのまま残り、他の文字は2バイト以上のサイズになります。 UTF-16は、Unicode文字セットをエンコードする別の方法です。 UTF-8と比較して、文字は1つまたは2つの16ビットコード単位のセットとしてエンコードされます。

他のコメントで述べたように、 ‘a’文字は1バイトを占め、 ‘ա’は2バイトを占め、UTF-8エンコーディングを表します。元の質問の余分なバイトは、最後に改行文字が存在するためでした。

エニーの答えが続く

1バイトは8ビットなので、最大256(2 ^ 8)の異なる値を表すことができます。

これ以上の可能性のある言語では、単純な1対1のマッピングを維持できないため、文字を格納するためにより多くのデータが必要です。

一般的に、ほとんどのエンコーディングはASCII文字の最初の7ビット(128値)を使用します。これにより、8番目のビット、または128個以上の文字が残ります。アクセント付き文字、アジア言語、キリル文字などを追加すると、すべての文字を保持するには1バイトでは不十分な理由が簡単に分かります。

説明に追加するものがありますか?コメントの音がする。他の技術に精通したStack Exchangeユーザーからの回答をもっとたくさん読んでみたいですか?ディスカッションスレッド全体をチェックしてください。

大学と夏の定番の定番であるJell-Oのショットは、数学者のTom Lehrerによって1950年代の軍事訓練の際にベースクリスマスパーティーで酒の制限を回避する方法として考案されました。