Um byte, é um dos tipos de dados integrais em computação. É usado com frequência para especificar o tamanho ou quantidade da memória ou da capacidade de armazenamento de um certo dispositivo, independentemente do tipo de dados. Cada uma dessas unidades de informação que implicam uma escolha é chamada de dígito binário, ou, no original inglês, binary digit, ou simplesmente bit, a menor unidade geradora de informações e escolhas em um sistema.[1]
A codificação comum de byte é de 8 bits, embora possa ter outras quantidades, como 7. O byte de 8 bits é mais corretamente chamado de octeto no contexto de redes de computadores e telecomunicações. A uma metade de um byte (4 bits) dá-se o nome de nibble ou semioctecto. Há também notações utilizadas para programações de microprocessadores e microcontroladores como[2]: Word (2 bytes, ou 16 bits), Doubleword (4 bytes, ou 32 bits) e Quadword (8 bytes, ou 64 bits).
Note que um byte nada tem de especial, é apenas um número binário de oito algarismos. Sua adoção na informática deriva do motivo histórico do código ASCII haver adotado números de oito bits, além de razões meramente construtivas ou operacionais. Por exemplo: os códigos enviados a impressoras para controlar a impressão têm oito bits, os valores trocados pelos modems entre computadores também, assim como diversas outras operações elementares de intercâmbio de informações. Além disso, memórias costumam ser organizadas de tal forma que as operações de leitura e escrita são feitas com quantidades de um byte ou de um múltiplo de bits (oito, dezesseis, trinta e dois, sessenta e quatro ou cento e vinte e oito bits – o que corresponde a um, dois, quatro, oito e dezesseis bytes, respectivamente).
Segundo norma da IEC, lançada em 2000, foi definida uma nova nomenclatura para dados de base dois em substituição à nomenclatura usada erroneamente de base dez reparando a confusão causada entre proporção 1:1000 ou 1:1024, veja mais em prefixos binários.
História
No início da computação chegou-se a utilizar 1 byte = 6 bits no código BCD pois com seis bits (64 caracteres) era possível representar todo o alfabeto alfanumérico A-Z, 0-9 além de alguns caracteres especiais. Em terminais e impressoras teletipo (TTY), conectados através de interfaces seriais com o computador central, também usou-se uma variante na comunicação de dados onde 1 byte = 7 bits e ainda hoje é possível configurar uma interface RS232 para operar em 7 bits de dados. A transcodificação BASE64 usada até hoje em documentos MIME na Internet[3][4] reflete a dificuldade passada de comunicação de dados em 8 bits entre diferentes computadores. A primeira codificação de 1 byte = 8 bits deve-se à IBM com a criação do código EBCDIC em 1960. A partir do sucesso dos computadores IBM, padronizou-se que 1 byte = 8 bits, surgindo também o código ASCII de 8 bits em 1961. A representação dos caracteres nos computadores atuais ganharam uma nova dimensão: os padrões EBCDIC (já em desuso há um bom tempo) e ASCII estão sendo substituídos pelos códigos UNICODE UTF, UTF-16 e UTF-32 que podem demandar 1 byte, 2 bytes e até 4 bytes para representar uma letra do alfabeto a fim de acomodar as escritas em línguas mundiais.
De acordo com Martino (2014), cada letra de uma palavra é uma unidade mínima de informação, assim como o byte é formado por números binários que combinados geram elementos novos e como consequência, comunicação entre sistemas.
Para exemplificar, tomamos o detector[5] de fumaça, um equipamento de simples instalação, mas de grande importância. Ele funciona detectando a presença de fumaça em certo ambiente, que pode ser originada de um início de incêndio. Após o contato do aparelho com a fumaça, aciona-se um sistema de alarme, que indica para as pessoas sobre o incidente, permitindo evitar maiores danos à vida e ao patrimônio.
Portanto, só existem duas formas de o detector de incêndio funcionar: quando há fumaça e quando não há fumaça, ou seja, sim ou não. Desse modo, ocorre também com o sistema binário, no qual dois números, combinados de várias formas, geram novas informações.
↑INTEL (1999). Data Types and Addressing Modes(PDF). The Intel Architecture Software Developer’s Manual. [S.l.]: Intel. pp. 29 – 505. Consultado em 3 de março de 2020