De A a Z, as letras que você lê neste momento fazem parte da versão moderna do alfabeto latino. Quando postas de certa maneira, elas significam palavras – o que é óbvio para você, mas não para o seu computador.
Para ele, elas não passam de números, conjuntos de códigos que ele transforma em um símbolo que você reconhece. No engatinhar da computação, isso gerava certo caos: um programador podia atribuir um código para uma letra, enquanto outro poderia usar esse mesmo código para outra letra – ou um número, ou um símbolo, ou um caractere de um alfabeto completamente diferente.
Seria desastroso se sua mensagem fosse lida por outro computador de um jeito diferente, com letras ou símbolos trocados. Pior ainda seria se ele não fosse compatível com o seu alfabeto, e simplesmente não mostrasse nada. Surgiu, então, a necessidade de se padronizar a codificação dos caracteres, para que não houvesse confusão, e que todos os alfabetos e sinais fossem contemplados.
O primeiro padrão Unicode surgiu em outubro de 1991, e continha informações sobre propriedade e mapeamento de cerca de 7 mil caracteres de 23 sistemas de escrita diferentes, como o alfabeto latino, cirílico, árabe, grego e o Hiragana e Katakana japoneses. Mais de trinta anos se passaram, e a versão 15.0 do Unicode, de setembro de 2022, conta com quase 150 mil caracteres – desde letras e símbolos de alfabetos ao redor do mundo até sinais gráficos e símbolos matemáticos. Se você quiser se aventurar pelas mais de 2.500 páginas da lista oficial, pode acessar o documento aqui.
Por trás da padronização está o Consórcio Unicode (“Unicode Consortium”, em inglês), uma organização sem fins lucrativos dedicada ao “desenvolvimento, manutenção e promoção de padrões e dados de internacionalização de software”. Entre os atuais membros estão algumas das maiores empresas de tecnologia, como Google, Apple, Meta e Microsoft, além de outras conhecidas como Spotify, Adobe e Netflix.
“Quando o Consórcio começou, a troca de textos entre computadores e programas era propensa a erros, complexa e às vezes impossível. As representações eram muitas vezes incompatíveis: os usuários frequentemente viam caracteres incorretos aleatórios em suas telas, e os idiomas de uma grande porcentagem do globo não podiam ser representados em computadores”, afirma a organização. “O Consórcio foi fundado para resolver este problema: fornecer uma maneira única e consistente de representar cada letra e símbolo necessário para todas as línguas humanas em todos os computadores e dispositivos.”
É por causa do padrão Unicode que você consegue ver isso: 🍦. Ou isso: ニ. Ou isso: ⠎. Ou isso: ඞ. E, se não consegue, é porque não está na versão mais atualizada do padrão ou a fonte do sistema não tem esse símbolo – esse é um problema contornável, já que muitos programas são capazes de alterar a fonte para uma que suporte o caractere. O Unicode também é quem aprova novos emojis (para ver mais sobre eles em específico, confira nessa matéria da Super).
Como dito anteriormente, cada letrinha tem um código. Um “S” é U+0053, enquanto um “s” é U+0073. Os símbolos usados de exemplo são, respectivamente, U+1F366, U+30CB, U+280E e U+0D9E. Existem muitos outros, como hieróglifos egípcios, escrita cuneiforme, o alfabeto cherokee, sinais de xadrez, símbolos e setas diversos, que podem ser lidos por sistemas atualizados. Você pode conferir uma lista mais amigável do que o arquivo oficial aqui.
A nova cara do Twitter
Um símbolo específico ganhou fama inesperada do dia para a noite. O caractere Unicode U+1D54F passou a estampar a página oficial do Twitter, agora sob o domínio e comando de Elon Musk. Quando ele pediu que seguidores enviassem sugestões para um novo logo do site, que substituísse o passarinho azul por um X, Sawyer Merritt sugeriu um 𝕏.
E Musk gostou. Agora, esse é o novo símbolo da rede. O logo veio do podcast produzido por Merritt e seus colegas, o 𝕏 Pod, que se dedicavam a falar sobre a vida e a obra de Elon Musk. Eles preferiram uma versão “estilizada” do que uma simples letra “chata e sem graça”, então optaram pelo caractere da seção de Símbolos Alfanuméricos Matemáticos. O que era uma referência ao costume do bilionário de nomear produtos, empresas e filhos com a letra “x”, acabou servindo como uma “inspiração” para o novo visual do Twitter.
Fonte: abril