Quando i caratteri Unicode possono rendere la vita difficile

Alcuni caratteri Unicode possono dare del filo da torcere, causando bug, artefatti di visualizzazione o addirittura essere dannosi.

Avatar di Fabio Meazza

a cura di Fabio Meazza

Vi è mai capitato di vedere degli strani caratteri invadere l’interfaccia utente navigando su Twitter, Gmail o Youtube? Bleeping Computer ha fronteggiato questo singolare fenomeno durante i giorni scorsi. Infatti, sulla home del profilo Twitter, sono comparsi dei simboli al di sopra del nickname visualizzato di un utente, che occupavano lo spazio superiore e sovrascrivevano le porzioni di testo formattato.

In questo caso specifico, l’origine del fenomeno è attribuibile a un carattere Unicode dell’alfabeto arabo ("ە" - Unicode+06D5) e contenuto nel nickname di Hylejam (defconisov3r), un ricercatore sulla sicurezza. Interpellato da Bleeping Computer, ha riferito di aver inviato un bug report a Twitter che, tuttavia, ha liquidato la questione richiedendo un proof of concept.

È verosimile che questa stranezza sia causata, anche se non esclusivamente, dall’ordine inverso di scrittura dell’alfabeto arabo; sempre Hylejam, infatti, ha dichiarato che oltre alle “invasioni” descritte sopra, durante la scrittura il comportamento del backspace è imprevisto in presenza di emoji.

Effettuando verifiche con l’utente si è riscontrato che fenomeni analoghi sono riscontrabili anche in Gmail, a seguito di uno scambio di DM.

In realtà, esistono molti altri caratteri in grado di alterare i contenuti o di generare imprevisti. Ad esempio quando i dispositivi Apple sono stati messi alla prova da un carattere dell’alfabeto indiano, che causava freeze e/o riavvii, o un bug nel rendering testuale di WhatsApp che portava al crash dei dispositivi qualora ricevessero il famoso messaggio con l’emoji di un cerchio nero.

L’utente Loseshape ha dimostrato su Reddit come sia possibile scrivere “al contrario” sulla chat di una diretta Youtube, ponendo il carattere RLO (Right to Left Override) nel nickname.

Tale carattere può essere usato anche da malintenzionati per diffondere minacce sotto forma di immagini o file dall’estensione innocua.

Che i caratteri Unicode possano causare problemi non è comunque una novità, già nel 2015 Mozilla fu costretta a rilasciare una correzione di Firefox per un bug causato da un carattere che, se presente, “scoloriva” le emoji.

Considerato che, secondo StackOverflow, i caratteri Unicode attualmente in uso sono solo il 10% degli oltre 1.1 milioni possibili, è quasi certo che in futuro si verifichino nuovamente problematiche causate da caratteri atipici o speciali; di certo è e sarà un’ottima sfida offrire un supporto multilingue di livello per un pubblico più esteso possibile, con la consapevolezza che i set di caratteri possono comportarsi in modo inaspettato a seconda dell’ambiente o dell’interfaccia in uso.

Se cercate un ottimo smartphone a un ottimo prezzo, date un'occhiata al Redmi Note 8T su Amazon.