Paczki homoglifów, czyli dlaczego nie mogę zarejestrować wolnego adresu .eu?
Domeny łudząco podobne ułatwiają ataki hakerskie i stanowią potencjalne zagrożenie bezpieczeństwa w internecie. EURid rozwiązuje problem za pomocą tzw. paczek homoglifów.
Homoglif to znak alfanumeryczny, czyli litera lub cyfra, który może być interpretowany na dwa lub więcej sposobów. Tego typu przypadki występują zarówno w obrębie danego alfabetu jaki na styku różnych alfabetów. Najprostsze przykłady z tej pierwszej kategorii to duża litera „O” i cyfra „0” (np. GOOGLE.com vs G00GLE.com) lub duża litera „I” i mała „l”. Mniejsze lub większe podobieństwo może zależeć również od zastosowanej czcionki.
Za homoglify w języku polskim można również uznać litery „z” i „ż” czy „ź” lub „a” i „ą”, które przy odpowiednio małych rozmiarach i w określonych okolicznościach mogą być trudne do rozróżnienia dla odbiorcy. Takie sytuacje często dotyczą adresów internetowych, których nie analizujemy z większą uwagą, ale po prostu na nie wchodzimy.
Łatwe, a nawet łatwiejsze do pomylenia są homoglify pochodzące z różnych alfabetów. Przykładowo cyrylica ma wiele znaków podobnych do znaków alfabetu łacińskiego. Różnią się one jednak kodowaniem w systemie Unicode. Łacińska litera „A” wygląda identycznie jak rosyjskie „A”, ale ich kody są różne (U+0041 vs U+0410). Analogiczne podobieństwa i różnice dotyczą alfabetu greckiego. W efekcie niektóre adresy internetowe z nazwami w różnych alfabetach lub nawet tych samych alfabetach, ale z wykorzystaniem innych, podobnych znaków mogą być mylące dla użytkowników. To sprawia, że bywają chętnie wykorzystywane przez hackerów i phisherów. np. do wyłudzania danych osobowych po ściągnięciu użytkownika na fałszywą stronę.
Tego typu domeny kojarzone są ze sobą przez rejestr EURid i wiązane w tzw. paczki homoglifów. Warto w tym miejscu zaznaczyć, że w domenie .eu nie istnieje możliwość rejestracji nazw złożonych ze znaków różnych alfabetów. Od listopada tego roku przestaną również rozwiązywać greckie nazwy w domenie .eu – dostępne będą wyłącznie nazwy w alfabecie greckim zarejestrowane w .ευ, czyli greckim odpowiedniku unijnej końcówki. Jednak nawet w obrębie danego alfabetu istnieje możliwość rejestracji domen, które są do siebie podobne, np. ze względu na wykorzystanie znaku diakrytycznego.
Paczki homoglifów w rejestrze EURid mają zastosowanie do dwóch rozszerzeń: łacińskiego .eu i greckiego .ευ. Identyczne pod względem wizualnym lub łudząco podobne znaki zostają powiązane w ramach „paczek”, wskutek czego możliwa jest rejestracja tylko jednej domeny z danego zestawu. Zasady te obejmują również znaki, które nie cechują się wyraźnym podobieństwem graficznym. Są to m.in. łacińskie „ß” (znak IDN alfabetu niemieckiego) i „ss” (odpowiednik „ß”), greckie ς (sigma początkowa lub środkowa) i σ (sigma końcowa), greckie α i ἀ ἁ ἂ ἃ ἄ ἅ oraz ᾀ ᾁ ᾂ ᾃ ᾄ ᾅ, a także kilka innych kombinacji. Z informacji na stronie EURid nie wynika, by podobne obostrzenia dotyczyły znaków IDN alfabetu polskiego, jednak – jak wynika z zastrzeżenia poczynionego przez rejestr – podane przykłady stanowią „niewyczerpującą listę” paczkowanych homoglifów, które nie są identyczne.
Domeny, które zostały zarejestrowane przed 6 maja 2015 r., mogą funkcjonować nadal, nawet jeśli zostały zaliczone do tych samych paczek. Jeśli jednak wygasną, ich łączna rejestracja nie będzie możliwa – dopuszczalna będzie aktywacja tylko jednej domeny z danej paczki. Dla pozostałych domen w bazie whois dla końcówki .eu lub .ευ ich status będzie określony jako “homoglyph blocked”. Abonenci domen należących do paczek homoglifów mogą zażądać aktywacji innej domeny z danej paczki, ale w takiej sytuacji „pierwotna” domena zostanie zawieszona.
Mechanizm paczkowania homoglifów to ciekawe rozwiązanie, które znalazłoby zastosowanie w wielu innych rejestrach, ponieważ potencjał do tworzenia myląco podobnych domen jest gigantyczny – szczególnie w domenach gTLD wspierających znaki IDN z rozmaitych alfabetów, jak .com.
Listy znaków IDN dopuszczalnych w poszczególnych rejestrach gTLD, w tym nTLD, można znaleźć w repozytorium IANA: https://www.iana.org/domains/idn-tables
Tagi: .eu, .ευ, cyrylica, EURid, hacking, homoglif, homoglify, typosquatting