Rynek domen

Biznes zaczyna się od domeny.


Paczki homoglifów, czyli dlaczego nie mogę zarejestrować wolnego adresu .eu?

Paczki homoglifów, czyli dlaczego nie mogę zarejestrować wolnego adresu .eu?

Domeny łudząco podobne ułatwiają ataki hakerskie i stanowią potencjalne zagrożenie bezpieczeństwa w internecie. EURid rozwiązuje problem za pomocą tzw. paczek homoglifów.

Homoglif to znak alfanumeryczny, czyli litera lub cyfra, który może być interpretowany na dwa lub więcej sposobów. Tego typu przypadki występują zarówno w obrębie danego alfabetu jaki na styku różnych alfabetów. Najprostsze przykłady z tej pierwszej kategorii to duża litera „O” i cyfra „0” (np. GOOGLE.com vs G00GLE.com) lub duża litera „I” i mała „l”. Mniejsze lub większe podobieństwo może zależeć również od zastosowanej czcionki.

Za homoglify w języku polskim można również uznać litery „z” i „ż” czy „ź” lub „a” i „ą”, które przy odpowiednio małych rozmiarach i w określonych okolicznościach mogą być trudne do rozróżnienia dla odbiorcy. Takie sytuacje często dotyczą adresów internetowych, których nie analizujemy z większą uwagą, ale po prostu na nie wchodzimy.

Łatwe, a nawet łatwiejsze do pomylenia są homoglify pochodzące z różnych alfabetów. Przykładowo cyrylica ma wiele znaków podobnych do znaków alfabetu łacińskiego. Różnią się one jednak kodowaniem w systemie Unicode. Łacińska litera „A” wygląda identycznie jak rosyjskie „A”, ale ich kody są różne (U+0041 vs U+0410). Analogiczne podobieństwa i różnice dotyczą alfabetu greckiego. W efekcie niektóre adresy internetowe z nazwami w różnych alfabetach lub nawet tych samych alfabetach, ale z wykorzystaniem innych, podobnych znaków mogą być mylące dla użytkowników. To sprawia, że bywają chętnie wykorzystywane przez hackerów i phisherów. np. do wyłudzania danych osobowych po ściągnięciu użytkownika na fałszywą stronę.

Tego typu domeny kojarzone są ze sobą przez rejestr EURid i wiązane w tzw. paczki homoglifów. Warto w tym miejscu zaznaczyć, że w domenie .eu nie istnieje możliwość rejestracji nazw złożonych ze znaków różnych alfabetów. Od listopada tego roku przestaną również rozwiązywać greckie nazwy w domenie .eu – dostępne będą wyłącznie nazwy w alfabecie greckim zarejestrowane w .ευ, czyli greckim odpowiedniku unijnej końcówki. Jednak nawet w obrębie danego alfabetu istnieje możliwość rejestracji domen, które są do siebie podobne, np. ze względu na wykorzystanie znaku diakrytycznego.

Paczki homoglifów w rejestrze EURid mają zastosowanie do dwóch rozszerzeń: łacińskiego .eu i greckiego .ευ. Identyczne pod względem wizualnym lub łudząco podobne znaki zostają powiązane w ramach „paczek”, wskutek czego możliwa jest rejestracja tylko jednej domeny z danego zestawu. Zasady te obejmują również znaki, które nie cechują się wyraźnym podobieństwem graficznym. Są to m.in. łacińskie „ß” (znak IDN alfabetu niemieckiego) i „ss” (odpowiednik „ß”), greckie ς (sigma początkowa lub środkowa) i σ (sigma końcowa), greckie α i ἀ ἁ ἂ ἃ ἄ ἅ oraz ᾀ ᾁ ᾂ ᾃ ᾄ ᾅ, a także kilka innych kombinacji. Z informacji na stronie EURid nie wynika, by podobne obostrzenia dotyczyły znaków IDN alfabetu polskiego, jednak – jak wynika z zastrzeżenia poczynionego przez rejestr – podane przykłady stanowią „niewyczerpującą listę” paczkowanych homoglifów, które nie są identyczne.

Domeny, które zostały zarejestrowane przed 6 maja 2015 r., mogą funkcjonować nadal, nawet jeśli zostały zaliczone do tych samych paczek. Jeśli jednak wygasną, ich łączna rejestracja nie będzie możliwa – dopuszczalna będzie aktywacja tylko jednej domeny z danej paczki. Dla pozostałych domen w bazie whois dla końcówki .eu lub .ευ ich status będzie określony jako “homoglyph blocked”. Abonenci domen należących do paczek homoglifów mogą zażądać aktywacji innej domeny z danej paczki, ale w takiej sytuacji „pierwotna” domena zostanie zawieszona.

Mechanizm paczkowania homoglifów to ciekawe rozwiązanie, które znalazłoby zastosowanie w wielu innych rejestrach, ponieważ potencjał do tworzenia myląco podobnych domen jest gigantyczny – szczególnie w domenach gTLD wspierających znaki IDN z rozmaitych alfabetów, jak .com.

Listy znaków IDN dopuszczalnych w poszczególnych rejestrach gTLD, w tym nTLD, można znaleźć w repozytorium IANA: https://www.iana.org/domains/idn-tables

Tagi: , , , , , , ,

Tutaj możesz komentować