ну на этом графике как минимум не показано пользователи из каких стран используют эти кодировки)
сайты рассчитанные на европейцев и сша делать в юникоде по меньшей мере не оправданно, т.к. размер страниц увеличивается в 4 раза ... вот форум ... страница в среднем 100 кб ... а в юникоде 400 ... есть разница?)
особенно для пользователей с лимитированным трафиком)
потом, это Web ... а мы говорим про имена файлов ... ОС должна уметь поддерживать имена с юникоде тогда, это увеличивает файловую таблицу и приводит к ряду несовместимостей со старым ПО, например ...
не очень это как-то звучит)
Этот график - выжимка из всех проиндексированных сайтов Google, сказать что это весь интернет нельзя, но это точно львиная его доля во всех странах. Собственно на нем очень хорошо видно, что в основном как раз сша и переходят на тот же юникод, ибо со временем должен только юникод и остаться. Везде.
Размер страницы не будет увеличен в 4 раза, а максимум в два, при использовании utf-16 и лишь в 1,2 при использовании utf-8 (увеличивается все что после 127 символа, а это только русские символы). В итоге увеличение как видно не такое уж и большое, а все эти громадные 4-6 байт на символ - для языков которые мы с вами скорее всего даже и не увидим в своей жизни.
И кстати, такая заточка на юникоде, это бзик яблочников, причем ни чем не обоснованный. Так как нормальные никсы без проблем переваривают 1251...
Они ничего не переваривают, потому что на самом деле (если мы говорим про ext*) для них нет различий вообще что писать в имена файлов, ибо они обрабатываются просто как поток байт. А вот интерпретация этого потока происходит на верхних уровнях и зависит от используемого ПО. Поэтому если мы установим вначале одну локаль и создадим файл, а далее поменяем локаль на другую, то получим уже крякозяблики вместо нормальных имен (собственно что лично я и наблюдаю в upload). Маки используют файловую систему HFS - она крутится на utf16. Тоже самое и в NTFS у Windows, разве что у них не чистый utf16, а немного урезанная разновидность UCS-2. Никакого бзика яблочников тут нет, это проблема nix* и windows софта, который до сих пор никак не научится работать с unicode (поддержку которого кстати microsoft обеспечила самыми первыми в мире).