Вот вы мне ответьте - неужели использование cp1251 является ГРУБОЙ ошибкой? Какой для меня смысл в использовании дополнительных наборов символов и языков от UTF-8 при увеличении веса символа в 4 раза? Какая ПС разница? - это мое мнение, если в чем не прав - исправьте...
Конечно из-за кодировки у вас проблем с индексацией не будет, НО
1. Есть информация что поисковики охотней кушают utf-8
2. Стрaхи:
Один символ кириллицы в cp1251 занимает 1 байт, а в utf-8 — 2 байта. Как ни странно данный факт сильно отталкивает, и отталкивал меня долгое время от начало использования данной кодировки. Как показала практика в среднем UTF страница на русском языке больше, чем стандартная cp1251 всего на 20-30 процентов. Если текст на английском, то страница одинакового размера. Чаще всего — основной вес страницы составляет html-код, javascript, flash, картинки, css и так далее. Тем, кто заботится о «весе», следовало бы в первую очередь выкинуть из кода подстановки для тех символов, которым они не нужны, например, «—» для длинного тире или для неразрывного пробела (ой, как часто я вижу это в страницах новичков). Видим, что вместо 1 знака длинного тире мы пишем 6, вместо 1 знака неразрывного пробела мы пишем 5 знаков. И где же экономия? Действительно, иногда доходит до маразма — некто упирается: «Не буду делать страницы в UTF-8, потому что они от этого увеличиваются» — а сам при этом ваяет код с жуткими атрибутами и подстановками, который без них мог бы быть в пять раз короче. Также у 90 процентов web программистов html страницы просто не оптимизированы, даже пробелы не убраны из кода. А пробел это тоже байтик!
3. Для большинство функция php, ajax юникод является стандартом.
4. Консорциум w3c настаивает на использовании юникод
http://www.w3.org/International/questions/qa-utf8-upgrade.en.php
4. oracle планирует отказаться от поддержки cp1251
5. часто будете сталкиваться с таким вот push2check.com/www.eltisbook.ru