вторник, 9 сентября 2008 г.

Как заставить Spaw закачивать файлы с русскими именами и не иметь проблем с кодировками?


С некоторых пор я использую в своих разработках очень хороший и функциональный WYSIWYG-редактор Spaw. Он требует минимум времени на настройку, но при этом поволяет множество замечательных функций. Пожалуй, самая ценная из которых - это возможность быстрой закачки изображений (и любых других файлов) на сайт для последующей вставки в редактируемый текст. И что особенно приятно, этот редактор прекрасно русифицирован.
Однако есть небольшой подводный камень, на который обязательно найдет коса разработчиков, которые используют этот редактор для русскоязычных сайтов, да еще и с кодировкой UTF-8. Конечно, кодировка прекрасно выставляется в настройках Spaw, и проблем с отображением, редактированием русских символов нет. Однако при закачке файла, названного русскими символами, Spaw проверяет лишь его расширение на соответствие разрешенным типам файлов, но само имя файла так и остается состоящим из русских символов. И очень вероятно, что нормально его скачать потом не удастся, хотя добавить в текст - пожалуйста.
В такой ситуации полезно просто транслитерировать имя закачиваемого файла, чтобы избежать проблем. Как это сделать? Легко:
открываем файл spaw/plugins/spawfm/class/spawfm.class.php
и добавляем в класс SpawFm следующую функцию:
function transliterateFilename($input, $mode=1)
{
$trans=array(
   ' ' => '_',
   'А' => 'A', 
   'Б' => 'B',
   'В' => 'V',
   'Г' => 'G',
   'Д' => 'D',
   'Е' => 'E',
   'Ё' => 'YO',
   'Ж' => 'ZH',
   'З' => 'Z',
   'И' => 'I',
   'Й' => 'J',
   'К' => 'K',
   'Л' => 'L',
   'М' => 'M',
   'Н' => 'N',
   'О' => 'O',
   'П' => 'P',
   'Р' => 'R',
   'С' => 'S',
   'Т' => 'T',
   'У' => 'U',
   'Ф' => 'F',
   'Х' => 'H',
   'Ц' => 'TS',
   'Ч' => 'CH',
   'Ш' => 'SH',
   'Щ' => 'SCH',
   'Ъ' => '',
   'Ы' => 'Y',
   'Ь' => '',
   'Э' => 'E',
   'Ю' => 'YU',
   'Я' => 'YA',
   'а' => 'a',
   'б' => 'b',
   'в' => 'v',
   'г' => 'g',
   'д' => 'd',
   'е' => 'e',
   'ё' => 'yo',
   'ж' => 'zh',
   'з' => 'z',
   'и' => 'i',
   'й' => 'j',
   'к' => 'k',
   'л' => 'l',
   'м' => 'm',
   'н' => 'n',
   'о' => 'o',
   'п' => 'p',
   'р' => 'r',
   'с' => 's',
   'т' => 't',
   'у' => 'u',
   'ф' => 'f',
   'х' => 'h',
   'ц' => 'ts',
   'ч' => 'ch',
   'ш' => 'sh',
   'щ' => 'sch',
   'ъ' => '',
   'ы' => 'y',
   'ь' => '',
   'э' => 'e',
   'ю' => 'yu',
   'я' => 'ya',
   '№' => 'No.',
   //ukranian symbols added
   'Ї' => 'I',
   'І' => 'I',
   'Є' => 'E',
   'ї' => 'i',
   'і' => 'i',
   'є' => 'e',
   );
$input=strtr($input, $trans);
if($mode==1) //lowercase mode
{
   return utf8_strtolower($input, 'utf-8');
}
return $input;
}
после чего находим строку
$uplfile_name = $uplfile['name'];
и заменяем ее на эти строки
$uplfile_name = $this->transliterateFilename($uplfile['name'],0);
$transliterated_name = $uplfile_name;
Нуль, передаваемый последним параметром, означает, что конверсия в нижний регистр не требуется. Если передать не ноль - имя файла будет преобразовано в нижний регистр. $translierated_name сохраняем для того, чтобы использовать для автоматического переименования файла, если такой файл уже существует на сервере.
Чтобы автопереименование использовало транслитерированный вариант, необходимо найти строку
$uplfile_name = ereg_replace('(.*)(\.[a-zA-Z]+)$', '\1_'.$i.'\2', $uplfile['name']);
и заменить ее на
$uplfile_name = ereg_replace('(.*)(\.[a-zA-Z]+)$', '\1_'.$i.'\2', $transliterated_name);
Естественно, в массив $trans можно передавать любые правила конверсии, которые вам будут угодны. Как нетрудно заметить в приведенном коде, лично я добавил, кроме транслитерации, перевод пробелов в символы подчеркивания, а также символы украинского алфавита, которых нет в русском. Так что украинские девелоперы также могут использовать этот код ;)