╒═══════════════════════════════════════╕ │ TextToSC, │ │ преобразователь форматов текстовых │ │ файлов (несколько языков). │ │ Также поддеpживаются формат, │ │ используемый редактором миссий │ │ StarCraft для русских текстов │ │ (рус. SC, перев. студии Stream) │ │ и транслитерация. │ │ Стили перевода строк <LF>, <CRLF> │ │ │ │ FreeWare (подробнее см. внизу) │ └───────────────────────────────────────┘ Версия 0.8.3 от 30 ноября 2014 года ПОДДЕРЖИВАЕМЫЕ ЯЗЫКИ / КОДИРОВКИ: вост.-европейские (Win-1251, 866, 855, ISO-8859-5, ISO-IR-111, KOI8-R, Mac-Cyr, Mac-U, KOI8-U, KOI7); турецкий (Win-1254, 857, Mac-Turk, ISO-8859-9); зап.-европейские (Win-1252, 850, ISO-8859-1, ISO-8859-15, Mac-Roman). ЯЗЫКИ ИНТЕРФЕЙСА: английский, русский. Системные требования ──────────────────── ОС: Win9x/ME, WinNT/2000/XP или выше. процессор 80386 или выше. Интерфейс ───────── Синтаксис вызова программы: texttosc [_ключи_] [_файл1_ _файл2_] _ключи_ один или несколько ключей (СМ. НИЖЕ) _файл1_ короткое имя исходного файла; _файл2_ короткое имя файла, куда записать результат. Bозвращает коды завершения: 0 -файл преобразован; 1 -файл не преобразован. ПРИМЕРЫ: texttosc -koi8 -towin letter.eml "my letter.txt" texttosc -1254 -tomacturk page.txt archive.txt texttosc -iso8859_9 -to857 -src unix.c dos.c texttosc -noenc -lf mywin.pl mybsd.pl texttosc -1251 -tokoi8r -html myhome.htm myserver.htm ВНИМАНИЕ: файловые маски (*.txt и т. п.) НЕ допускаются Список ключей командной строки (по категориям) ────────────────────────────────────────────── ═════Исходные кодировки (по ЯЗЫКАМ)═════ =ВОСТ.-ЕВРОПЕЙСКИЕ (КИРИЛЛИЦА)= -dos или -866 исходный файл в кодировке DOS 866; -w или -win Windows (1251); -koi8 или -koi8r KOI8; -855 DOS 855; -koi7 KOI7; -mac Mac-Cyr; -iso или -iso8859_5 ISO 8859-5; -iso_ir_111 или -isoir111 ISO-IR-111; -koi8u KOI8-U; -macu или -mac_u Mac-U; -sc из редактора миссий StarCraft; -u то же, что -koi8 (для совместимости с предыдущими версиями программы); =ТУРЕЦКИЙ= -857 кодировка DOS-857; -1254 Windows-1254; -iso8859_9 ISO-8859-9; -macturk Mac-Turk; =ЗАП.-ЕВРОПЕЙСКИЕ= -850 кодировка DOS-850; -1252 Windows-1252; -iso8859_1 ISO-8859-1; -iso8859_15 ISO-8859-15; -macroman Mac-Roman; по умолчанию принимается, что исходный файл в кодировке ДОС-866. ═════Выходные кодировки (по ЯЗЫКАМ)═════ =ВОСТ.-ЕВРОПЕЙСКИЕ (КИРИЛЛИЦА)= -todos или -to866 преобразовывать в формат 866 (DOS); -towin или -tow Windows 1251; -tokoi8 или -tokoi8r KOI8R; -to855 DOS 855; -tokoi7 KOI7; -tomac Mac-Cyr; -toiso или -toiso8859_5 ISO 8859-5; -toiso_ir_111 или -toisoir111 ISO-IR-111; -tokoi8u KOI8-U; -tomacu или -tomac_u Mac-U; -tosc в редактор миссий StarCraft; -translit или -totl в латиницу (транслитерация текста); -tou то же, что -tokoi8 (для совместимости c предыдущими версиями программы); =ТУРЕЦКИЙ= -to857 в кодировку DOS-857; -to1254 Windows-1254; -toiso8859_9 ISO-8859-9; -tomacturk Mac-Turk; =ЗАП.-ЕВРОПЕЙСКИЕ= -to850 в кодировку DOS-850; -to1252 Windows-1252; -toiso8859_1 ISO-8859-1; -toiso8859_15 ISO-8859-15; -tomacroman Mac-Roman; по умолчанию перекодирует в рус. StarCraft. ════Стили перевода строки════ -lf <LF>, принятый в UNIX; -crlf <CR> <LF>, принятый в Windows; -noaltlf сохранить символы <CR> и/или <LF> так, как они присутствуют в исходном файле; отключает автоматический выбор стиля перевода строки; по умолчанию перевода строки устанавливается исходя из требуемой выходной кодировки. ════Режимы преобразования════ -src режим преобразования исходных текстов программ; предохраняет от преобразования некоторых символов в символы двойных или одинарных кавычек (которые в языках программи- рования используются для обозначения строк/символов); этот ключ также следует использовать если Вы преобразуете некий текст, который будет вставлен в программу; -html режим HTML-совместимости; предохраняет от появления лишних угловых скобок, появления лишних или исчезновения нужных кавычек; также для символов, отсутствующих в выходной кодировке, старается найти подходящее HTML-обозначение (например, для значка параграфа- §); ИСПОЛЬЗУЙТЕ при обработке HTML-файлов, JavaScript и VBScript, PHP, серверных CGI скриптов; -dhcs запретить замену символов HTML-обозначениями; не позволяет заменять символы, отсутствующие в кодировке, на их HTML-обозначения; может быть использован с ключом -html (см. выше); -noenc не преобразовывать кодировку; этот ключ используйте ТОЛЬКО если вам нужно просто преобразовать стиль перевода строки (например, для CGI-программы - см. ключи -lf и -crlf) и не требуется изменять кодировку; -nta отключить анализатор текста; анализатор текста - это примочка, которая заменяет символы входного текста ориентируясь не только по их коду, но и, скажем, по предшествующим символам; пока он только при переко- дировании пытается заменять простые кавычки более красивыми открывающимися и закрывающимися, определяя сам где какие ставить; а с этим ключом все возможности анали- затора отключаются; препочителен для простого текста; исходные тексты программ лучше обрабатывать с ключом -src, а HTML-файлы и скрипты- с ключом -html (см. выше) -32 не использовать служебные символы (с кодами < 32); ключ запрещает замену некоторых символов кодировки Windows (таких как значок параграфа) аналогичными ДОС-овскими из числа служебных символов; аналогично и при обратном преобразовании; действует лишь с кодировкой DOS-866; во всех других случаях программа и сама оставляет символы с кодами <32 без изменений (кроме 13 и 10 - см. ключи -crlf, -lf и -noaltlf); -nstr не переводить символы в строки; ключ не позволяет заменять некоторые символы (которых нет в вых. кодироке) близкими по начертанию сочетаниями других символов; это может потребоваться если Вы не хотите чтобы выходной файл был больше входного; ЕСЛИ ВЫ ПРЕОБРАЗУЕТЕ ТЕКСТЫ НА ЮЖНОСЛАВЯНСКИХ ЯЗЫКАХ, то НЕ ИСПОЛЬЗУЙТЕ ЭТОТ КЛЮЧ, т. к. он может привести к потере некоторых символов (например, НЬ); при транслитерации этот ключ не работает; -nqt не преобразовывать твердый и мягкий знаки в апострофы; применяется только при транслитерации; эти символы будут транслитерироваться в буквы q соответствующего регистра; -pdt сохранять дату/время оригинального файла; устанавливает дату/время выходного файла такими же, как у входного файла (или сохраняет неизменённой дату файла, если один и тот же файл указан как входной и выходной); ═════Опции интерфейса══════ -en сообщения программы по-английски; -rus сообщения программы по-русски; -ni не выводить сведения о версии; -? или /? помощь; ________Что нового в версии 0.8.3_______ 30.11.2014 (11/30/2014) 1. Скорректированы экраны помощи и файлы справки. Теперь нет смысла использовать короткие имена файлов, все длинные поддерживаются начиная с версии 0.8.2. ________Что нового в версии 0.8.2_______ 23.11.2014 (11/23/2014) 1. Переделано readme. 2. Программа перекомпилирована для Windows. DOS больше не поддерживается. ________Что нового в версии 0.8.1_______ 18.02.2003 1. Добавлен ключ -pdt для сохранения даты/ времени оригинального файла. ________Что нового в версии 0.8_________ 06.12.2002 1. Убраны БАГИ: у версий 0.7- в кодировке КОИ8 перепутаны буквы "Ш" и "Щ", а в ко- дировке Mac-Cyrillic неверно обрабатыва- лись буквы "ё" и "я". 2. Автоматическая установка символов конца строки если не указаны ни ключ -lf, ни ключ -crlf. Устанавливает переводы по <CRLF> для OEM и Win кодировок и <LF> для остальных. Возможность отключается ключом -noaltlf (тогда будут сохраняться все символы CR=13 и LF=10 исходного тек- ста- как делали предыдущие версии TextToSc). При транслитерации указывать ключ -noaltlf не нужно, т.к. кодировка и стиль перевода строки в этом случае не преобразуются. 3. Появился HTML-совместимый режим для пре- образования веб-документов. Соответ- ственно новые ключи: -html и -dhcs ________Что нового в версии 0.7_________ 07.11.2002 1. Теперь возможно задавать способ перевода строк в выходном файле: <LF> или <CRLF> независимо от того, какой был во входном. Ключи -lf и -crlf добавлены для этих це- лей. По умолчанию (если не задан ни один из них) программа оставляет все <CR> и <LF> без изменений, как делали предыдущие версии. 2. Добавлен ключ -noenc для тех, кто только преобразует LF/CRLF стиль, а не кодировку. Полезно авторам CGI скриптов. 3. Убран идиотский глюк версии 0.6, из-за ко- торого многие символы преобразовывались неправильно (в версии 0.5 глюка не было). 4. Добавлена поддержка западно-европейских кодировок. 5. Исправлена ошибка версий 0.6-: преобразо- вание из формата Starcraft rus в любую кодировку неверно обрабатывало малую и большую буквы "ж". ________Что нового в версии 0.6_________ 31.07.2002 1. Добавлена поддержка ISO-IR-111, KOI8-U, Mac-U, КОИ7. Программа развивается в сторону поддержки МНОЖЕСТВА разных языков, поэтому ключ -nec теперь устарел. 2. "Новые" ключи -iso8859_5 -toiso8859_5 для ISO. Старые -u -tou для КОИ8 оставлены для совместимости с v 0.5-. 3. Новая функция - транслитерация (из кириллицы в латиницу). 4. Теперь программа старается правильно преобразовать все символы, наличествующие в выходной кодировке. Например, псевдографику в KOI8, 855 и 866; дополнительные символы в Mac и ISO и так далее. 5. Теперь интерфейс по умолчанию английский. 6. Добавлена поддержка кодировок турецкого языка. ________Что нового в версии 0.5_________ 29.07.2001 1. Теперь мы наконец преобразуем в любой из форматов, которые читаем. 2. Поддержка страницы 855 (старая ДОС), MAC, ISO добавлены. 3. Многоязычный интерфейс (пока русский и английский). 4. Анализатор текста и более аккуратная работа с записью в 1251. 5. Символы псевдографики из 866 в дру- гих кодировках заменяются близкими по виду (пока + - и |). ________Что нового в версии 0.4_________ 14.07.2001 1. Поддержка не только русских, но и дру- гих кирилллических символов (пока при преобразовании из кодировки Windows). 2. Поддержка преобразования множества дополнительных символов из кодировки Windows. 3. При преобразовании теперь символы могут заменяться группами (строками) если в требуемой кодировке нет нужного символа, поэтому файл на выходе может оказаться больше, чем на входе (можно отключить такую замену). 4. Новые режимы и ключи командной строки. Теперь по команде -? выдаётся только краткая справка, а остальное в файле README.TXT (его читаете сейчас). ________Что нового в версии 0.3_________ 1. Теперь кодирует не только в StarCraft, но и в ДОС (для тех, кто StarCraft не любит). 2. Теперь понимает и кодировку КОИ8. 3. Теперь можно в качестве источника и приёмника задавать один и тот же файл, поэтому вместо использования файла wintosc.bat можно просто всё указать в командной строке (например, вместо коман- ды wintosc.bat sample.txt можно выполнить texttosc.com -w sample.txt sample.txt). Для тех же, кто не доверяет программе или желает сохранять резервные файлы я оста- вил файл wintosc.bat (как архаизм) и сде- лал файлы wintodos.bat и koitodos.bat. ______Версии 0.1 и 0.2____________ Программа родилась когда я писал миссии для StarCraft на русском языке и захотел автоматизировать перекодировку текстов для них. Ну, и оказалось, что русская версия игры для кириллицы использует ка- кой-то извращённый клон кодировки 866. __!!!___Баги___!!!__ ╔═══════════════════════════╦═══════════════════════╦══════════════════════╗ ║ Что за баг (описание) ║ Кто обнаружил и когда ║ Принятые меры ║ ╠═══════════════════════════╬═══════════════════════╬══════════════════════╣ ║ В версиях 0.7- русские ║ Автор, ║ Исправил в версии 0.8║ ║буквы "Ш" и "Щ" в КОИ8 были║ 6 декабря 2002 ║ ║ ║перепутаны, а буквы "ё" и ║ ║ ║ ║"я" неверно обрабатывались ║ ║ ║ ║в кодировке Mac-Cyr ║ ║ ║ ╟───────────────────────────╫───────────────────────╫──────────────────────╢ ║ В версиях 0.6- преобразо- ║ Автор, 6 ноября 2002 ║ Исправил в версии 0.7║ ║вание из формата Starcraft ║ ║ ║ ║в любую кодировку неверно ║ ║ ║ ║обрабатывало малую и боль- ║ ║ ║ ║шую буквы "ж". ║ ║ ║ ╟───────────────────────────╫───────────────────────╫──────────────────────╢ ║ В версии 0.6 многие из ║ Александр Бахута, ║ Исправлено в версии ║ ║символов кириллицы преобра-║ 8 октября 2002 ║ 0.7 ║ ║зовывались неправильно, что║ ║ ║ ║вообще сделало использова- ║ ║ ║ ║ние этой версии почти не- ║ ║ ║ ║возможным ║ ║ ║ ╟───────────────────────────╫───────────────────────╫──────────────────────╢ ║ В версиях 0.5 и ранее не- ║ Автор 31 июля 2002 ║ Исправлено в версии ║ ║которые из расширенных ║ ║ 0.6 ║ ║(не русских) символов ки- ║ ║ ║ ║риллицы неверно преобразо- ║ ║ ║ ║вывались в кодировки, от- ║ ║ ║ ║личные от DOS-866 ║ ║ ║ ╟───────────────────────────╫───────────────────────╫──────────────────────╢ ║ В версиях 0.3 и 0.4 из ко-║ Я (т. е. автор), ║ Исправлено в версии ║ ║дировки КОИ8 не преобразо- ║ 20 июля 2001 года ║ 0.5 ║ ║вывается строчная буква ё ║ ║ ║ ╟───────────────────────────╫───────────────────────╫──────────────────────╣ ║ Не знаю считать ли это ба-║ Автор при перекоди- ║ Сделана версия 0.4, в║ ║гом, но до версии 0.4 про- ║ ровке пары текстов, ║которой проблема для ║ ║грамма никак не обрабатыва-║ в которых эти самые ║1251 устранена. ║ ║ла кучу символов кодировки ║ символы были в изо- ║ ║ ║1251 (разные виды кавычек и║ билии (где-то июнь ║ ║ ║проч.), что создавало такую║ или июль 2001 года) ║ В версии 0.6 устране-║ ║же кучу проблем. Аналогич- ║ ║на окончательно ║ ║но с КОИ8 и прочими коди- ║ ║ ║ ║ровками. ║ ║ ║ ╚═══════════════════════════╩═══════════════════════╩══════════════════════╝ БАГИ ПЕРЕЧИСЛЕНЫ ТОЛЬКО ДЛЯ ВЕРСИЙ, КОТОРЫЕ ПУБЛИЧНО РАСПРОСТРАНЯЛИСЬ ────────────────────────────────────────────────────────────────────────── ОБНОВЛЁННЫЙ СПИСОК сообщений о багах программы можно найти на http://super-m.savesoul.ru/support/ или просто с моего сайта (см. ниже). Также он будет прилагаться к каждой новой версии программы. ────────────────────────────────────────────────────────────────────────── Если к Вам попала какая-то версия программы и Вы нашли в ней бага, то просьба прислать его описание (конечно, никто не просит Вас ставить какие-то эксперименты). ╓───────────────────────────────────────────────────────┐ ║ Сообщения о глюках (они же баги) / недоработках │ ║ принимаются автором с благодарностью. │ ╙────┬─────────────────────────────────────────┬────────┘ │ Отзывы - также вещь хорошая и нужная. │ ╓─┴─────────────────────────────────────────┴───╖ ┌───┐ ║ А новые, свежие и интересные идеи автор ║ │ ! │ ║ встречает с радостью! И готов их потихоньку ║ └───┘ ║ реализовывать. ║ ╚═══════════════════════════════════════════════╝ ╔╗ ======= ЭТА ПРОГРАММА - ПОЛНЫЙ FREEWARE ======= ║║ Вы можете свободно распространять ее и использовать ║║ в некоммерческих целях. ╠╣ Коммерческое использование ТАКЖЕ свободное и не тре- ║║ бует оплаты. ╚╝ Автор Михаил Шмелев, super-m@ya.ru Web-сайт: http://super-m.savesoul.ru/ Исходный текст (доступ также свободный): http://super-m.savesoul.ru/source/texttosc.zip