Проблема с сегментированием в MemoQ Thread poster: Alisher Shamsiev
|
После сегментирования в MemoQ появилась следующая проблема. В сегменте после каждого слова стоит тег форматирования, что вызывает неудобство. Раньше такого не было. Кто-нибудь сталкивался с такой проблемой? | | |
Mikhail Popov Montenegro Local time: 03:02 English to Russian + ...
А как именно тег выглядит? Цифра в фигурных скобках или цветные полоски? Тег в каждом сегменте одинаково выглядит? Что за файл загрузили в МемоКью? Лучше всего скриншот выложить | | |
цифра в фигурных скобках | Apr 8, 2014 |
This(ageunspecified)maleinfant'smotherhadahistoryofidiopathicventricularfibrillationandanimplantablecardioverter-defibrillator(ICD)wasplaced. Попытался скопировать один сегмент. Видно, что после каждого слова стоит тег. | | |
в МемоКу загрузил разпознанку в Ворде. | |
|
|
Перед тем, как загружать файл в МК, почистите его с помощью макросов CodeZapper (http://asap-traduction.com/CodeZapper ). Комплект можно скачать бесплатно, а можно поблагодарить его автора неким взносом. Макросы устанавливаются в Ворд как дополнение. Удачи! Ольга
[Edited at 2014-04-08 12:47 GMT]
[Edited at 2014-04-08 12:48 GMT] | | |
Mikhail Popov Montenegro Local time: 03:02 English to Russian + ... Мусорные теги | Apr 8, 2014 |
Да-да. нужно почистить исходный файл. Можно CodeZapper, а можно как минимум сделать следующее: открыть файл в Ворде, выделить весь текст, присвоить ему английский язык, поставить галочку "не проверять правописание", зайти в настройки шрифта, поставить черный цвет, убрать тени и прочие украшательства, на второй вкладке поставить масштаб 100% и убрать кернинг. Это часто помогает. | | |
Mikhail Popov Montenegro Local time: 03:02 English to Russian + ...
Olga Korobenko wrote: Комплект можно скачать бесплатно, а можно поблагодарить его автора неким взносом. Ольга
[Edited at 2014-04-08 12:47 GMT]
[Edited at 2014-04-08 12:48 GMT] Там кажется уже нет прямой ссылки для скачивания, надо автору писать. То есть она теперь уже практически платная. | | |
Ольга и Михаил, спасибо за советы. Займусь очисткой | |
|
|
Если есть "исходный" файл PDF | Apr 8, 2014 |
И этот файл небольшой, то можно его распознать тем же онлайновым сервисом от FineReader. В этом случае, обычно, мусорных тегов не будет. И тарифы вполне вменяемые: http://www.abbyyonline.com/ru/Store/Showcase Можно и другими средствами распознавать текст, но там уже "как повезет". | | |
Code Zapper - самое оптимальное решщение | Apr 9, 2014 |
Я уж было решил отказаться от проекта ввиду сложности подготовительных манипуляций. Но спасибо Дэвиду - он оперативно прислал свою программу, которую я загрузил как надстройка к Ворду. Исходный файл в 50 страниц он зачистил минут за 20. Теперь нет никаких проблем с сегментированием. Спасибо всем,и особенно Ольге. | | |
TransTools Utilities - тоже оптимально | Apr 9, 2014 |
Код Заппер в ряде случаев, к сожалению, проявил себя некорректно, порушил форматирование сложного документа. Как говорили летчики-испытатели про самолет Як-15, на таком летать - что тигрицу целовать: и страшно, и никакого удовольствия. ТнасТулз обращается с исходными файлами более корректно. | | |
Отлично работает. В Деже оно встроено, при импорте всегда устанавливаю этот флажок. Пару раз специально пробовал файлы с и без Code Zapper, количество тегов различается примерно в 10 раз. | | |