Небольшой мануальчик по вёрстке для CAT
Thread poster: mikhailo
mikhailo
mikhailo
Local time: 01:21
English to Russian
+ ...
May 8, 2018

Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, чит
... See more
Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, читать который современная молодёжь вряд ли станет.

Как всегда замечания и предложения по усовершенствованию are welcome.
http://transfiles.ru/g5453
Collapse


 
A.Petrova
A.Petrova

Local time: 01:21
English to Russian
Повторите, пожалуйста Jun 6, 2018

Не могли бы Вы еще раз выложить файл, пожалуйста!

 
VIP9N
VIP9N
Local time: 01:21
Russian to English
+ ...
Ссылка Jun 6, 2018

A.Petrova wrote:
Не могли бы Вы еще раз выложить файл, пожалуйста!


Надеюсь, Михайло не обидится. Я скачал созданный и предлагаемый им материал по ссылке в Городе переводчиков и полностью прочёл его.
https://mega.nz/#!ithBAA6C!mtOaQBSdLGeaSQ95w9mveFndX2dkFsEbJFNw4k5f6QY
Скажу, что направление и посылы очень верные.

Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.


 
A.Petrova
A.Petrova

Local time: 01:21
English to Russian
Спасибо! Jun 6, 2018

Огромное спасибо, Михайло и VIP9N! Интересный материал.
VIP9N wrote:
Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.

Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


 
VIP9N
VIP9N
Local time: 01:21
Russian to English
+ ...
Бывают, конечно Jun 7, 2018

A.Petrova wrote:
...Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


Только, как показывает моя личная статистика последних лет 15-20 (когда началось действительно массовое использование OCR), этих догадливых, обычно, процентов 10-12 из 100 набирается.

Как правило, диалоги со случайными заказчиками идут вот так:
- Здравствуйте, нам вас рекомендовали такие-то. У нас есть в перевод такие-то документы. Страниц 20-30 по такой-то цене до такого-то числа. Возьмёте?
- Да, здравствуйте. Сроки нормальные. А в каком виде виде у вас исходный оригинал?
- В электронном. Можем прислать на почту.
- Это хорошо, но я спрашиваю в редактируемом или нет. Это Ворд или картинка, картинка в пдф?
- Ну, в пдф. А какая разница? Кидаете в Файнридер и через 10 секунд у вас редактируемый Ворд.
- Не всё так просто. Вам же нужно качественно и достаточно быстро сделать, правильно? В общем, вы отправьте на электронку, я гляну и вам отпишусь.

А дальше всё просто. Если там какая-нибудь мелочь с несложным форматированием (например, устав компании «Рога и копыта» или бухбаланс табличный или договор и т.д.) и цена-сроки устраивает, то соглашаешься, ибо форматирования там немного. Но если, например, это кредитное соглашение, страниц на 150-200, которое юридические секретари «вылизывали» пару дней (со всеми перекрёстными ссылками-сносками), а потом отдали в срочный перевод на сторону в виде пдф (пусть и реального, не графического), то от такого заказа лучше воздержаться. Просто только от трети до половины предлагаемого срока потребуется на то, чтобы воспроизвести такой док в Ворде. Да и не особо интересно мне форматированием заниматься, если честно. У форматирования лишь один существенный плюс. Пока форматируешь, успеваешь изучить весь документ в целом.

Бывает и известные в Москве бюро присылают настолько отвратительно распознанные доки (с кучей паразитных кодов и битыми строками (когда одно предложение оказывается разнесённым на несколько несвязанных строк)), что диву даёшься. Случалось, когда в работу присылали документы на французском без диакритики вовсе (а зачем, у нас ведь «ё» тоже как бы на отшибе живёт, так же, наверное, и у французов, не? Они что, все эти значки реально над буквами пишут? ) и с кучей ошибок распознавания. Объяснения, что эти моменты замедляют работу (вам приходится намного больше раз прочитывать одно и то же, догадываться что там изначально было написано, а сегменты ваших TMX просто не видятся системой) просто не катят. Процентов 10 заказчиков только смутно понимают о чём вообще речь идёт.

Поэтому наставление от Михайло - хороший документ, как ни крути.


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Небольшой мануальчик по вёрстке для CAT


Translation news in Russian Federation





CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »