Небольшой мануальчик по вёрстке для CAT
Thread poster: mikhailo
mikhailo
mikhailo
Local time: 14:39
English to Russian
+ ...
May 8, 2018

Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, чит
... See more
Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, читать который современная молодёжь вряд ли станет.

Как всегда замечания и предложения по усовершенствованию are welcome.
http://transfiles.ru/g5453
Collapse


 
A.Petrova
A.Petrova

Local time: 14:39
English to Russian
Повторите, пожалуйста Jun 6, 2018

Не могли бы Вы еще раз выложить файл, пожалуйста!

 
VIP9N
VIP9N
Local time: 14:39
Russian to English
+ ...
Ссылка Jun 6, 2018

A.Petrova wrote:
Не могли бы Вы еще раз выложить файл, пожалуйста!


Надеюсь, Михайло не обидится. Я скачал созданный и предлагаемый им материал по ссылке в Городе переводчиков и полностью прочёл его.
https://mega.nz/#!ithBAA6C!mtOaQBSdLGeaSQ95w9mveFndX2dkFsEbJFNw4k5f6QY
Скажу, что направление и посылы очень верные.

Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.


 
A.Petrova
A.Petrova

Local time: 14:39
English to Russian
Спасибо! Jun 6, 2018

Огромное спасибо, Михайло и VIP9N! Интересный материал.
VIP9N wrote:
Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.

Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


 
VIP9N
VIP9N
Local time: 14:39
Russian to English
+ ...
Бывают, конечно Jun 7, 2018

A.Petrova wrote:
...Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


Только, как показывает моя личная статистика последних лет 15-20 (когда началось действительно массовое использование OCR), этих догадливых, обычно, процентов 10-12 из 100 набирается.

Как правило, диалоги со случайными заказчиками идут вот так:
- Здравствуйте, нам вас рекомендовали такие-то. У нас есть в перевод такие-то документы. Страниц 20-30 по такой-то цене до такого-то числа. Возьмёте?
- Да, здравствуйте. Сроки нормальные. А в каком виде виде у вас исходный оригинал?
- В электронном. Можем прислать на почту.
- Это хорошо, но я спрашиваю в редактируемом или нет. Это Ворд или картинка, картинка в пдф?
- Ну, в пдф. А какая разница? Кидаете в Файнридер и через 10 секунд у вас редактируемый Ворд.
- Не всё так просто. Вам же нужно качественно и достаточно быстро сделать, правильно? В общем, вы отправьте на электронку, я гляну и вам отпишусь.

А дальше всё просто. Если там какая-нибудь мелочь с несложным форматированием (например, устав компании «Рога и копыта» или бухбаланс табличный или договор и т.д.) и цена-сроки устраивает, то соглашаешься, ибо форматирования там немного. Но если, например, это кредитное соглашение, страниц на 150-200, которое юридические секретари «вылизывали» пару дней (со всеми перекрёстными ссылками-сносками), а потом отдали в срочный перевод на сторону в виде пдф (пусть и реального, не графического), то от такого заказа лучше воздержаться. Просто только от трети до половины предлагаемого срока потребуется на то, чтобы воспроизвести такой док в Ворде. Да и не особо интересно мне форматированием заниматься, если честно. У форматирования лишь один существенный плюс. Пока форматируешь, успеваешь изучить весь документ в целом.

Бывает и известные в Москве бюро присылают настолько отвратительно распознанные доки (с кучей паразитных кодов и битыми строками (когда одно предложение оказывается разнесённым на несколько несвязанных строк)), что диву даёшься. Случалось, когда в работу присылали документы на французском без диакритики вовсе (а зачем, у нас ведь «ё» тоже как бы на отшибе живёт, так же, наверное, и у французов, не? Они что, все эти значки реально над буквами пишут? ) и с кучей ошибок распознавания. Объяснения, что эти моменты замедляют работу (вам приходится намного больше раз прочитывать одно и то же, догадываться что там изначально было написано, а сегменты ваших TMX просто не видятся системой) просто не катят. Процентов 10 заказчиков только смутно понимают о чём вообще речь идёт.

Поэтому наставление от Михайло - хороший документ, как ни крути.


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Небольшой мануальчик по вёрстке для CAT


Translation news in Russian Federation





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »