Как сделать TM из двух файлов с "мусором"?
Thread poster: Igor Savenkov
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
May 31, 2015

Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, к�
... See more
Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, которого не должно быть в ТМ. Причем весь "мусор" имеет аналогичную структуру "чего-то_там =".
Я понимаю, что алгоритм для удаления простой: "С начала каждой строчки удалить весь текст до знака = и один пробел после него". Только как и где его реализовать, чтобы сделать это удаление автоматически?
Collapse


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
Автозаменой May 31, 2015

Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
... See more
Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
???????? = (при включенном Use Wildcards, Подстановочные знаки).

[Edited at 2015-05-31 11:40 GMT]

[Edited at 2015-05-31 11:41 GMT]

[Edited at 2015-05-31 12:11 GMT]
Collapse


 
mk_lab
mk_lab  Identity Verified
Ukraine
Local time: 02:02
Member (2004)
English to Russian
+ ...
В Word'е May 31, 2015

Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Ч
... See more
Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Чтобы получилась и первая строка, нужно добавить перед ней еще одну произвольную строку.

Если в исходном тексте стоит знак переноса строки, а не разрыва строки (как тут это получилось, возможно случайно), то используем его

[Edited at 2015-05-31 11:26 GMT]
Collapse


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Михаил! May 31, 2015

Признаюсь, что не знал, что в Word можно использовать подстановочные знаки (стыд и позор).
Сейчас попробовал по-вашему - не получилось: видимо, у меня не "разрыв строки", а "перенос строки", а символа "перенос строки" я не вижу среди символов "Специальный".
Будем думать дальше.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
Проблема в том, что May 31, 2015

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, мне такой фокус не удавался в моих вордах.

[Edited at 2015-05-31 15:37 GMT]


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
TOPIC STARTER
Официальное подтверждение May 31, 2015

Alexander Matsyuk wrote:

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, у меня такой фокус не удавался в моих вордах.


Да, действительно, в справке Office так и написано:
^p (не действует в поле Найти, если установлен флажок Подстановочные знаки) или ^13

(https://support.office.com/ru-ru/article/Замена-текста-с-использованием-подстановочных-знаков-5cda8b1b-2feb-45a6-af0e-824173d3d6e4?ui=ru-RU&rs=ru-RU&ad=RU)

 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
Количество ^? нужно сначала задать разумно максимально May 31, 2015

а потом уменьшать.
Я сначала неправильно написал. Исправил.
По идее, не может их быть больше, скажем, двадцати.
Если и останутся какие-то супердлинные, их можно в конце удалить вручную.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
"^l" в принципе работает May 31, 2015

но не "отбивает" нужный конец строки.

 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
TOPIC STARTER
Да, должно сработать May 31, 2015

Alexander Matsyuk wrote:

Количество ^? нужно сначала задать разумно максимально, а потом уменьшать.


но хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
Мне тоже ) May 31, 2015

Igor Savenkov wrote:
хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Хотя я обычно удовлетворяюсь малоизящным.

Поизящнее так:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Александр! May 31, 2015

Alexander Matsyuk wrote:

Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Работает


 
mk_lab
mk_lab  Identity Verified
Ukraine
Local time: 02:02
Member (2004)
English to Russian
+ ...
А. ну да, действительно, May 31, 2015

^p при включенных подстановочных знаках не работает.

Alexander Matsyuk wrote:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).

Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:02
English to Russian
+ ...
Да, так хитрее May 31, 2015

mk_lab wrote:
Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


но внутренне еще беспокойнее


 
boostrer
boostrer  Identity Verified
United States
Local time: 20:02
Member (2007)
English to Russian
+ ...
Поздно увидел тему, Sep 27, 2015

но для следующих поколений:

нужно было сделать простой макрос: поиск " = " > стрелка вправо > выделение от места курсора до начала строки > удалить > вернуться в начало макроса.

Дальше можно его либо просто запустить и со временем, когда все уже будет удалено, выключить, или добавить в конец макроса выход по достижении конца текста.


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:02
Member (2007)
English to Russian
TOPIC STARTER
Невероятно! Sep 27, 2015

Как раз сейчас мне опять потребовалось провести подобную чистку - и тут пришло последнее сообщение! Спасибо, boostrer, помогло - и так проще всего (заодно и освоил макросы в Word ).

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как сделать TM из двух файлов с "мусором"?


Translation news in Russian Federation





CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »